计算机视觉

网易云课堂深度有趣

旧时模样 提交于 2020-10-01 05:05:37
适用人群 具备基本的Python编程能力,希望用Python实现一些有意思的人工智能案例和应用 课程概述买了课的童鞋请加我微信,Honlann,进入课程交流群~ 以人工智能为方向,从自然语言理解、计算机视觉、数据分析等角度,介绍大量有趣的Python案例和应用,探索实现原理、完整动手实践,极大提升人工智能相关的理论基础和技术能力。 内容包括图片分类、人脸识别、物体检测等计算机视觉应用,中文分词、词向量、古诗生成等自然语言处理项目,DCGAN、CGAN、ACGAN、CycleGAN等生成式对抗网络,以及图像标题生成、机器翻译、语音识别和分类、图像风格迁移等有趣的人工智能案例。 课程涉及的文档、代码、数据全部开源,课程视频则提供了完整详细的讲解,帮你更快、更好、更轻松、更全面地掌握每一个项目。 建议先学习《Python基础入门》,掌握Python基础编程能力。在学习本课的过程中,可以按需参考《全栈数据工程师养成攻略》的对应章节内容。 献给每一个有趣的灵魂。 http://www.54gcshi.com/forum.php?mod=viewthread&tid=120 来源: oschina 链接: https://my.oschina.net/u/4300877/blog/4534996

把人脑智能化后,能再创造出更强的人工智能吗?

不打扰是莪最后的温柔 提交于 2020-10-01 03:15:23
近日,埃隆·马斯克投资1 亿多美元的脑机接口初创公司Neuralink在现场发布会展示了新一代的脑机接口设备。 脑机接口是什么?可能这个名词在我们日常生活中是不常见的。脑机接口是最前沿的研究领域,建立人(或动物)与外部的设备进行信息传输的通路,实现人类意识的实时传输。还利用机器学习技术奖脑电波信号与其对应的动作反应建立映射关系,让人类意识在机器上得以翻译。 说人话就是: 接入脑机之后,你大脑信号发出的时候就实时发送到电脑上并翻译出来,且可以指导机器完成指令。 这款新产品体积大约指甲大小,拥有 1024 个信道,能读取人脑的大量信息,预计对于包括记忆力丧失、焦虑、脑损伤、抑郁症等疾病将会有比较明显的效果。 马斯克表示, Nerulink脑机产品手术的过程不需要全身麻醉,植入时给人头上钻孔直径只有一英寸,缝起来时也让人毫无感知。对于人脑的损伤会大大降低。只安装一个芯片来替换人类头骨的一小部分,如果做得好,不会有任何血迹。这意味着接入脑机对人脑的损害性更低。 值得一提的是, Neuralink的创立缘于马斯克对人工智能飞速发展的忧虑, 马斯克 担心人工智能无限度的发展会很大程度上抑制人类自己的智能 。但 想要完全限制人工智能的发展是不现实的,因此他给出的解决方案是:开发可植入脑的脑机接口,在人工智能全面超越人类之前,让二者融合为一体,在人的大脑皮层在增加一层 AI 数字层

印刷质量缺陷的视觉检测原理概述

▼魔方 西西 提交于 2020-09-30 16:57:27
点击上方“计算机视觉工坊”,选择“星标” 干货第一时间送达 本文转载自「计算机视觉工坊」,该公众号重点在于介绍深度学习、智能驾驶等领域,一个小众的公众号。 一、应用背景 印刷品作为产品包装的一种主要形式,具有外观精美、清洁卫生、成本低廉、使用方便等优点,在众多行业得到了广泛的应用,其特点是材质多样、工艺复杂、质量要求高。 在本问题域中,印刷品主要涉及三个主要类型:不干胶标签、烟盒包装和塑料薄膜软包装。其中,不干胶标签主要包括:药品标签、电子产品标签、日化品标签、食品标签;烟盒包装包括:软盒包装和硬盒包装;塑料薄膜软包装主要包括:药品包装、食品包装、日化品包装。标签、烟包和软包装典型的产品图像如图1~图3所示。 图 1 药品标签 图 2 烟包 图 3 塑料软包装 印刷品生产过程中可能会产生各种各样的缺陷,如墨点、异物、文字残缺、漏印、色差、套印不准、脏点、刀丝、拖墨、划伤、溢胶、气泡等。这些缺陷一旦出现在产品包装上,产品视觉观感将大打折扣,严重影响产品的品牌、降低客户满意度。 目前,印刷企业主要以频闪灯照明、人工粗略局部抽检进行质量控制。由于人眼的局限性,质量得不到有效控制。随着用户对产品品质要求的不断提高以及行业竞争的加剧,传统的以人工抽检为主的质量检测手段已经严重制约了企业竞争力的提高,用自动化质量检测设备代替人工是必然趋势。 目前,市场中已经出现了多种自动化质量检测系统

伪激光雷达:无人驾驶的立体视觉

有些话、适合烂在心里 提交于 2020-09-30 16:24:48
点击上方“3D视觉工坊”,选择“星标” 干货第一时间送达 激光雷达成本高,用廉价的立体视觉替代它可行吗? 作者:Jeremy Cohen 编译:McGL 转载自:PyVision 深度学习和计算机视觉在自主系统中已经疯狂地流行起来,现在到处都在使用。计算机视觉领域在过去的十年中发展迅速,尤其是障碍物检测。 像 YOLO 或 RetinaNet 这样的障碍物检测算法提供了2D的边界框,边界框给出了障碍物在图像中的位置。今天,大多数的目标检测算法都是基于单目 RGB 摄像头,不能返回每个障碍物的距离。 为了返回每个障碍物的距离,工程师们将摄像头与激光雷达(LiDAR)传感器融合,激光雷达可以返回深度信息。利用传感器融合技术将计算机视觉和激光雷达的输出信息进行融合。 这种方法的问题是激光雷达很贵。工程师们使用的一个有用的技巧是对齐两个摄像头,并使用几何学来确定每个障碍物的距离: 我们称之为伪激光雷达(Pseudo-LiDAR)。 单目视觉 vs 立体视觉 伪激光雷达利用几何构建了一个深度图,并将其与目标检测图结合起来得到3D距离。 如何利用立体视觉实现距离估计? 为了得到距离,下面是5步伪代码: 1. 校准两个摄像头(内部和外部校准) 2. 创建极线模式(epipolar scheme) 3. 建立一个视差图(disparity map),然后一个深度图

数据标注员:人工智能行业的“筑梦师”丨曼孚科技

99封情书 提交于 2020-09-30 15:38:25
数据标注行业里有着这样的一段话:“有多少智能,就有多少人工”。 这句话在某种程度上道出了人工智能的本质。 ​事实上,现阶段提升AI认知世界能力的最有效途径仍然是监督学习,而监督学习下的深度学习算法训练十分依赖于数据标注员进行标注数据。可以说,如果数据标注是人工智能行业的基石,那么数据标注员就是数据标注行业的基石。 2020年2月,数据标注员被正式定义为“人工智能训练师”并纳入国家职业分类目录。 人工智能训练师新职业隶属于软件和信息技术服务人员小类,主要工作任务包括:标注和加工原始数据、分析提炼专业领域特征,训练和评测人工智能产品相关的算法、功能和性能,设计交互流程和应用解决方案,监控分析管理产品应用数据、调整优化参数配置等。 根据国家人力资源和社会保障部相关预测显示,随着人工智能在智能制造、智能交通、智慧城市、智能医疗、智能农业、智能物流、智能金融及其他各行各业的广泛应用,人工智能训练师的规模将迎来爆发式增长。预计到2022年,相关从业人员有望达到500万。 不过,尽管数据标注员规模处于急速扩张中,但是与市场需求相比,缺口依然很大。 据艾瑞咨询相关统计数据显示,当下一个新研发的计算机视觉算法需要上万张到数十万张不等的标注图片训练,新功能的开发需要近万张图片训练,而定期优化算法也有上千张图片的需求,一个用于智慧城市的算法应用,每年都有数十万张图片的稳定需求。 语音方面

基于图神经网络的知识图谱研究进展

天涯浪子 提交于 2020-09-30 00:48:54
  知识图谱本身是一种图结构数据,采用图构建知识和数据之间的关联,应用图神经网络技术,有望结合知识和数据,实现更好的可解释和可信人工智能技术。本文将介绍基于图神经网络的知识图谱学习与计算以及基于图神经网络融合知识图谱信息的应用的研究进展。   1    知识图谱与图神经网络   近几年来,人工智能技术得到了飞速发展,其进展突出体现在以知识图谱(Knowledge Graph)为代表的知识工程和以图神经网络(Graph Neural NetWorks, GNN)为代表的深度学习等相关领域。融合知识图谱与图神经网络已然成为研究人员进一步完善知识图谱学习与提升图神经网络模型推理能力的重要技术思路。   知识图谱是以图的形式表现客观世界中的实体及其之间关系的知识库,实体可以是真实世界中的物体或抽象的概念,关系则表示了实体间的联系。因此,知识图谱能够以结构化的形式表示人类知识,通过知识表示和推理技术,可以给人工智能系统提供可处理的先验知识,让其具有与人类一样的解决复杂任务的能力[1~3]。如何更好地构建、表示、补全、应用知识图谱,已经成为认知和人工智能领域重要的研究方向之一。   图神经网络的概念最早于2005年由戈里(Gori)等人[4]提出,是一种专门用于处理图结构数据的神经网络模型。使用图可以更准确和灵活地对现实应用中的数据建模,如在电子商务领域中的用户–产品交互图、化学领域的分子图

爱了!计算机视觉 colab notebook 列表

强颜欢笑 提交于 2020-09-29 20:33:39
这是阿三的第 131 期分享 作者 | 阿三 首发 | 程序员遇见GitHub 大家好,我是阿三,今天给大家带来的是Google colab上非常出名的一些计算机视觉项目的notebook。 一. Google Colab 这些项目都是依托与Google的Python在线编程的免费服务Colab,没有使用过的同学也可以去了解一下这个。 这些notebooks包含计算机视觉的很多方面,像目标检测,分类等等 每个项目都有文字教程与源代码 代码还可以直接在colab中运行,想要了解相关项目的同学不容错过。 网站地址: https://www. qblocks.cloud/creators/ computer-vision-google-colab-notebooks 推荐阅读: 我教你如何读博! 牛逼!轻松高效处理文本数据神器 B站强化学习大结局! 如此神器,得之可得顶会! 兄弟们!神经网络画图,有它不愁啊 太赞了!东北大学朱靖波,肖桐团队开源《机器翻译:统计建模与深度学习方法》 当年毕业答辩!遗憾没有它... 已开源!所有李航老师《统计学习方法》代码实现 这个男人,惊为天人!手推PRML! 它来了!《深度学习》(花书) 数学推导、原理剖析与代码实现 你们心心念念的MIT教授Gilbert Strang线性代数彩板笔记!强烈推荐! GitHub超过9800star!学习Pytorch

使用OpenCV进行模糊检测(拉普拉斯算子)

痴心易碎 提交于 2020-09-29 18:12:23
点击上方“3D视觉工坊”,选择“星标” 干货第一时间送达 来源:Opencv视觉实践 本文翻译自光头哥哥的博客:【Blur detection with OpenCV】。 本文仅作学习分享,原文链接: https://www.pyimagesearch.com/2015/09/07/blur-detection-with-opencv/ 这只超可爱、超活跃家养小猎犬可能是有史以来拍照次数最多的狗。从8周大我们得到它的时候,到现在,不到3年的时间,我们已经收集了6000多张狗狗的照片。 在刚刚过去的这个周末,我坐下来,试图整理手机里大量的照片。这是一项艰巨的任务,而且我很快就注意到一个问题——有很多照片模糊程度过高。 现在,对于一般人来说,我认为他们会删除这些模糊的照片(或者至少将它们移到一个单独的文件夹中)——但作为一个计算机视觉科学家,这是不可能发生的。 相反,我编写了一个快速的Python脚本,用OpenCV执行模糊检测。 接下来,我将向你展示如何使用OpenCV、Python和Laplacian算子计算图像中的模糊量。在这篇文章的结尾,你将能够应用Laplacian方法到你自己的照片来检测模糊的程度。 拉普拉斯变换的方差 图1:用Laplacian算子卷积输入图像 在研究如何检测图像中的模糊程度时,我的第一步是阅读优秀的综述论文,即【形状-聚焦测量算子分析[2013

Pytorch

十年热恋 提交于 2020-09-29 07:48:03
Pytorch - torchvision 简介 model datasets transforms 代码实现 简介 torchvision是Pytorch的计算机视觉工具库,是Pytorch专门用于处理图像的库。 model torchvision.models中包含了许多已经训练好的模型,可以通过models直接调用。 模型 AlexNet VGG ResNet SqueezeNet DenseNet … datasets torchvision.datasets中,包含了许多已经被处理过的图片数据集,可以通过datasets直接调用。 数据集 MNIST:手写数字数据集 COCO:用于图像标注和目标检测 LSUN Classification ImageFolder Imagenet-12 CIFAR10 and CIFAR100 STL10 … transforms transforms模块提供了一般的图像预处理方法, 例如 数据中心化 数据标准化 缩放 裁剪 旋转 翻转 填充 噪声添加 灰度变换 线性变换 仿射变换 亮度 饱满度及对比度变换 … 这些方法可以用于对图像的数据增强,又称为数据增广,数据扩增,是对训练集进行变换,使训练集更加丰富,从而使模型具有泛化能力。 具体方法与函数: 裁剪 作用 CenterCrop 从图像中心裁剪图像 RandomCrop

网易数帆基础软件平台获2020南京软博会年度创新产品奖

倾然丶 夕夏残阳落幕 提交于 2020-09-29 06:01:29
2020第十六届中国(南京)国际软件产品和信息服务交易博览会(以下简称南京软博会)顺利拉开帷幕,以“数字经济 智创未来”为主题,重点展示工业互联网、云计算、5G、人工智能等数字经济新产业新业态。 与往届不同,今年首次设立了信息技术应用创新展区,国产基础软件创新成为会场热词; 网易数帆基础软件平台 等10款产品也广获关注,获评年度创新产品奖。 网易数帆基础软件平台等10款产品获年度创新产品奖 在本届软博会颁奖环节,网易数帆基础软件平台等10款产品获评年度创新产品奖。 网易数帆 是网易公司旗下数字化转型基础软件提供商,有 云原生软件生产力平台网易轻舟 、 全链路数据生产力平台网易易数 、 多媒体智能平台网易易智 、 全维度质量效能平台网易易测 四个业务方向。 网易轻舟 基于一站式云原生服务,提升企业软件研发、运营的能力和效率,打造企业数字化基础设施。网易易数为企业提供全链路数据产品和服务,帮助企业级用户快速在业务场景中应用大数据,助力业务发展和产业升级。网易易智则聚焦智能语音语言和计算机视觉等领域,在语音识别、自然语言理解、文字识别、视频分析等有丰富AI成果。网易易测为企业提供测试管理,UI自动化测试、接口自动化测试、性能压测等整体解决方案,助力企业建立健全质量效能体系。 除了在网易云音乐、网易严选、网易新闻等大量业务落地实践外,网易数帆已服务名创优品、工商银行、海亮集团