计算机视觉

符号主义对深度学习的意义浅谈

南楼画角 提交于 2020-08-12 11:52:36
符号主义人工智能经历过古典时期的专家系统阶段, 中期的知识图谱阶段, 和近期深度学习和符号主义的再次联姻。 那么一个很重要的问题是符号主义为什么会复兴,它对当下的机器学习又有何意义? 参考阅读: Reconciling deep learning with symbolic artificial intelligence: representing objects and relations ​ www.sciencedirect.com 首先, 当下的深度学习有三个最主要的问题,很低的数据使用效率, 泛化能力, 可解释性,都可以从符号主义得到极大帮助。 这一点也不难理解, 所谓符号,多数指我们语言中那些经常被使用的抽象概念,这些概念再不同的任务和环境中被广泛使用组成新的概念,比如红色,圆形等,如果能够在不同任务中学习到这些最基本的元素, 那么无疑将极大的改善数据使用效率和泛化能力。同时, 从视频,声音等信息中提取出的这种符号,几乎一定是和我们的自然语言有所对应,和我们的认知概念有所对应,因此,提取这些符号将极大助力模型的可解释性。从这两个角度看, 符号的确可以解决深度学习的几个根本问题。 更加重要的是,符号的使用和我们的推理认知能力极为相关,这也是为什么在第一代的人工智能时代人们如此重视符号, 因为它是逻辑思维的载体,有了符号我们可以在符号基础上罗列各种运算,进行关系预测和推理等

22课时、19大主题,CS 231n进阶版课程视频上线

故事扮演 提交于 2020-08-12 10:21:48
  机器之心报道    编辑:小舟、杜伟    讲 CS231n 的 Justin Johnson 在密歇根大学推出了一套计算机视觉的进阶课程。   计算机视觉在日常生活中已经无处不在。从搜索引擎、图像理解、地图、医疗、无人机、自动驾驶到各类手机 app,都离不开计算机视觉。这些应用中有许多像图像分类和目标检测这样的视觉识别任务,而神经网络方面的进展大大提高了视觉识别系统的性能。    来自密歇根大学的 Justin Johnson 在 2019 年秋季推出了一套新的课程,该课程深入探讨了基于神经网络的计算机视觉深度学习方法的细节。这一课程近日已在 YouTube 上开放 。      课程视频链接:https://www.youtube.com/playlist?list=PL5-TkQAfAZFbzxjBHtzdVCWE0Zbhomg7r    课程概况   这套 2019 年秋季的计算机视觉课程名为「Deep Learning for Computer Vision」,课程讲授者是来自密歇根大学的 Justin Johnson。作为斯坦福大学李飞飞教授的学生,Justin Johnson 曾和李飞飞一起讲授斯坦福大学计算机视觉经典课程 CS231n。      Justin Johnson,图源:https://web.eecs.umich.edu/~justincj/。  

刷新五项SOTA,百度ActBERT:基于动作和局部物体视频文本特征模型

允我心安 提交于 2020-08-12 06:20:49
  机器之心发布    机器之心编辑部       全球计算机视觉顶会 CVPR 2020 上,百度共计有 22 篇论文被接收。这篇 Oral 论文中,百度提出了 ActBERT,该模型可以学习叙述性视频进行无监督视频文本关系,并提出纠缠编码器对局部区域、全局动作与语言文字进行编码。最终在 5 项相关测评任务上取得了 SOTA 结果。   ActBERT 在下游视频和语言任务上,即文本视频片段检索、视频描述生成、视频问答、动作步骤定位等任务上明显优于其他技术,展示了其在视频文本表示方面的学习能力。      论文:《ActBERT: Learning Global-Local Video-Text Representations》   论文链接: http://openaccess.thecvf.com/content_CVPR_2020/papers/Zhu_ActBERT_Learning_Global-Local_Video-Text_Representations_CVPR_2020_paper.pdf   现有利用 BERT 训练方式进行视频语言建模一般通过量化视频帧特征的方式,通过聚类离散化将视觉特征转化为视觉单词。但是,详细的局部信息,例如,互动对象,在聚类过程中可能会丢失,防止模型进一步发现细粒度的视频和文字对应关系。本文提出 ActBERT

刚出炉!程序员人才补贴:单项目最高补贴1000万元

痴心易碎 提交于 2020-08-12 05:38:13
最近,程序员届有一个重大好消息,可能很多人还不知道,那就是: 国内某些城市已经开始程序员人才补贴了! 对于人工智能公司的项目开发、人才引进、科技研发,最高按照国拨经费的30%给予配套支持, 单个项目最高补贴1000万元 。 这个消息的爆出,其实大家并不意外。不得不承认,我国在AI方面的人才供给确实进入困境。 近日,国家正式发布了一份《2020年人工智能产业人才发展报告》。其中给程序员3个 疯狂暗示 : 1)2020年人工智能产业目标是“必须超过1500亿元”, 但预计目前我国AI人才缺口达30万!现在是做AI的好时机。 2)人工智能行业人才供需比只有0.4,极度缺人。而其中 计算机视觉岗最稀缺, 100个岗位抢1个人才! 真正面临人才供给窘境。如果学AI,就学计算机视觉。 3)提前支出未来第一个月10%的月薪,现在就开始学习,其实很值。 计算机视觉 行业真相:竞争压力小,需求量极大 利用 计算机视觉技术,我们可以进行: 车辆检测:停车场、物业、交通管理 人脸识别:门禁防盗考勤、电子护照身份证、自动提款机、信息安全登录 医疗:检测红细胞等医疗辅助手段,提高医疗效率 军事应用:实例分割、类别判断等 所以无论你所处的领域是智能媒体、医疗、政务与金融或其他,都能看到计算机视觉的身影。 (从招聘网站上看,当前市场上比较热门的AI岗位JD中,任职要求绝大多数都是 「计算机视觉方向」 )

机器学习工程师将在十年后消失?

你离开我真会死。 提交于 2020-08-12 04:50:00
云栖号资讯:【 点击查看更多行业资讯 】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 近年来,机器学习工程师屡次荣登全球 IT 高薪榜单。但这局面会一直保持下去吗?作者 Luke Posey 给我们带来了一个不一样的观点,他认为,机器学习工程师将在十年后消失!这听起来有点耸人听闻,为什么他会做出这样的判断?读完这篇文章,或许你就找到答案了。 机器学习工程师将被取代 机器学习将会转变为每个软件工程师工具箱中的一部分,成为软件工程师常用的工具。 在每个领域中,我们在早期的阶段都会有专门的角色,随着时间的推移,这些专门的角色将会逐渐被普通的角色所取代。机器学习工程师似乎又是一个这样的例子。 机器学习工程师作为一个角色,是由人工智能和数据科学等热门词汇在企业中被大肆炒作的结果。在机器学习的早期阶段,机器学习工程师是一个非常必要的角色。而且对很多人来说,它带来了不错的收入增长!但是,机器学习工程师也有许多不同的性格,这要取决于你问的是谁。 我们当中的纯粹主义者说,机器学习工程师就是将模型带出实验室并投入到生产的人。他们负责扩展机器学习系统,将参考实现转化为可用于生产的软件,并经常交叉地进入数据工程领域。他们通常都是强大的程序员,对他们使用的模型也有一定的基础知识。 但这听起来很像是一个普通的软件工程师。 如果你去向一些顶尖的科技公司

CVPR2020 | HAttMatting,让抠图变得如此简单!

落爺英雄遲暮 提交于 2020-08-12 03:40:38
     本文解读的是 CVPR 2020 论文《 Attention-Guided Hierarchical Structure Aggregation for Image Matting 》, 作者来自大连理工大学、大连大学、郑州大学,其中第一作者有两位,分别是博士生乔羽和硕士生刘宇豪。    作 者 | 刘宇豪    编辑 | 丛 末      论文地址:http://openaccess.thecvf.com/content_CVPR_2020/papers/Qiao_Attention-Guided_Hierarchical_Structure_Aggregation_for_Image_Matting_CVPR_2020_paper.pdf   项目地址:   https://xinyangdut.github.io/matting/Matting.html   https://wukaoliu.github.io/HAttMatting/      怎样实现既高质量又无需用户交互的图像抠图一直是学术界和工业界在努力追求的目标,近日,随着CVPR2020论文的正式公开,有这样一篇文章,在自动抠图领域又向前走了一步。下面,我们就来走进这篇文章。   图像抠图本身是一个病态的问题,公式如下所示:   给定一张RGB的彩色图 I,要求得一张表示像素不透明度的Alpha

GluonCV 0.6: Embrace Video Understanding

女生的网名这么多〃 提交于 2020-08-12 00:06:41
GluonCV 0.6: Embrace Video Understanding Author: Yi Zhu , Applied Scientist at Amazon 视频理解一直是一个趋势性的研究课题,因为分析动态视频可以帮助我们开发更好的计算机视觉算法,从而产生更强的人工智能。然而,视频研究存在着数据量大、实验周期长、缺乏可重复的编码库、缺乏教程、边缘设备部署困难等诸多障碍。 在这个新版本中,GluonCV解决了上述限制。GluonCV现在完全支持最先进的视频分类算法和主要数据集。在发布的同时,我们还提供了新的快速视频阅读器、分布式培训支持、广泛的教程和可复制的基准测试。使用 GluonCV 可以轻松地学习、开发和部署视频理解模型,而不必太担心工程细节。 More Pre-Trained Models and Datasets 最近,FAIR刚刚开放了他们的PySlowFast代码库用于视频理解。与PySlowFast相比,GluonCV提供了对更多模型和数据集的支持。例如,这个版本涵盖了最先进的算法:s TSN , C3D , I3D , P3D , R2+1D , Non-local and SlowFast , 并支持4个最广泛的数据集: UCF101 , HMDB51 , Kinetics400 和 Something-Something-V2 .

刚出炉!程序员人才补贴:单项目最高补贴1000万元

牧云@^-^@ 提交于 2020-08-11 23:40:07
最近,程序员届有一个重大好消息,可能很多人还不知道,那就是: 国内某些城市已经开始程序员人才补贴了! 对于人工智能公司的项目开发、人才引进、科技研发,最高按照国拨经费的30%给予配套支持, 单个项目最高补贴1000万元 。 这个消息的爆出,其实大家并不意外。不得不承认,我国在AI方面的人才供给确实进入困境。 近日,国家正式发布了一份《2020年人工智能产业人才发展报告》。其中给程序员3个 疯狂暗示 : 1)2020年人工智能产业目标是“必须超过1500亿元”, 但预计目前我国AI人才缺口达30万!现在是做AI的好时机。 2)人工智能行业人才供需比只有0.4,极度缺人。而其中 计算机视觉岗最稀缺, 100个岗位抢1个人才! 真正面临人才供给窘境。如果学AI,就学计算机视觉。 3)提前支出未来第一个月10%的月薪,现在就开始学习,其实很值。 计算机视觉 行业真相:竞争压力小,需求量极大 利用 计算机视觉技术,我们可以进行: 车辆检测:停车场、物业、交通管理 人脸识别:门禁防盗考勤、电子护照身份证、自动提款机、信息安全登录 医疗:检测红细胞等医疗辅助手段,提高医疗效率 军事应用:实例分割、类别判断等 所以无论你所处的领域是智能媒体、医疗、政务与金融或其他,都能看到计算机视觉的身影。 (从招聘网站上看,当前市场上比较热门的AI岗位JD中,任职要求绝大多数都是 「计算机视觉方向」 )

28篇论文、6 大主题带你一览 CVPR 2020 研究趋势

為{幸葍}努か 提交于 2020-08-11 22:50:14
     编译 | 陈大鑫   编辑 | 丛 末   首度于线上召开的CVPR 2020 会议已经落下帷幕。今年,大会共有1467篇论文被接收,共举办了29个Tutorial、64个Workshop,线上与会者人数达 7600人。大量的论文,加上今年新采用虚拟会议的形式,曾一度让会议浏览器不堪重负(浏览速度非常慢)。   为了让大家更好地掌握今年会议的总体研究趋势,一位深度学习专业的博士生Yassine Ouali 专门撰写了一篇博客,总结了一些引起他关注的论文,以呈现今年会议的大致面貌。    我们先来看下 CVPR 2020 官方的相关统计数据:   CVPR 往年的增长趋势仍然继续:作者人数增加了20%,提交论文的数量增加了29%,同时为了适应这种扩张,审稿人和领域主席都有增加      今年会议的注册人数共有6424人,相比2019年增加了一千多人。在被接收的1467篇论文中,有335篇 Oral 论文。         与去年相似,就接受论文而言,中国是CVPR的第一贡献者,其中来自清华大学的作者数量最多,其次是美国(按国家)和Google(按组织)。      不出所料,被接收的论文主题多数集中在与学习、识别、检测和理解有关的主题上。但是,人们对诸如高效标签方法(例如,迁移学习),图像合成和机器人感知等相对较新的领域越来越感兴趣

收藏起来慢慢看,OpenCV基础教程,原理、实战、报错解决助你快速入门计算机视觉

让人想犯罪 __ 提交于 2020-08-11 21:39:40
目录 一、前言 二、学习之路 三、基本教程 四、应用教程 五、报错及解决 一、前言 OpenCV算是比较热门的计算机视觉库,很多想从事计算机视觉工作的人基本都是通过OpenCV入门或者了解过OpenCV,如果你也想入门OpenCV,那就可以从3.x中选择一个版本,开始你的学习之路。这一系列博客使用了OpenCV3.1.0,如果你想使用更新的版本,比如4.3.0,你可以关注我的OpenCV系列博客,我会定期更新。 【OpenCV系列】: https://blog.csdn.net/shuiyixin/category_7581855.html 那这两个版本有什么区别吗?主要有如下几个方面吧:( 重点是3 ) 1.基于的版本不同,OpenCV3.1.0和4.3.0版本不一样,这个是最直接的差距了,这个差距引出的就是OpenCV3和OpenCV4的差别,里面很多写法都更换了,但是这并不影响我们的学习。 2.OpenCV3.4.0开始就支持深度学习了,到了4.3.0已经支持大量深度学习算法,内容丰富了很多,3.1.0更偏向传统的图像处理计算机视觉。 3.OpenCV3.1.0只是基础教程,用于大家入门学习,只选择了重要的,常见的部分进行讲解。对于很多用到的枚举类型,没有涉及。通过3.1.0我们可以快速入门OpenCV,掌握大多数OpenCV技术。OpenCV4.3.0是更加详细全面的教程