计算机视觉

学术分享丨机器人操作学习系列分享:模仿学习

拟墨画扇 提交于 2020-08-04 09:42:44
  随着学会的队伍不断发展壮大,分支机构的发展愈发完善,丰富多彩的分支活动与学术分享也频频呈现。疫情期间,CAAI认知系统与信息处理专委会积极倡导学会“疫情防控不放松,学习充电不间断”的理念,邀请年轻学者结合本专委会自身领域研究精选相关文献进行研究与再解读,与大家分享《机器人操作学习系列分享:模仿学习》。   人类从婴幼儿时期就学会模仿别人来获得许多新技能,这种行为被称为 模仿学习 。我们古代中国就有很多形容人们模仿学习中成语,有如“ 邯郸学步 ”、“ 画虎成狗 ”、“ 鹦鹉学语 ”等都是形容模仿不到位的情况,又如“ 惟妙惟肖 ”、“ 栩栩如生 ”、“ 有模有样 ”等模仿极佳的状态。因此,智能体如何通过模仿学习避免出现那些尴尬的状态,而达到完美的状态,也是亟待研究的课题。      目前模仿学习也成为许多研究领域的重要课题,包括心理学、神经科学、人工智能和机器人学。模仿学习是机器学习诸多领域的交叉点。它对应于一个复杂的优化问题,可以用不同的方式形式化,例如结构化输出预测问题或半监督学习问题。模仿学习还与强化学习、在线主动学习、多智能体学习、特征建构等有着密切的关系。      从机器学习的角度来看,模仿学习是一种解决控制和顺序决策问题的学习方法。在模仿学习社区内,机器人获得专家的示例数据主要包括运动示教、遥操作、动作捕捉,视觉实例等等。最近,相关研究领域可分为以下子领域:行为克隆

人大副教授:本科生一定要做科研吗?九大灵魂拷问

社会主义新天地 提交于 2020-07-29 10:55:31
     作者:赵鑫中国人民大学副教授 原标题:计算机系本科生开展科研学习的九问九答    学术如苦旅,我亦是行人。   写这篇文章的初衷,是与本科生的接触过程中看到了一些对于科研的困惑或者误区,所以想大概介绍一下本科生的科研之路第一脚该从哪里走起。所以本篇文章的定位不是侧重学术性,也不会侧重于教育性,而是一些个人经验的分享。   由于是个人的经验,希望大家带着批判的角度去读,但是兼听则明,很愿意和各位本科生做进一步的交流。全文写的比较口语,尽量不包含学术名词。   话不多说,下面我开始自问自答。 1. 本科阶段一定要科研吗?   我自己大概是在大三下学期真正开始接触科研。大三上学期之前,如果不是学有余力,不建议太早开展科研,除非已经有了较强的动手能力。本科生教学的核心目标,不是以培养能够发表A类论文的同学为最终目标。我始终也不认为,一位同学如果本科阶段能够发A类论文就意味着绝对的强、绝对的适合做科研。相反,我强烈建议大一大二的同学一定把课程学好。本科的课程体系非常丰富,而研究生逐渐聚焦。要利用好本科的时间打好基础,多看看计算机的大千世界。特别推荐每门计算机课程都尽量阅读一本国外经典教材;特别建议打好数据结构与算法的基础,尝试一些ACM或者相似性质的竞赛;特别推荐加强数学基础的学习,很多理论性的学习所带来的收益要用很长时间才能发现。   如果大一大二已经将基础打好

NLP中的自监督表示学习,全是动图,很过瘾的

江枫思渺然 提交于 2020-07-29 10:09:49
作者:amitness 编译:ronghuaiyang 其实在自监督学习的概念提出之前,NLP中就已经运用到了这一思想。 虽然计算机视觉在自监督学习方面取得了惊人的进展,但在很长一段时间内,自监督学习一直是NLP研究领域的一等公民。语言模型早在90年代就已经存在,甚至在“自我监督学习”这个术语出现之前。2013年的Word2Vec论文推广了这一模式,在许多问题上应用这些自监督的方法,这个领域得到了迅速的发展。 这些自监督的方法的核心是一个叫做 “ pretext task ” 的框架,它允许我们使用数据本身来生成标签,并使用监督的方法来解决非监督的问题。这些也被称为“ auxiliary task ”或“ pre-training task “。通过执行此任务获得的表示可以用作我们的下游监督任务的起点。 在这篇文章中,我将概述研究人员在没有明确的数据标注的情况下从文本语料库中学习表示的各种pretext tasks。本文的重点是任务的制定,而不是实现它们的架构。 自监督的方案 1. 预测中心词 在这个公式中,我们取一定窗口大小的一小块文本,我们的目标是根据周围的单词预测中心单词。 例如,在下面的图中,我们有一个大小为1的窗口,因此我们在中间单词的两边各有一个单词。使用这些相邻的词,我们需要预测中心词。 这个方案已经在著名的Word2Vec论文的“ Continuous Bag of

计算机视觉学习之路(目录)------你想要的都在这里了

╄→尐↘猪︶ㄣ 提交于 2020-07-29 08:58:18
计算机视觉学习之路------你想要的都在这里了 (根据自己的学习进度后期不断更新哟!!!) 一、OpenCV+TensorFlow入门人工智能图像处理基础 1.anaconda一站式环境的搭建(anaconda、tensorflow、opencv) 2.两个问题解答、opencv、tensorflow、numpy、matplotlib的基本使用 3.图像处理之几何变换 二、OpenCV学习 三、TensorFlow学习 四、Numpy学习 五、matplotlib学习 持续更新中。。。。。。 来源: oschina 链接: https://my.oschina.net/u/4329429/blog/4438869

AI救生员上岗!使用水下摄像头跟踪游泳者,杜绝溺水

删除回忆录丶 提交于 2020-07-29 07:45:43
云栖号资讯:【 点击查看更多行业资讯 】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 夏天到了,也到了游泳的季节,为了避免后院以及公共泳池出现溺水事故,房主和泳池运营商考虑使用人工智能技术来提供额外的安全保护。 该检测系统使用水下摄像头和一种称为计算机视觉的AI技术来分析游泳者的实时视频,并在发现有人溺水时发送警报。 来自佛罗里达州微风湾(Gulf Breeze)的33岁的Jenny Naggatz为了保护两个4岁以下的孩子,在她的家庭游泳池中安装了Coral Detection Systems公司的AI设备。该监测系统的三角形设备及相机都悬挂在水面以下几英寸处。 Naggatz说:“不管有没有这个系统,孩子靠近水的时候我都很谨慎,但是有了多一层的保护我会更放心。“ 美国消费者产品安全委员会上周发布的报告显示,游泳池引发的幼儿安全问题令人担忧。该报告称,最新数据显示,从2015年到2017年,平均每年有379名15岁以下的儿童淹死在游泳池,水疗中心或热水浴缸中。2017年这一数据达到峰值,溺亡儿童高达395名。 数据显示大多数儿童溺水发生在夏季,在家中。由于Covid-19应对措施推迟了公共游泳池的开放,更多的人转向了家庭泳池。针对此现象,该委员会提醒大家一定要更加小心谨慎。 AI溺水检测并非要代替成人监督或救生员,而是充当额外的保障。

ECCV 2020 | 腾讯优图8篇论文入选,涵盖目标跟踪、行人重识别、人脸识别等领域

﹥>﹥吖頭↗ 提交于 2020-07-29 07:23:23
近日,计算机视觉方向的三大国际顶级会议之一的ECCV 2020公布论文获奖结果。本次ECCV 2020有效投稿5025篇,最终被接受发表论文 1361 篇,录取率为 27 %,较上届有所下降。其中,oral的论文数为 104 篇,占提交总量的 2% ;spotlight的数目为 161 篇,占提交总量的 5% ;其余论文均为poster。 ECCV (European Conference on Computer Vision,即欧洲计算机视觉国际会议)是国际顶尖的计算机视觉会议之一,每两年举行一次。随着人工智能的发展,计算机视觉的研究深入和应用迅速发展,每次举行都会吸引大量的论文投稿,而今年ECCV的投稿量更是ECCV 2018的两倍还多,创下历史新高。在竞争越来越激烈的情况下,本次ECCV 腾讯优图实验室共入选 8 篇论文,涵盖 目标跟踪、行人重识别、人脸识别、 人体姿态估计 、动作识别、 物体检测 等热门及前沿领域,再次展示了腾讯在计算机视觉领域的科研及创新实力。 以下为部分腾讯优图入选ECCV 2020的论文: 01 链式跟踪器:基于目标对回归的端到端联合检测跟踪算法 Chained-Tracker: Chaining Paired Attentive Regression Results for End-to-End Joint Multiple-Object

MIT下架偏见数据集,Bengio兄弟建议多引少数群体论文:BLM运动持续

久未见 提交于 2020-07-29 06:40:51
  机器之心报道    参与:杜伟、小舟、张倩    继 Yann LeCun 为存在数据偏见的算法辩护被骂退出推特之后,BLM 运动继续在学界蔓延。MIT 宣布永久下架包含种族和性别歧视标签图像的 Tiny Images 数据集,并致歉。此外,谷歌研究科学家 Samy Bengio 针对学界中的「名人效应」提出自己的建议,呼吁「有意识地引用较低关注度学者的论文」,从而引发网友热议。      轰轰烈烈的「Black Lives Matter」运动已经持续了一个多月,虽然已有缓和迹象,但整体运动开始往各领域蔓延,包括学术界。   在活动刚开始的第十几天,全美学界曾掀起过一场停摆 24 小时的运动,arXiv、Nature、Science 全部暂停更新,以重新思考黑人群体在学界的地位。   虽然活动仅进行了一天,但「思考」远未结束。最近,一位非裔女科学家把大家重新拉回了这一话题。   事件的起因是 DeepMind 6 月 29 号官宣的一门生成对抗网络(GAN)课程。课程的内容比较基础,主要介绍 GAN 的原理、优化、改进以及一些变体。   乍看之下,这门课好像没什么问题。但是,一位名叫 Adji Bousso Dieng 的研究者质问道:「既然你们要开 GAN 的课,为什么我在 DeepMind 提出的 PresGAN 没有被包含在内?是因为这篇论文的一作(我)是黑人女性吗?」

祝贺丨CAAI Fellow 芮勇当选加拿大工程院院士

一世执手 提交于 2020-07-29 06:28:16
  今日,加拿大工程院公布了最新当选的院士名单,共 50 名院士和 2 名外籍院士, CAAI Fellow 、CAAI 终身会员、联想集团首席技术官、高级副总裁芮勇 当选加拿大工程院院士。   转自 机器之心      当地时间 6 月 15 日,加拿大工程院(Canadian Academy of Engineering,CAE)发布了 2020 年新增院士名单。    本次新增的院士名单包括 50 名院士和 2 名外籍院士 。受到疫情影响,这一次的选举通过视频会议的方式举行,本年度的颁奖典礼也推迟到了 2021 年的 6 月,与 2021 年度当选院士的颁奖仪式同期举行。   加拿大工程院成立于 1987 年,是一个独立、自治的非盈利组织。加拿大工程院院士是加拿大联邦政府授予在工程领域代表加拿大国家水平专家、教授的荣誉称号,并作为国家智囊团为国家层面课题立项、评审和研究提供权威意见。每年新增的院士均由同行提名和选举。   加拿大工程院候任院长 Beauchamp 博士表示:「在过去的 33 年里,加拿大工程院的院士们在教育、基础设施、创新等领域提供了工程方面的领头作用。我们希望最新当选的院士们,将为加拿大及其人民的繁荣、福祉和持续发展做出更多贡献。新增的院士有着工业界、学术界、政界等不同的背景,但他们都有着共同的愿望和能力,并且在各自的领域中处于榜样地位。」   

计算机视觉学习之路(目录)------你想要的都在这里了

▼魔方 西西 提交于 2020-07-29 04:02:57
计算机视觉学习之路------你想要的都在这里了 (根据自己的学习进度后期不断更新哟!!!) 一、OpenCV+TensorFlow入门人工智能图像处理基础 1.anaconda一站式环境的搭建(anaconda、tensorflow、opencv) 2.两个问题解答、opencv、tensorflow、numpy、matplotlib的基本使用 3.图像处理之几何变换 二、OpenCV学习 三、TensorFlow学习 四、Numpy学习 五、matplotlib学习 持续更新中。。。。。。 来源: oschina 链接: https://my.oschina.net/u/4402060/blog/4438896

将激光技术与视频智能融合,「久译科技」为市场提供差异化AI解决方案

烂漫一生 提交于 2020-07-28 18:25:49
云栖号资讯:【 点击查看更多行业资讯 】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 在计算机视觉领域,我国已经有多家企业崭露头角、获得了明显的竞争优势。在人工智能行业的独角兽群体中,以商汤,旷世为代表的企业,都以计算机视觉业务为主。 36氪最近接触到的「久译科技」,是一家专业从事人工智能(AI)解决方案及深度学习算法的公司。久译科技成立于2018年,以激光扫描与视频智能融合技术为核心,结合人脸识别、视频结构化分析、人群密度监测、以人搜人、智能激光监测、轨迹分析等多项原创技术,为交通、旅游、以及政府相关行业,提供客流与人脸综合监测系统、人车安防系统、激光周界系统、无感场景交互系统等产品服务。 2019年,公司曾为国庆70周年大阅兵仪式提供天安门广场的人脸综合分析系统。客户包括顺义政府、故宫,北京地铁等。在疫情期间,久译科技花费不到一个月的时间研发了高精度、低价格的红外测温产品。 具体来说,公司提供了一整套软硬件结合的解决方案。硬件方面,久译科技已推出“叮咚”和“刺猬”两个边缘计算的硬件核心产品。“叮咚”系列是高度集成的智能摄像机产品,其中,叮咚计数采用“深度相机+深度学习”的方案为公共交通客流计数,叮咚周界用“激光扫描仪+摄像机”做安防监测;“刺猬”系列则是一款边缘计算智能盒子,可以直接连接传统数字相机将其转变为带有边缘计算功能的智能相机。