计算机视觉

综述|视觉与惯导,视觉与深度学习SLAM

℡╲_俬逩灬. 提交于 2020-10-12 01:46:06
点击上方“3D视觉工坊”,选择“星标” 干货第一时间送达 SLAM包含了两个主要的任务:定位与构图,在移动机器人或者自动驾驶中,这是一个十分重要的问题:机器人要精确的移动,就必须要有一个环境的地图,那么要构建环境的地图就需要知道机器人的位置。 本系列文章主要分成四个部分: 在第一部分中,将介绍Lidar SLAM,包括Lidar传感器,开源Lidar SLAM系统,Lidar中的深度学习以及挑战和未来。 第二部分重点介绍了Visual SLAM,包括相机传感器,不同稠密SLAM的开源视觉SLAM系统。 第三部分介绍视觉惯性里程法SLAM,视觉SLAM中的深度学习以及未来。 第四部分中,将介绍激光雷达与视觉的融合。 视觉SLAM的稳定性是一项技术挑战。因为基于单目的视觉SLAM需要初始化、尺度的不确定性和尺度漂移等问题[1]。尽管立体相机和RGB-D相机可以解决初始化和缩放的问题,但也存在一些不容忽视的问题,如运动速度快、视角小、计算量大、遮挡、特征丢失、动态场景和光照变换等。针对以上这些问题传感器的融合方案逐渐流行起来,IMU与相机融合的视觉里程计成为研究热点。 视觉与惯导 论文[2][3][4]是比较早期对VIO进行的一些研究。[5][6]给出了视觉惯导里程计的数学证明。而论文[7]则使用捆集约束算法对VIO进行稳健初始化。特别是tango[8]、Dyson 360

水下图像处理算法Sea-thru

怎甘沉沦 提交于 2020-10-11 08:30:26
水下图像处理算法Sea-thru,出自CVPR 2019,被称之为将彻底改变水下计算机视觉的“革命性工具”。 代码开源 https://github.com/jgibson2/sea-thru (非官方) 还没发现预训练模型地址 来源: oschina 链接: https://my.oschina.net/u/4331670/blog/4667724

AMAP-TECH算法大赛开赛!基于车载视频图像的动态路况分析

有些话、适合烂在心里 提交于 2020-10-09 03:05:59
阿里巴巴高德地图AMAP-TECH算法大赛于7月8日开启初赛,赛题为 「基于车载视频图像的动态路况分析」 ,活动邀请了业界权威专家担任评委,优秀选手不仅可以瓜分丰厚的奖金,领取荣誉证书,还有机会进入高德地图【终面通道】!赶紧邀请小伙伴一起来参赛吧。 报名请戳: https://tianchi.aliyun.com/competition/entrance/531809/introduction 下面给大家介绍下大赛详情。 一、背景 高德地图每天会为用户提供海量的定位和路线导航规划服务,其所提供的路况状态信息(即道路交通是拥挤、缓行还是畅通)的准确性会影响到用户在出行过程中的决策和体验。传统的路况状态主要依靠驾车用户的轨迹信息生成。在用户少、驾驶行为异常的道路上,这种方法难以保证路况状态的准确性。 车载视频图像包含了更多的信息量,给了我们另外一个解决问题的视角。通过视频或图片,可以观察到路面的真实状态,包括机动车数量、道路宽度和空旷度等等。基于车载视频图像可以获取更准确的路况状态,为用户出行提供更高质量的服务。 本赛题要求参赛者通过计算机视觉等人工智能算法,基于视频图像中识别到的路面信息来判断道路通行状态,提高道路路况状态判断的准确性,从而提升高德地图用户的出行体验。 二、赛题描述及数据说明 术语说明 路况 :根据道路的平均车速、道路等级,对道路上车辆通行状态的描述,分为 畅通 、

技术宅自制超迷你智能NFC名片:一张平平无奇的门禁卡,如何变身为用不起的样子?

橙三吉。 提交于 2020-10-08 04:26:59
有一说一,头发多的程序员要是熬夜搞起手工来,效率高的可怕。 机器之心报道,参与:蛋酱。 一款火柴盒大小的电子卡片,集公司工牌、小区门禁卡、食堂饭卡于一身,到哪儿都能刷。奇怪,竟然也没人拦。 最近,B 站 UP 主「稚晖君」自制的超迷你智能 NFC 卡片火了。小巧玲珑的卡片,自带电子墨水屏,可以模拟各种 IC 卡,搭配 APP 还能任意设置显示内容…… 这一硬核 DIY 教程在发布的 30 个小时内,视频播放量已经突破百万,光点赞量就超过了十万。 最重要的是,他已经将代码开源了。感兴趣的话,你也可以动手试试(在你能看懂的前提下)。 项目地址: https:// github.com/peng-zhihui/ L-ink_Card 把门禁卡做成一般人用不起的样子 话说,这个 idea 最初是怎么来的呢? 嗯,创意源于生活。比如每个人身上肯定都有很多张 IC 卡,公司的工牌、食堂的饭卡、小区门禁卡等等,这些都是 IC 卡。 当然,卡片太多了也很烦恼。比如经常站在闸机面前,在一堆卡片中翻来翻去才找到需要的那张,这真的不够优雅。所以稚晖君决定,把这些卡片,统统装进一张电子卡片里。 动手之前,首先构思一下需要添加的功能: 1、可以储存多张卡片信息; 2、卡片内容可以擦写; 3、具备 NFC 标签功能; 4、带屏幕; 5、可以通过 APP 设置显示内容; 6、最重要的是,迷你,迷你,迷你。

兼容PyTorch、TF,史上最灵活Python机器学习框架|一周AI最火论文

瘦欲@ 提交于 2020-10-08 02:22:19
      大数据文摘出品    作者:Christopher Dossman    编译:Olivia、Joey、云舟   呜啦啦啦啦啦啦啦大家好,本周的AI Scholar Weekly栏目又和大家见面啦!   AI ScholarWeekly是AI领域的学术专栏,致力于为你带来最新潮、最全面、最深度的AI学术概览,一网打尽每周AI学术的前沿资讯。   每周更新,做AI科研,每周从这一篇开始就够啦!    本周关键词 : 无监督学习、RL、张量网络    本周最佳学术研究    编写与PyTorch,TensorFlow,JAX和NumPy均兼容的代码   深度学习(DL)的进步正日益促进着越来越多DL框架的发展。这类框架提供了用于自动区分和GPU加速的高级且高效的API,并使得使用相对较少而直接的代码来实现异常复杂且功能强大的深度学习模型成为可能。   EagerPy是一个Python框架,可用于编写自动与PyTorch、TensorFlow、JAX和NumPy兼容的代码,而无需牺牲性能。   库开发人员不必选择仅支持这些框架之一而为每个框架重新实现库,或是选择处理代码重复问题。因此这类库的用户可以更轻松地切换框架,而不会被一个第三方库锁定。除了支持多框架之外,EagerPy还对链接到所有框架的方法都提供了详尽的类型注释和一致的支持。   Github传送门:   https

GAN/VAE地位难保? Flow在零样本识别任务上大显身手

ε祈祈猫儿з 提交于 2020-10-06 12:11:40
     作者 | 秦杰、沈钰明   编辑 | 陈大鑫   计算机视觉三大会议之一的ECCV 2020刚刚落下帷幕,本文主要介绍阿联酋起源人工智能研究院(IIAI)的科学家们在该会议上发表的一篇论文:《Invertible Zero-Shot Recognition Flows》。   该工作首次提出了一种基于生成流(Generative Flow)模型的零样本学习方法,并在多个数据库上取得了目前最好的识别结果。      论文链接: https://www.ecva.net/papers/eccv_2020/papers_ECCV/papers/123610596.pdf   1   零样本学习简介   众所周知,在当今计算机视觉领域,深度学习可谓“一统天下”,在诸多视觉任务中都取得了目前最好的(检测、识别、分割等)结果。而数据可谓是深度学习算法的“Buff”,算法的好坏往往取决于是否有充足且多样性的标注好的训练数据。   举例而言,我们要识别下图中的三种动物,那么首先我们需要标注大量老虎、兔子和斑马的图片,然后基于这些有标签的图片训练深度学习模型,最后将未知类别的图片输入训练好的模型中,才能够准确识别出图片中包含的动物类别。   然而,在实际应用场景中,我们往往会遇到以下“尴尬”情况:当我们在训练深度学习模型时,能“看见”的是标注好的大量老虎和兔子的图片

ImageNet一作、李飞飞高徒邓嘉获最佳论文奖,ECCV 2020奖项全公布

南笙酒味 提交于 2020-10-06 09:00:58
昨日,计算机视觉顶会 ECCV 2020 公布了最佳论文等奖项,ImageNet 论文一作邓嘉获最佳论文奖。 机器之心报道,编辑:魔王、小舟、杜伟。 计算机视觉三大国际顶级会议之一的 ECCV 2020 已经召开。受疫情影响,原定于 8 月下旬在英国格拉斯哥举行的 ECCV 2020 会议转为线上举行,为期 4 天。 今年 ECCV 共收到有效投稿 5025 篇,是 ECCV 2018 论文投稿数量的二倍还要多,接收论文 1361 篇,接收率为 27%,相比上届会议下降了约 5%。在接收论文中,oral 论文数为 104 篇,占有效投稿总数的 2%,spotlight 论文数目为 161 篇,占比约 3%。 昨日,大会公布了最佳论文等奖项,最佳论文奖由普林斯顿大学 Zachary Teed 和 Jia Deng 摘得。 最佳论文奖 论文地址: https:// arxiv.org/abs/2003.1203 9 GitHub 地址: https:// github.com/princeton-vl /RAFT 这项研究提出了一种用于光流的新型深度网络架构——循环全对场变换(Recurrent All-Pairs Field Transforms,RAFT)。RAFT 提取每个像素(per-pixel)的特征,为所有像素对构建多尺度 4D 相关体(correlation volume

为什么说卷积神经网络,是深度学习算法应用最成功的领域之一?

旧街凉风 提交于 2020-10-06 00:46:17
目前,作为深度学习的代表算法之一,卷积神经网络(Convolutional Neural Networks,CNN)在计算机视觉、分类等领域上,都取得了当前最好的效果。 后来,基于深度神经网络和搜索树的智能机器人“AlphaGo”在围棋上击败了人类,这是CNN 给人们的一个大大的惊喜。一年后的 Master 则更是完虐了所有人类围棋高手,达到神一般的境界,人类棋手毫无胜机。 可以说,卷积神经网络是深度学习算法应用最成功的领域之一。 目前,CNN应用也十分广泛。例如Facebook用它进行自动的图像标签,google用它做照片检索,amazon用它做产品推荐,Pinterest用它做个性化家庭定制推送,Instagram用它搭建他们的搜索架构。 那么,基于CNN最经典也是最流行的应用应当是图像处理领域。 而研读卷积神经网络的经典论文,对于学习和研究卷积神经网络必不可缺。 今天,给大家推荐一些资料,有 论文、知识图谱。 7份经典学术论文 这些论文大部分都发表在计算机视觉顶级学术会议上。 这7份论文资料,100p以上的内容体量。 建议收藏学习。 01 resnet 02 CNN 03 batchnorm 04 alexnet 05 visualzing 06 resnet 07 yolo4 目前, 2000+ 的看过这个论文资料的同学都顺利成为各公司算法工程师。大家扫码添即可领取

索尼推出全球首款AI图像传感器,1200万像素,支持4K60FPS

自作多情 提交于 2020-10-06 00:30:35
   索尼近日宣布即将推出两款 AI 图像传感器,代号 IMX500 和 IMX501,号称具备智能视觉的 “全球首款 AI 图像传感器”。 其中 IMX500 是无封装版,IMX501 是封装版,没有其他性能差异。   AI 图像传感器兼具运算能力和内存,能够在没有额外硬件辅助的情况下执行机器学习驱动的计算机视觉任务,使得 很多依赖机器学习算法的图像处理技术能够在本地运行,衍生出更简化、高效和安全的解决方案 。   索尼业务与创新副总裁马克·汉森(Mark Hanson)认为, 相比将数据发送到云端的解决方案,IMX500 的应用潜力巨大,成本效益更高,尤其是在未来的边缘计算领域。 它支持 1200 万像素图像,以每秒 60 帧的速度捕获 4K 视频,或者不捕获任何图像,仅提供所见内容的元数据。    官方预计首批搭载该传感器的产品最早将于 2021 第一季度上市 ,目前已有早期商业客户拿到了测试样品,IMX500 售价约 93 美元,IMX501 售价约 186 美元。      图|IMX500(小)和 IMX501(大)(来源:索尼)   不过, 第一代 AI 图像传感器可能不会出现在智能手机或平板电脑等消费者产品中。 索尼的首批目标是零售商和工业客户,比如亚马逊 Go 无人商店,其他应用场景包括访客统计、交通状况和人流量热图绘制等。   以亚马逊无人商店为例

动手学深度学习源码 & CVPR / ECCV 2020开源代码

放肆的年华 提交于 2020-10-05 13:55:21
动手学深度学习其源码分别包括Pytorch、TensorFlow、MxNet框架的代码,十分方便学习深度学习在不同框架下的实现。面向中文读者的能运行、可讨论的深度学习,它将文字、公式、图像、代码和运行结果结合在一起。全面介绍深度学习从模型构造到模型训练,以及它们在计算机视觉和自然语言处理中的应用。 每一小节都是可以运行的 Jupyter 记事本 你可以自由修改代码和超参数来获取及时反馈,从而积累深度学习的实战经验。 公式 + 图示 + 代码 我们不仅结合文字、公式和图示来阐明深度学习里常用的模型和算法,还提供代码来演示如何从零开始实现它们,并使用真实数据来提供一个交互式的学习体验。 活跃社区支持 你可以通过每个章节最后的链接来同社区的数千名小伙伴一起讨论学习。 被用作教材或参考书 北京大学 复旦大学 哈尔滨工业大学 清华大学 上海财经大学 上海交通大学 浙江大学 中国科学技术大学 Carnegie Mellon University(美国) Emory University(美国) Gazi Üniversitesi(土耳其) Georgia Institute of Technology(美国) Habib University(巴基斯坦) Hasso-Plattner-Institut(德国) Hiroshima University(日本) Imperial College