计算机视觉

一分钟详解点云配准ICP方法

人走茶凉 提交于 2020-04-26 14:09:26
点击上方“ 3D视觉工坊 ”,选择“星标” 干货第一时间送达 作者:丁洪凯 链接:https://zhuanlan.zhihu.com/p/107218828 本文转载自知乎,作者已授权,未经许可请勿二次转载。 1. ICP 算法简介 ICP 的经典论文: https://ieeexplore.ieee.org/document/121791 发表在 IEEE Transactions on Pattern Analysis and Machine Intelligence ,此刊在工程技术大类属于1区,算是神刊了。 【大类】工程技术(1区); 【小类】COMPUTER SCIENCE, ARTIFICIAL INTELLIGENCE(1区);ENGINEERING, ELECTRICAL & ELECTRONIC(1区); 【2016-2018年平均IF】11.838; 【2017-2018年总被引】102333 进入正题...... ICP 算法的第一步就是找到 Source 点云与 Target 点云中的对应点(corresponding point sets),然后针对对应点,通过最小二乘法构建目标函数,进行迭代优化。 1.1 估计对应点(Correspondences estimation) ICP 称为 Iterative Closest Point,顾名思义

经典相位法三维轮廓测量模型

℡╲_俬逩灬. 提交于 2020-04-26 14:09:08
点击上方“ 3D视觉工坊 ”,选择“星标” 干货第一时间送达 在结构光三维测量中,之前笔者介绍了关于把投影看做相机的逆的模型,这次笔者要介绍一个经典相位三维轮廓测量模型,有很多相位三维轮廓测量模型都是在经典相位测量模型上的改进。 如下图所示,在经典三维轮廓测量模型中,需要精准的设置相机,投影与参考平面的位置关系。具体设置如下: 1.投影平面需要与参考平面平行,且投影坐标系的X轴和Y轴要分别于参考平面的X轴和Y轴平行 2.相机坐标系Y轴要与参考平面的Y轴平行 3.像机光心与投影中心连线要平行于参考平面,像机光轴与投影仪光轴交于参考平面顶点(图中O点) 根据上述设置,物体的实际高度可以通过相似三角形求得。所求得的高度是物体相对参考平面的高度。推导如下: 如上图所示可知,有如下相似关系, 则由相似三角形原理,可以得到, 由于 (投影中心到参考平面距离)则由等比关系式可得: 至此,就可以得到物体相对于参考平面的高度PP‘的表达式,想要真正求得物体的实际高度,我们不仅需要提前测量投影中心到参考平面的长度l和投影中心与相机中心的距离d,还需要对参考平面进行标定。 在对参考平面进行标定时,要做两件事。一是测量一个相位周期(2 π )的光栅投影到参考平面上后的光栅的长度 ,又称光栅节距。有了光栅节距值后,如果上图所示的B点绝对相位为 (绝对相位=相位主值+相位周期数*2 π )

1.2.3.《万门大学-人工智能、大数据、复杂系统》课程大纲

拟墨画扇 提交于 2020-04-25 01:47:13
前言   感觉是时候系统性的学一下人工智能啦! 粗略大纲:   1.贝叶斯与随机过程     1.贝叶斯分析     2.随机过程理论   2.机器学习     1.监督学习(重点)       1.扫描各种算法         1.数学推导         2.程序清单           1.安装           2.介绍     2.无监督学习     3.强化学习   3.深度学习(重点)     1.公式     2.实践(python)       1.CNN(卷积网络)——对抗学习       2.RNN(循环网络、递归网络)     3.应用       1.图像       2.语言   4.复杂系统     1.统计力学     2.非线性动力学     3.与机器学习关联 课程目录 第 1 讲复杂系统 第 2 讲大数据与机器学习 第 3 讲人工智能的三个阶段 第 4 讲高等数学—元素和极限 第 5 讲复杂网络经济学应用 第 6 讲机器学习与监督算法 第 7 讲阿尔法狗与强化学习算法 第 8 讲高等数学—两个重要的极限定理 第 9 讲高等数学—导数 第 10 讲贝叶斯理论 第 11 讲高等数学—泰勒展开 第 13 讲高等数学—积分 第 14 讲高等数学—正态分布 第 15 讲朴素贝叶斯和最大似然估计 第 16 讲线性代数—线性空间和线性变换 第 17

腾讯优图再次刷新三大ReID公开数据集纪录,首位命中率最高近99%

假如想象 提交于 2020-04-24 16:04:42
近日,腾讯优图实验室在行人重识别(R eID) 技术上再次取得突破, 通过引入跨场景ReID, 其 ReID模型性能刷新了三大 权威主流 ReID公开数据集CUHK03,DUKE-MTMC和Market1501的记录 ,算 法关键指标首位命中率(RANK 1 Accuracy) 和 平均精度均值(Mean Average Precision) 获得业内最好成绩。 表1: ReID公开数据集性能比较 Market1501 DukeMTMC CUHK03 RANK1 MAP RANK1 MAP RANK1 MAP Tencent YouTu 98.99 % 97.16 % 95.15 % 91.10 % 95.79 % 95.00 % YITU 98.60 % 96.60 % 94.75 % 90.02 % 95.00 % 94.23 % HaiGe 97.54 % 94.77 % 9 4.37% 89.77% 94.40% 91.20% ZTE 97.32 % 94.66 % 92.46 % 87.65 % 89.79 % 87.99 % Dahua Tech 96.76 % 91.98 % 91.52 % 83.9 6% 87.73 % 85.72 % Pensees 96.73 % 89.89 % 92.01 % 82.51 % 84.57 % 82.81 % WINSENSE

MIT、DeepMind发布CLEVRER数据集,推动视频理解的因果逻辑推理

淺唱寂寞╮ 提交于 2020-04-24 13:34:55
  机器之心发布    机器之心编辑部       大多数视频推理数据集的侧重点是从复杂的视觉和语言输入中进行模式识别,而不是基于因果结构。在这篇 ICLR 2020 论文中,麻省理工、DeepMind 的研究者提出了一种针对时间和因果推理问题的数据集,包含 20,000 个关于碰撞物体的合成视频以及 300,000 多个问题和答案,从互补的角度研究了视频中的时间和因果推理问题。      论文链接:https://arxiv.org/abs/1910.01442   项目链接:http://clevrer.csail.mit.edu/   从视频的物理事件中识别物体并推断其运动轨迹的能力是人类认知发展的核心。人类,即使是幼儿,也能够通过运动将图片区域划分为多个物体,并使用物体的永久性、实体性和连贯性的概念来解释发生了什么,推断将发生什么以及想象在反事实情况下会发生什么。   在静态图像和视频上提出的各种数据集的推动下,复杂视觉推理问题已经在人工智能和计算机视觉领域得到了广泛研究。然而,大多数视频推理数据集的侧重点是从复杂的视觉和语言输入中进行模式识别,而不是基于因果结构。尽管这些数据集涵盖了视觉的复杂性和多样性,但推理过程背后的基本逻辑、时间和因果结构却很少被探索。   在这篇论文中,麻省理工和 DeepMind 的研究者从互补的角度研究了视频中的时间和因果推理问题

小波去噪基本概念

一曲冷凌霜 提交于 2020-04-24 13:29:30
一、前言 在现实生活和工作中,噪声无处不在,在许多领域中,如天文、医学图像和计算机视觉方面收集到的数据常常是含有噪声的。噪声可能来自获取数据的过程,也可能来自环境影响。由于种种原因,总会存在噪声,噪声的存在往往会掩盖信号本身所要表现的信息,所以在实际的信号处理中,常常需要对信号进行预处理,而预处理最主要的一个步骤就是降噪。 小波分析是近年来发展起来的一种新的信号处理工具,这种方法源于傅立叶分析,小波(wavelet),即小区域的波,仅仅在非常有限的一段区间有非零值,而不是像正弦波和余弦波那样无始无终。小波可以沿时间轴前后平移,也可按比例伸展和压缩以获取低频和高频小波,构造好的小波函数可以用于滤波或压缩信号,从而可以提取出已含噪声信号中的有用信号。 二、小波去噪的原理 Donoho提出的小波阀值去噪的基本思想是将信号通过小波变换(采用Mallat算法)后,信号产生的小波系数含有信号的重要信息,将信号经小波分解后小波系数较大,噪声的小波系数较小,并且噪声的小波系数要小于信号的小波系数,通过选取一个合适的阀值,大于阀值的小波系数被认为是有信号产生的,应予以保留,小于阀值的则认为是噪声产生的,置为零从而达到去噪的目的。 从信号学的角度看 ,小波去噪是一个信号滤波的问题。尽管在很大程度上小波去噪可以看成是低通滤波 ,但由于在去噪后 ,还能成功地保留信号特征

苹果收购热门天气App:用AI精准预测天气,还能制作风暴动画

自古美人都是妖i 提交于 2020-04-24 12:44:46
近期,CNN等多家媒体报道了苹果公司对天气应用Dark Sky的收购,称苹果计划在7月前把该款App从安卓平台下架。这是苹果首次收购第三方天气应用。 粗略统计,仅与iOS13系统兼容的天气App就有100多个,苹果自家也有天气应用。在这种前提下,Dark Sky凭借什么优势得到科技巨头苹果的青睐?被纳入到iOS闭环生态之中? 传统天气预报播报未来24小时天气,不够准确也已过时,而在开源的世界里,播报未来10分钟的天气变化并不是难题。 Dark Sky正是一款以分钟级别准确预测用户所在地未来一小时降雨情况的应用。 随时随地,只要用户打开应用,它会迅速基于用户定位播报天气。比如,当前地区5分钟后有强降雨、将持续15分钟等。 正如其所标榜的那样,Dark Sky是目前“最准确的超本地化天气信息来源”App。 有趣的是,Dark Sky并不是基于气象学方法做出天气预测,而是别出心裁地只采用了大数据分析模型。 Dark Sky的主创团队也十分“特别”。三位创始人中,Adam Grossman是物理学出身,Jay LaPorte和Jack Turner研究计算机科学。团队其他成员则是网络开发人员和后端工程师。换句话说,整个团队都没有气象学背景。 就是这样一群半路出家的“气象工作者”,做出了这款倍受好评的天气应用。 ▲Dark Sky联合创始人:Jay LaPorte(左),Adam

「反向传播非你原创」,Jürgen发文直指Hinton不应获2019本田奖

和自甴很熟 提交于 2020-04-23 23:11:51
  机器之心报道    参与:魔王、蛋酱、杜伟    LSTM 之父 Jürgen Schmidhuber 再次掀起争论,这回他指向了深度学习之父、图灵奖得主 Geoffrey Hinton。不过,这次他站出来质疑的是 Hinton 的最新奖项——本田奖。      创立于 1980 年的本田奖旨在表彰「为引领生态技术领域的下一代新知识而做出贡献的个人或团体」。2019 年,Geoffrey Hinton 获得本田奖,获奖理由是「为将人工智能(AI)广泛应用于多个领域所做的先驱性研究以及实用化推进」。   然而, 昨日计算机科学家 Jürgen Schmidhuber 发文批判这一事件,认为 Hinton 不应该获得该奖项。他表示「不要把发明者弄错人了」,并直呼「奖项并不能改变事实」 。      Jürgen Schmidhuber 在推特上表示:「不要弄错新技术的发明者。至少在科学领域中,真相终将显现。真相没有显现,只能说明时候未到。奖项无法改变事实。」    Jürgen:六大理由,Hinton 不应该获本田奖   Jürgen 首先承认,Hinton 的确在人工神经网络和深度学习领域做出了突出的贡献。但是,本田奖却将 Hinton 未引用的其他研究者的基础性发明归功于他。科学不允许企业 PR 来扭曲科研学术记录。   有理有据!Jürgen 在正文中一一列举了他认为

「反向传播非你原创」,Jürgen发文直指Hinton不应获2019本田奖

末鹿安然 提交于 2020-04-23 23:03:07
LSTM 之父 Jürgen Schmidhuber 再次掀起争论,这回他指向了深度学习之父、图灵奖得主 Geoffrey Hinton。不过,这次他站出来质疑的是 Hinton 的最新奖项——本田奖。 机器之心报道,参与:魔王、蛋酱、杜伟。 创立于 1980 年的本田奖旨在表彰「为引领生态技术领域的下一代新知识而做出贡献的个人或团体」。2019 年,Geoffrey Hinton 获得本田奖,获奖理由是「为将人工智能(AI)广泛应用于多个领域所做的先驱性研究以及实用化推进」。 然而, 昨日计算机科学家 Jürgen Schmidhuber 发文批判这一事件,认为 Hinton 不应该获得该奖项。他表示「不要把发明者弄错人了」,并直呼「奖项并不能改变事实」 。 Jürgen Schmidhuber 在推特上表示:「不要弄错新技术的发明者。至少在科学领域中,真相终将显现。真相没有显现,只能说明时候未到。奖项无法改变事实。」 Jürgen:六大理由,Hinton 不应该获本田奖 Jürgen 首先承认,Hinton 的确在人工神经网络和深度学习领域做出了突出的贡献。但是,本田奖却将 Hinton 未引用的其他研究者的基础性发明归功于他。科学不允许企业 PR 来扭曲科研学术记录。 有理有据!Jürgen 在正文中一一列举了他认为 Hinton 不应获得本田奖的 6 大理由。 理由 1

边缘AI哪家强?英伟达、英特尔、谷歌三家芯片硬件测评

China☆狼群 提交于 2020-04-23 22:24:21
Edge AI(边缘人工智能)仍然是行业的焦点新事物,很多人不确定他们的项目应该选择哪种硬件及平台。今天,笔者将大家评测一些领先和新兴的AI软硬件平台。 自2012年开始深度学习热潮以来,英伟达就一直在其GPU上占据着AI芯片的主导地位。尽管它们耗电量大,运行时嘈杂且成本昂贵,但别无选择。大约3年前,Google宣布他们已经设计了Tensor处理单元(TPU),以加快数据中心的深度学习推理速度。这触发了成熟的科技公司和初创公司争相推出专门针对数据中心和边缘的专用AI芯片。 我们今天要谈论的是边缘AI的平台。那么,边缘AI到底是什么?边缘AI的术语是从边缘计算中借用的,这意味着计算是在数据源附近进行的。 在AI世界中,如你所见,应用场景包括物联网,移动电话,无人驾驶飞机,自动驾驶汽车等。因此,我们将重点放在AI平台上,个人和小型公司都可以开发和使用。 今天要评测的是英特尔的神经计算机棒,谷歌边缘计算芯片Edge TPU和英伟达的Jetson Nano。 性能 在评估用于实时部署的AI模型和硬件平台时,我首先要看的是-它们的速度如何。在计算机视觉任务中,通常以每秒帧数(FPS)来衡量基准。较高的数字表示较好的性能,对于实时视频流,你至少需要大约10 fps才能使视频显得流畅。基准测试中使用了许多应用程序,最常见的两个是分类和对象检测。在计算上,分类是最简单的任务