图像处理

点云及三维图像处理综述

ⅰ亾dé卋堺 提交于 2020-10-06 02:23:09
点击上方“ 3D视觉工坊 ”,选择“星标” 干货第一时间送达 来源: 新机器视觉 点云概念 点云与三维图像的关系 :三维图像是一种特殊的信息表达形式,其特征是表达的空间中三个维度的数据,表现形式包括:深度图(以灰度表达物体与相机的距离),几何模型(由CAD软件建立),点云模型(所有逆向工程设备都将物体采样成点云)。和二维图像相比,三维图像借助第三个维度的信息,可以实现天然的物体——背景解耦。点云数据是最为常见也是最基础的三维模型。点云模型往往由测量直接得到,每个点对应一个测量点,未经过其他处理手段,故包含了最大的信息量。这些信息隐藏在点云中需要以其他提取手段将其萃取出来,提取点云中信息的过程则为三维图像处理。 点云的概念 :点云是在同一空间参考系下表达目标空间分布和目标表面特性的海量点集合,在获取物体表面每个采样点的空间坐标后,得到的是点的集合,称之为“点云”(Point Cloud)。 点云的获取设备 :RGBD设备是获取点云的设备,比如PrimeSense公司的PrimeSensor、微软的Kinect、华硕的XTionPRO。 点云的内容 :根据激光测量原理得到的点云,包括三维坐标(XYZ)和激光反射强度(Intensity),强度信息与目标的表面材质、粗糙度、入射角方向,以及仪器的发射能量,激光波长有关。 根据摄影测量原理得到的点云,包括三维坐标(XYZ)和颜色信息(RGB

为什么说卷积神经网络,是深度学习算法应用最成功的领域之一?

旧街凉风 提交于 2020-10-06 00:46:17
目前,作为深度学习的代表算法之一,卷积神经网络(Convolutional Neural Networks,CNN)在计算机视觉、分类等领域上,都取得了当前最好的效果。 后来,基于深度神经网络和搜索树的智能机器人“AlphaGo”在围棋上击败了人类,这是CNN 给人们的一个大大的惊喜。一年后的 Master 则更是完虐了所有人类围棋高手,达到神一般的境界,人类棋手毫无胜机。 可以说,卷积神经网络是深度学习算法应用最成功的领域之一。 目前,CNN应用也十分广泛。例如Facebook用它进行自动的图像标签,google用它做照片检索,amazon用它做产品推荐,Pinterest用它做个性化家庭定制推送,Instagram用它搭建他们的搜索架构。 那么,基于CNN最经典也是最流行的应用应当是图像处理领域。 而研读卷积神经网络的经典论文,对于学习和研究卷积神经网络必不可缺。 今天,给大家推荐一些资料,有 论文、知识图谱。 7份经典学术论文 这些论文大部分都发表在计算机视觉顶级学术会议上。 这7份论文资料,100p以上的内容体量。 建议收藏学习。 01 resnet 02 CNN 03 batchnorm 04 alexnet 05 visualzing 06 resnet 07 yolo4 目前, 2000+ 的看过这个论文资料的同学都顺利成为各公司算法工程师。大家扫码添即可领取

索尼推出全球首款AI图像传感器,1200万像素,支持4K60FPS

自作多情 提交于 2020-10-06 00:30:35
   索尼近日宣布即将推出两款 AI 图像传感器,代号 IMX500 和 IMX501,号称具备智能视觉的 “全球首款 AI 图像传感器”。 其中 IMX500 是无封装版,IMX501 是封装版,没有其他性能差异。   AI 图像传感器兼具运算能力和内存,能够在没有额外硬件辅助的情况下执行机器学习驱动的计算机视觉任务,使得 很多依赖机器学习算法的图像处理技术能够在本地运行,衍生出更简化、高效和安全的解决方案 。   索尼业务与创新副总裁马克·汉森(Mark Hanson)认为, 相比将数据发送到云端的解决方案,IMX500 的应用潜力巨大,成本效益更高,尤其是在未来的边缘计算领域。 它支持 1200 万像素图像,以每秒 60 帧的速度捕获 4K 视频,或者不捕获任何图像,仅提供所见内容的元数据。    官方预计首批搭载该传感器的产品最早将于 2021 第一季度上市 ,目前已有早期商业客户拿到了测试样品,IMX500 售价约 93 美元,IMX501 售价约 186 美元。      图|IMX500(小)和 IMX501(大)(来源:索尼)   不过, 第一代 AI 图像传感器可能不会出现在智能手机或平板电脑等消费者产品中。 索尼的首批目标是零售商和工业客户,比如亚马逊 Go 无人商店,其他应用场景包括访客统计、交通状况和人流量热图绘制等。   以亚马逊无人商店为例

汇总|国内外优秀的计算机视觉团队

亡梦爱人 提交于 2020-10-05 22:11:54
点击上方“ 3D视觉工坊 ”,选择“星标” 干货第一时间送达 国内高校研究团队 北京 清华大学: 龙明盛,黄高,艾海舟,张长水(Big eyes laboratory 大眼睛实验室),丁贵广(Multimedia Intelligence Group),朱文武,朱军,苏航,鲁继文,徐枫,刘烨斌,张钹,胡事民,刘永进,孙富春,王健民,季向阳,罗建文 北京大学:林宙辰,查红彬,施柏鑫,曾刚 (zeng@pku.edu.cn),刘家瑛,穆亚东,黄铁军,段凌宇,郭宗明,连宙辉,张史梁,马思伟,袁晓如 中科院:跨媒体计算研究组,肖俊 中科院计算所:高文(VIPL 视觉信息处理与学习研究组),陈熙霖,山世光,黄庆明,常虹,许倩倩,阚美娜,王瑞平,王树徽,蒋树强 中科院自动化所:谭铁牛(智能感知与计算研究中心),李子青(生物识别与安全技术研究中心),模式识别重点实验室,王亮,赫然,程健,董未名,胡卫明,机器视觉课题组:吴毅红,申抒含,兴军亮,黄凯奇,胡包钢,雷震,张兆翔 中科院信工所:王蕊,操晓春 北京交通大学:信息科学研究所 北京航空航天大学:王蕴红(智能识别与图像处理实验室),黄迪,李甲,刘祥龙,刘偲(CoLab可乐实验室),陆峰(感知交互增强智能 研究室),盛律,徐迈 北京邮电大学:郭军,马占宇(北邮模式识别实验室),许长桥, 北京理工大学:沈建冰,贾云得,黄华,付莹 哈尔滨

基于FPGA的改进实时图像增强算法的设计与实现

≡放荡痞女 提交于 2020-10-04 11:57:13
当今社会,监控技术应用十分广泛。但是很多监控设备大都处于户外工作环境。而外界环境的多变性增加了监控的难度,典型的情况就是天气因素,比如大雾,阴天等等,这些因素会增加监控的难度,甚至使系统无法正常工作。为了保证监控能够在各种天气条件下正常进行,研究图像增强技术具有重大意义。图像增强是一种基本的图像预处理手段,其目的是为了改善图像的质量,针对给定图像的模糊状况以及它的应用场合,有目的的强调图像的整体或局部特性,提高图像可辨识度,改善人对图像的视觉效果,让观察者得到直观清晰的、适合于分析的依据,使图像更有利于观察和后期的分析处理。一般通过对图像的某些特征进行强调突出,从而显示我们有需要的信息,提高图像的使用价值和应用价值 [1] 。不过值得注意的是,图像增强并不意味着能增加原始图像的信息,甚至会损失一些信息。但图像增强的结果却能加强对特定信息的识别能力,使图像中我们感兴趣的特征得以加强。 大多数成像系统具有一定的亮度范围,但实际情况中,由于各种因素的影响,图像常常表现为对比度不强、图像模糊不清,图像细节无法分辨的情况。所以我们需要通过某些算法来调整对比度,亮度,增大图像的动态范围,扩展图像对比度,改善图像的视觉效果,并最大程度上突出图像的细节信息。图像增强技术一般可分为空域算法和频域算法两类。空域算法是指直接对图像灰度级做运算,频域算法则通过FFT首先将图像变换到频域,然后在频域进行处理

拥抱创新,持续探索——对话阿里云 MVP胡逢法

徘徊边缘 提交于 2020-10-04 04:33:00
云栖号资讯:【 点击查看更多行业资讯 】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 简介: 胡逢法作为阿里云 MVP,是一名经验丰富的人工智能领域研究专家,谦虚诚恳、精力充沛。在智能图像视频分析、智能交通等诸多领域研发深有建树,拥有发明专利十余项,希望他的看法能给大家带来启发。 以下是胡逢法的专访,推荐阅读(约5分钟)。 思考点燃理想,尝试成就结果 初中时,学校附近有个工厂,课余时间经常跑到那里去看工人干活,看到很多场景觉得比较好玩,比如工人在做产品质量检查,当时都是用肉眼去看的,我当时想,这类工作得一个个用人去看去记录,要是用机器自动去完成该多好,那时我对自动化及视觉设备这一块应该已经萌生了兴趣。读研的时候,我发现图像处理这些研究很有实际应用价值,例如机器替代人工去做很多繁琐且辛苦的事情可以缓解很多工人的压力等。所以我的学习和工作也一直在做这些方面研究,我逐渐地把自己的想法,通过结合各个模块的知识添加到系统里的方式来实现很多功能。 以前我是做算法类的,只要把某个功能点写好即可。智慧园区的一个项目需要我从技术和业务两个角度考虑问题,不同的视角不断碰撞,于是产生新的点子。在这个过程中有很多知识和技术可以更好地结合利用起来,做出的效果令人很有成就感,对个人的经验和能力来说都有很大提升。 负重前行,每一次转折都弥足珍贵 我的职业生涯有几次较大转折

3D视觉工坊中秋国庆贺礼!

淺唱寂寞╮ 提交于 2020-10-03 12:43:09
写在前面 首先,祝大家国庆、中秋节快乐,感谢大家对工坊的一路陪伴与支持!近一年来,工坊茁壮成长,以3D视觉为切入点,逐渐成为一个集干货、咨询、学业、工作为一体的技术交流平台!为了回馈那些和工坊一起成长的小伙伴,公众号为大家准备了100份「50元」知识星球优惠券(有效期:10月1日0:00~10月3日23:59),希望更多童鞋能够以较小的成本加入到学习社区中。 什么是知识星球? 知识星球是一个高度活跃的社区平台,在这里你可以和相同研究方向的小伙伴一起探讨科研工作难题、交流最新领域进展、分享paper资料、发布高质量的求职就业信息,当然还可以侃侃而谈,吐槽学习工作生活。 为什么给大家推荐「3D视觉从入门到精通」知识星球呢? 下面先简单以几张图片总结星球的主要内容。 这里简单总结星球的主要内容如下: 随着我们队伍的不断壮大,目前星球嘉宾及合伙人,主要包括多个大厂的 计算机视觉算法工程师 、 深度学习算法工程师、 结构光三维重建算法工程师、资深VSLAM算法工程师、3D视觉测量方向的点云后处理资深算法工程师、标定算法工程师以及国内外知名高校博士 等近20多位成员。星球主要关注3D视觉、vSLAM、三维重建、点云处理、立体视觉、结构光、深度学习、计算机视觉和图像处理等方向。日常分享各个领域的最新进展和经典论文,会员可以免费对嘉宾进行技术提问,完成一对一的指导解答,

ffmpeg实现dxva2硬件加速

女生的网名这么多〃 提交于 2020-10-03 05:46:49
这几天在做dxva2硬件加速,找不到什么资料,翻译了一下微软的两篇相关文档。这是第二篇,记录用ffmpeg实现dxva2。 第一篇翻译的Direct3D device manager,链接: http://www.cnblogs.com/betterwgo/p/6124588.html   第二篇翻译的在DirectShow中支持DXVA 2.0,链接: http://www.cnblogs.com/betterwgo/p/6125351.html   在做dxva2的过程中,参考了许多网上的代码,这些代码又多参考VLC和ffmpeg的例子。 1.ffmpeg支持dxva2硬件加速的格式   当前我所使用的ffmpeg的版本是3.2,支持dxva2硬件加速的有以下几种文件格式: AV_CODEC_ID_MPEG2VIDEO、AV_CODEC_ID_H264、AV_CODEC_ID_VC1、AV_CODEC_ID_WMV3、AV_CODEC_ID_HEVC、AV_CODEC_ID_VP9 。ffmpeg识别为这几种格式的文件都可以尝试使用dxva2做硬件加速。但这并不代表是这几种格式的文件就一定支持dxva2硬件加速,因为我就遇到了一个AV_CODEC_ID_HEVC文件在初始化配置dxva2的过程中会失败,PotPlayer在播放这个文件时也不能用dxva2硬件加速。 2

Python数据可视化编程实战PDF高清完整版免费下载|百度云盘

断了今生、忘了曾经 提交于 2020-10-02 20:07:13
百度云盘:Python数据可视化编程实战PDF高清完整版免费下载 提取码:jxp3 内容简介 《Python数据可视化编程实战》是一本使用Python实现数据可视化编程的实战指南,介绍了如何使用Python最流行的库,通过60余种方法创建美观的数据可视化效果。 全书共8章,分别介绍了准备工作环境、了解数据、绘制并定制化图表、学习更多图表和定制化、创建3D可视化图表、用图像和地图绘制图表、使用正确的图表理解数据以及更多matplotlib知识。 《Python数据可视化编程实战》适合那些对Python编程有一定基础的开发人员,可以帮助读者从头开始了解数据、数据格式、数据可视化,并学会使用Python可视化数据。 目录 第1章 准备工作环境 1 1.1 介绍 1 1.2 安装matplotlib、Numpy和Scipy库 2 1.2.1 准备工作 2 1.2.2 操作步骤 3 1.2.3 工作原理 4 1.2.4 补充说明 4 1.3 安装virtualenv和virtualenvwrapper 4 1.3.1 准备工作 5 1.3.2 操作步骤 5 1.4 在Mac OS X上安装matplotlib 6 1.4.1 准备工作 6 1.4.2 操作步骤 6 1.5 在Windows上安装matplotlib 7 1.5.1 准备工作 7 1.5.2 操作步骤 8 1.5.3 补充说明

多线程实例——遍历文件夹分割文件识别文件内容

孤者浪人 提交于 2020-10-02 14:22:07
需求:遍历文件夹下的所有pdf文件,对每个pdf文件根据二维码进行分割,再对分割后的文件的内容进行识别。 可以拆分为以下几个关键方法: 1. GetFileList 方法:遍历文件,获取源文件动态数组(这里假设3个文件夹,每个文件夹下有3个文件,则源文件个数为 9 ),耗时忽略不计 1 static List< string > GetFileList( string strFilefolder) 2 { 3 List< string > list_file = new List< string > (); 4 5 for ( int i = 0 ; i <= 2 ; i++ ) 6 { 7 for ( int j = 0 ; j <= 2 ; j++ ) 8 list_file.Add( " File " + i + j); 9 } 10 11 return list_file; 12 } View Code 2. SplitProcess 方法:分割原始pdf文件,识别二维码( 假设耗时500ms ),将一个pdf文件分割为N(这里假设个数为 6 )个子文件 1 static void SplitProcess( string sourcefile) 2 { 3 Console.WriteLine( " SplitFile Start: " + sourcefile +