计算机视觉

深度学习在计算机视觉领域(包括图像,视频,3-D点云,深度图)的应用一览

泪湿孤枕 提交于 2020-02-01 02:34:22
深度学习在计算机视觉领域(包括图像,视频,3-D点云,深度图)的应用一览 计算机视觉、以及深度学习在其中的应用闲扯 深度学习无疑是最近人工智能领域最有影响力的方法,在语音识别、计算机视觉、自然语言处理、游戏、机器人和自动驾驶等领域起了非常大的作用,有的可以说是所在领域最成功的一次突破。 计算机视觉从2012年ImageNet获得冠军的AlexNet起,深度学习已经产生了巨大的贡献,从最早的图像分类,到目标检测、识别、分割和跟踪等,都可以看到替代传统视觉方法和战胜以前浅层机器学习的杰出成果。特别是近几年来,我们看到深度学习在计算机视觉的另外两个传统的领域开始发力,一是底层的图像处理和计算摄影学,特别是逼真度极高的一些人脸合成和替换让人感到了深度学习的威力,有得甚至引起了社会道德范畴的反思;另一个是3-D重建,其中包括了2.5D的深度估计和运动估计等,这个本是传统计算机视觉的核心,也是大家觉得确定性(deterministic)计算和估计是必要存在的防守“领地”,现在也在接受深度学习的挑战。另外,在一些计算机视觉外围的领域,比如和图形学结合的图像合成技术,以及和自然语言处理合作的图像加注和问答,还有自动驾驶系统中的多传感器融合技术等,也看到了深度学习的“身影”。 Marr School的贡献就是给出了一个分层的世界描述框架:从首要简约图(primal sketch),到2.5 D

Python安装cv2

别说谁变了你拦得住时间么 提交于 2020-01-31 00:24:20
原文地址 因为有一个视频分帧取图片的,找到的教程多会用到 import cv2 ,当我去 pip install cv2 的时候,却找不到这个模块。搜索之后发现这个cv2是其实是opencv pip install opencv 成功。 附 OpenCV 的全称是Open Source Computer Vision Library,是一个跨平台的 计算机视觉 库。OpenCV是由 英特尔公司 发起并参与开发,以 BSD许可证 授权发行,可以在商业和研究领域中免费使用。OpenCV可用于开发实时的 图像处理 、 计算机视觉 以及 模式识别 程序。该程序库也可以使用英特尔公司的 IPP 进行加速处理。 引自 维基百科_OpenCV OpenCV官方文档 来源: CSDN 作者: BBJG_001 链接: https://blog.csdn.net/BBJG_001/article/details/104116993

《OpenCV计算机视觉编程攻略.pdf》PDF高清完整版-免费下载

一个人想着一个人 提交于 2020-01-26 03:50:53
《OpenCV计算机视觉编程攻略.pdf》PDF高清完整版-免费下载 《OpenCV计算机视觉编程攻略.pdf》PDF高清完整版-免费下载 下载地址: 网盘下载 备用地址: 百度网盘 ,提取码:9fnh 作为人工智能的“眼睛”,计算机视觉技术一直备受关注,辅助驾驶、视频监控等相关应用也越来越多。流行的开源程序库OpenCV无疑是开发智能计算机视觉程序的****。它包含500多个用于图像和视频分析的优化算法,2013年升级的OpenCV 3版本在易用性上也有了极大提升。 本书系统介绍OpenCV 3,带领读者由浅入深地了解如何开发计算机视觉程序。作者从构建可以读取并显示图像的简单应用开始,解释和探讨了图形和图像识别的具体方法,对机器学习和目标识别等当前流行的主题也有介绍。 本书主要内容包括: OpenCV库基本结构 通过操作像素处理图像 用直方图分析图像 将图像分割成同质区域,并提取有意义的物体 使用图像滤波技术提高图像品质 利用图像几何学,建立同一场景不同视角的对应关系 根据图像的不同视角标定相机 使用机器学习技术检测图像中的行人和物体 根据多个图像重构三维场景 内容简介 本书结合C++和OpenCV全面讲解计算机视觉编程,不仅涵盖计算机视觉和图像处理的基础知识,而且通过完整示例讲解OpenCV的重要类和函数。主要内容包括OpenCV库的安装和部署、图像增强、像素操作

Jetson 开发工具介绍

試著忘記壹切 提交于 2020-01-26 00:31:32
刚接触英伟达提供的这些工具很多时候搞不清楚具体都是干什么的,今天借用李丹丹老师的书籍介绍,记录一下: 1.cuda (compute unified device architerture)是一种由Nvidai 推出的通用并行计算架构和编程模型,该架构使GPU 能够解决复杂的计算问题。 2.cublas(cuda basic linear algebra subroutines)是cuda 专门用来解决线性代数运算的库,可以实现向量相乘,矩阵乘向量,矩阵乘矩阵等运算 3.cufft(cuda fast fourier transform)是cuda 提供的封装好的fft 库,它提供了与GPU上的fft库相似的接口,能够让用户轻易地挖掘GPU的强大浮点处理能力,又不用自己去实现专门的FFT内核函数。 4.cudnn(cuda,deep Neural network library)是nVidia专门针对深度神经网络中的基础操作推出的库,cudnn为深度神经网络中的标准流程提供了高度优化的实现方式,如:convolution,pooling,normalization,activation layers 的前向及后向过程 5.tensorRT(tensor runtime),是一个高性能的深度学习推理引擎,用于在生产环境中部署深度学习程序,应用由图像分类,分割和目标检测

偷窥OpenCv背后的秘密

不羁岁月 提交于 2020-01-25 08:29:39
知彼知己,百战不殆 古代,两军对战,都需要探子去刺探地方军情,知道对面有多少人马,什么兵器,阴谋之类的,自己针对对方阵容,做好相应的调整,才能又很大希望,取得战争的胜利。 学习一门新知识也是如此,先要了解他的发展背景,你才能深入的掌握它。 首先,我们要知道 OPenC是一个开源的计算机视觉库,大家可以从http://opencv.org 这个网站获取到。 OpenCv项目最初是由英特尔公司的Gary Bradski(加里·布拉德斯基)在1999年启动的。 OpenCV 库用C语言和 C++ 语言编写,可以在 Windows、Linux、Mac OS X 等系统运行。随着近几年,其他编程语言的火热,OpenCv同时也在积极开发 Python、Java、Matlab 以及其他一些语言的接口,将库导入安卓和 iOS 中为移动设备开发应用。 OpenCV 自项目成立以来获得了来自英特尔和谷歌的大力支持,尤其需要感谢 Itseez,该公司完成了早期开发的大部分工作。此后,Arraiy 团队加入该项目并负责维护始终开源和免费的 OpenCV.org。 Itseez 是俄罗斯的一家视觉公司,专门从事计算机视觉算法。2016 年 5 月,英特尔收购该公司, 以“帮助英特尔的用户打造创新型深度学习的 CV 应用,如果自动驾驶、数字安全监控和工业检测” (英特尔物联网总经理 Doug Dacies

学习笔记-卷积神经网络(3)

≯℡__Kan透↙ 提交于 2020-01-24 02:08:00
实现卷积神经网络 迁移学习 (1)下载神经网络开源的实现(代码和权重) (2)训练集少的情况下,冻结层,保留一个层来训练,在此之上再训练softmax层,改变softmax层的预测 (3)训练集多的情况下,冻结前面较少的层,训练后面的层,构建自己的输出单元。 (4)利用大量数据,重新训练每一层,更新每层的权重。 ——————————————————————————————————————— 计算机视觉现状 深度学习已经成功地应用于计算机视觉,自然语言处理,语音识别,在线广告等 1.手工工程 2.标签数据 —————————————————————————————————————— 目标检测-目标定位 1.训练集不仅包含神经网络需要预测的对象分类标签,还包含表示边界框(Bounding Box)的四个数字(边界框的中心点,框长和框宽) Example: 1.pedestrian 2.car 3.motorcycle 4.background Need to output:(Bx,By),Bh,Bw,class label(1-4) 窗口滑动目标检测 以某个步幅在图像中滑动窗口,遍历整张图片,判断目标是否在窗口中。每一个窗口利用卷积网络进行处理。计算成本较高,速度慢 通过卷积实现滑动窗口对象检测 输出精准的边界框 ——YOLO 主题思想:将图像进行网格划分

计算机视觉应用场景

跟風遠走 提交于 2020-01-24 00:03:36
1.铁路安全人工智能检测<一是对运行状态下列车、货物、人员的安全监测;二是对铁路各项基础设施的安全监测;三是对铁路运行环境的安全监测。铁路人工智能安全检测的市场规模可达千亿元级。> 2.指纹识别<一是安全支付;二是应用切换;三是智能锁> 单说智能锁,相关公司品牌便涉及10来个: https://www.zhihu.com/question/53120614 安全支付可以和人脸识别交叉验证 应用切换还涉及压力识别等 <疑问:为什么芯片总是和识别算法挂钩,似乎做芯片的都在做识别> 3.笔迹识别<刑侦、银行、司法、考古、文案> 4.布匹、纺织业、化纤丝瑕疵检测 5.钞票识别<银行系统> 6.医疗 7.视频[防抖、去噪、增强等] 8.VR:从<生活大爆炸>、<头号玩家>、<黑客帝国>等影视作品都有他的身影,如今这个世界,曾经的科幻都成为了现实,如果VR技术成熟普及,势必是生活方式的一种颠覆【标星**********】 9.三维重建:医学治疗、文物保护、游戏开发、工业设计、航天航海等 10.国星宇航:专注于提供短周期、低成本、一站式的微小卫星整体解决方案,将卫星应用到更多的商业领域(??难道真的会出现卫星买卖,三体的预言吗) 11.3C数码外观检测 来源: CSDN 作者: yyywww666 链接: https://blog.csdn.net/yyywww666/article

计算机视觉OpenCV开源库讲解(图像噪声与图像去噪)

风流意气都作罢 提交于 2020-01-19 02:43:37
图形图像中绝大部分图像都带有一些瑕疵,比如噪声,这会给图像处理带来干扰,OpenCV4中有关于其中噪声的处理函数。 第一,讲解主要常见的噪声种类: 原图: 1.椒盐噪声: 实现代码: 2,高斯噪声: 实现代码: 第二,讲解图像去噪的实现: 中值滤波: 实现代码: 高斯滤波: 实现代码: 注:中值滤波适用于椒盐噪声,不适用于高斯噪声,而高斯滤波适用于高斯噪声,不适用于椒盐噪声。 来源: CSDN 作者: 5cmaini 链接: https://blog.csdn.net/qq_41408585/article/details/103966938

【计算机视觉】数字图像的采样和量化——理论与实践

自闭症网瘾萝莉.ら 提交于 2020-01-17 21:47:57
之前有些过一篇类似的文章 【计算机视觉】数字图像以及图像处理的基本步骤 里面有涉及到采样和量化的知识,不过是简略地描述下 下面将详细地对数字图像的采样和量化进行阐述 我抄袭的书籍: 《数字图像处理(第三版)》[美] Rafael C.Gonzalez、Richard E.Woods 著 ——————————————下面是理论篇——————————————— 当我们使用数字成像系统对某个物体进行拍摄后,将得到一幅由传感器映射出的感知图像(或称连续图像),如: 一幅图片在坐标(x,y)以及幅度(灰度级)上都有可能是连续的,所以在转换成数字图像时需对坐标(x,y)以及幅度(灰度级)都进行“量化”以及“取样”操作: 其中—> 取样:坐标的数字化 其中—> 量化:幅度值的数字化 图二为图一沿着黄色直线A到B的感知图像幅度(也就是灰度级)曲线图,而图二这种看似随机变化是由图像的噪声引起的。为对图像进行数字化,我们需对直线AB上的图像噪声进行 等间距的取样 操作,如下图所示: 垂直刻度在图三曲线可用小方块显示: 这样的一组离散值就给出了取样函数: 在对坐标进行数字化后,也许对幅度进行离散化(数字化)的处理,图下左侧所示已分为8个离散区间的灰度标尺,小方块所在位置指出了其所对应8个灰度的唯一指定值,小方块的指定值取决于该位置与左侧灰度标尺的接近程度,如此

深度学习计算机视觉系列之R-CNN,Fast R-CNN,Faster R-CNN,YOLO对象检测算法

五迷三道 提交于 2020-01-16 03:25:23
R-CNN 背景 自从CNN以来,计算机视觉是一个跨学科领域,近年来受到越来越多的关注,并且自动驾驶汽车已成为焦点。计算机视觉的另一个组成部分是对象检测。对象检测有助于姿态估计,车辆检测,监视等。对象检测算法与分类算法之间的区别在于,在检测算 法中,我们尝试在感兴趣的对象周围绘制一个边界框以将其定位在图像中。此外,在对象检测情况下,您不一定会只绘制一个边界框,在图像中可能有许多边界框代表不同的感兴趣对象,并且您可能事先不知道有多少个边界框。 您不能通过建立标准的卷积网络以及完全连接的层来解决此问题的主要原因是,输出层的长度是可变的-不是恒定的,这是因为感兴趣的对象的出现次数是不固定。解决此问题的幼稚方法是从图像中获取不同的感兴趣区域,并使用CNN对该对象在该区域内 的存在进行分类。这种方法的问题在于,感兴趣的对象可能在图像中具有不同的空间位置和不同的纵横比。因此,您将不得不选择大量的区域,这可能会导致计算爆炸。因此,已经开发了诸如R-CNN,YOLO等算法来发现这些事件并快速找到它们。 神经网络 为了绕过选择大量区域的问题,Ross Girshick等人。提出了一种方法,其中我们使用选择性搜索从图像中仅提取2000个区域,他将其称为区域建议。因此,现在,您可以尝试使用2000个区域,而不必尝试对大量区域进行分类。使用下面编写的选择性搜索算法生成了这2000个区域建议。 选择性搜索: