计算机视觉

C++图像识别之opencv入门学习(基于vs2015环境)

≯℡__Kan透↙ 提交于 2020-01-15 21:03:59
opencv是一个著名的开源计算机视觉库 ,它提供了很多函数,实现很多计算机视觉算法,可以进行图像处理和识别检测等很多功能。最简单的就是图像读取imread,图像写入imwrite,图像显示imshow,改变图像大小resize,图像类型颜色转换cvtColor这几个。关于opencv的具体下载地址大家可以自行搜索,这里主要是介绍在c++环境下开发opencv的步骤,以vs2015示范。 这是下载好opencv开发包的目录: 这是vs2015创建工程的属性配置,包含目录和库目录。因为是vs2015,所以库目录要选vc14,如是vs2017,要选vc15。 还有就是链接器-输入,要把lib库文件输入,因为是debug模式,所以是opencv_world420d.lib。如是release模式,需要输入opencv_world420.lib 下面就是一个简单的例子程序: #include "opencv2/core.hpp" #include "opencv2/imgproc.hpp" #include "opencv2/highgui.hpp" #include "opencv2/videoio.hpp" #include <iostream> using namespace std; using namespace cv; int main() { Mat image; /

计算机视觉中的细节问题(八)

妖精的绣舞 提交于 2020-01-15 07:19:44
(1)、TensorFlow的检查点的含义? 保存模型并不限于在训练之后,在训练之中也需要保存,因为TensorFlow训练模型时难免会出现中断的情况。我们自然希望能够将辛苦得到的中间参数保留下来,否则下次又要重新开始。这种在训练中保存模型,习惯上称之为保存检查点。 (2)、F1-score的计算方式? F1分数(F1-score)是分类问题的一个衡量指标。一些多分类问题的机器学习竞赛,常常将F1-score作为最终测评的方法。它是精确率和召回率的调和平均数,最大为1,最小为0。 此外还有F2分数和F0.5分数。F1分数认为召回率和精确率同等重要,F2分数认为召回率的重要程度是精确率的2倍,而F0.5分数认为召回率的重要程度是精确率的一半。 (3)、神经网络中异或问题的含义? 异或运算直观来说就是如果两个输入的符号相同时(同时为正或者同时为负)则输出为0,否则(一个正一个负)输出为1。 (4)、为什么需要使用验证集? 使用测试数据来选取参数可能会导致神经网络过度拟合测试数据,从而失去对未知数据的判断能力。因为一个神经网络模型的最终目标是对未知数据提供判断,所以为了评估模型在未知数据上的效果,需要保证测试数据在训练过程中是不可见的。这有这样才能保证通过测试数据评估出来的效果和在真实应用场景下模型对未知数据预判的效果是接近的。于是,为了评测神经网络模型在不同参数下的效果

A Taxonomy of Deep Convolutional Neural Nets for Computer Vision

霸气de小男生 提交于 2020-01-14 20:01:03
A Taxonomy of Deep Convolutional Neural Nets for Computer Vision 基本信息 摘要 1. Introduction 2. Introduction to Convolutional Neural Networks 2.1. Building Blocks of CNNs 2.1.1. Why Convolutions? 2.1.2. Max-Pooling 2.1.3. Non-Linearity 2.2. Depth 2.3. Learning Algorithm 2.3.1. Gradient-Based Optimization 2.3.2. Dropout 2.4. Tricks to Increase Performance 2.5. Putting It All Together: AlexNet 2.6. Using Pre-Trained CNNs 2.6.1. Fine-Tuning 2.6.2. CNN Activations as Features 2.7. Improving AlexNet 3. CNN Flavors 3.1. Region-Based CNNs 3.2. Fully Convolutional Networks 3.3. Multi-Modal Networks 3.4.

图像识别深度学习嵌入式开发板比较

删除回忆录丶 提交于 2020-01-14 18:23:20
嵌入式AI主要用于图像识别和语音识别,图像识别主要用于工业、自动化、医疗等行业。以医疗行业为例,由于医疗保健行业大量使用大数据及嵌入式人工智能,进而精准改善疾病诊断、医疗人员与患者之间人力的不平衡、降低医疗成本、促进跨行业合作关系。此外 嵌入式人工智能 还广泛应用于临床试验、大型医疗计划、医疗咨询与宣传推广和销售开发。嵌入式人工智能导入医疗保健行业从2016年到2022年维持很高成长,预计从2016年的6.671亿美元达到2022年的79.888亿美元年均复合增长率为52.68%。 多家半导体厂商已经推出嵌入式AI平台,比如 华为海思今年4月份发布的Hi3559A,这个样品超过100美金/片 集成寒武纪AI核(遗憾不是最新的版本,因为最近寒武纪又发布最新的AI版本,同时还集成大名鼎鼎Cadence的 4核DSP); 赛灵思Xilinx的FPGA—— Zynq 7020,ZU2CG开发难度大,价格不菲,还有其他家的ARM+FPGA方案也不便宜,开发难度也不小; 英伟达的GPU——JETSON TX2,TX2核心板英伟达自己生产,价格太贵,不适合产品小型化生产; TI 的TDA2x系列和DAVINCI系列最新的DM505,以及后续的版本,专注辅助驾驶ADAS,他的64bit浮点DSP C66X+EYE也支持深度学习(不要小瞧EYE,深度学习一个EYE比2个C66X 浮点DSP还强)

表面缺陷检测,当机器拥有视觉

人盡茶涼 提交于 2020-01-14 18:12:37
曾有一个科研项目,青岛啤酒厂委托,研究啤酒瓶的质量检测。 一般这种玻璃瓶会有一定次品、不良品,特征是,内部细细的裂缝纹路长度长于一定限制,那么这种啤酒瓶在运输或者开瓶盖的过程中就有炸裂的风险。 所以,采用计算机摄像, 机器视觉 , 人工智能 的技术,加以判断甄别,减少人工工作量和失误。 现在,各种基于人工智能、机器学习、深度学习的自动检测、探伤、表面缺陷检测的产品部署在一条条生产线上。 当你买到拿到心仪的产品的时候,映入眼帘的,就是它的外观,这是靠模具厂、组装厂的工人们精心呵护生产出来的,有的靠人眼检查,有的靠自动化设备检查,不放过一点瑕疵。 缺陷检测被广泛使用于布匹瑕疵检测、工件表面质量检测、航空航天领域等。传统的算法对规则缺陷以及场景比较简单的场合,能够很好工作,但是对特征不明显的、形状多样、场景比较混乱的场合,则不再适用。近年来,基于深度学习的识别算法越来越成熟,许多公司,例如速嵌智造,把深度学习算法应用到工业场合中。 现在,机器视觉在工业检测、包装印刷、食品工业、航空航天、生物医学工程、军事科技、智能交通、文字识别等领域得到了广泛的应用。工业检测领域是机器视觉应用中比重最大的领域,主要用于产品质量检测、产品分类、产品包装等,如:零件装配完整性检测,装配尺寸精度检测,位置/角度测量,零件识别,PCB板检测,印刷品检测,瓶盖检测,玻璃、烟草、棉花检测,以及指纹、汽车牌照、人脸

从零开始到改写并运行object_detection_tutorial.ipynb

可紊 提交于 2020-01-12 04:09:18
如果一个人要入门计算机视觉的目标检测,那他一开始一定要体验一下自己跑代码把图片的目标检测出来的效果,感受过那份激动后更能激发我们学习计算机视觉的兴趣。而作为初学者,相关基础又比较欠缺,所以需要跑的代码要比较简单,而且最好有教程,tensorflow models里的object_detection_tutorial.ipynb就是一个很好的入门教程,不过新人在自己操作时很容易遇到坑或者弯路。本文将图文并茂地带你从头开始搭建环境,修改并成功运行object_detection_tutorial.ipynb,让你少走弯路,并从中学到一些干货! 安装好anaconda:https://www.anaconda.com/download/,有些勾记得勾上。 下载tensorflow models:https://github.com/tensorflow/models。这里我下载的是tf2.0.0 在anaconda prompt里输入conda create -n env_tf200创建虚拟环境,然后输入 activate env_tf200进入虚拟环境 在这个虚拟环境里安装下面的包: conda install anaconda conda install protobuf pip install tensorflow==2.0.0 pip install pycocotools

计算机视觉领域的一些牛人博客,超有实力的研究机构等的网站链接

╄→гoц情女王★ 提交于 2020-01-12 00:40:37
收藏下(转载于 http://blog.csdn.net/carson2005 ) 以下链接是本人整理的关于计算机视觉(ComputerVision, CV)相关领域的网站链接,其中有CV牛人的主页,CV研究小组的主页,CV领域的paper,代码,CV领域的最新动态,国内的应用情况等等。打算从事这个行业或者刚入门的朋友可以多关注这些网站,多了解一些CV的具体应用。搞研究的朋友也可以从中了解到很多牛人的研究动态、招生情况等。总之,我认为,知识只有分享才能产生更大的价值,真诚希望下面的链接能对朋友们有所帮助。 (1)googleResearch; http://research.google.com/index.html (2)MIT博士,汤晓欧学生林达华; http://people.csail.mit.edu/dhlin/index.html (3)MIT博士后Douglas Lanman; http://web.media.mit.edu/~dlanman/ (4)opencv中文网站; http://www.opencv.org.cn/index.php/首页 (5)Stanford大学vision实验室; http://vision.stanford.edu/research.html (6)Stanford大学博士崔靖宇; http://www.stanford.edu/

计算机视觉领域的一些牛人博客,超有实力的研究机构等的网站链接(ZT)

你离开我真会死。 提交于 2020-01-12 00:39:44
以下链接是本人整理的关于计算机视觉(ComputerVision, CV)相关领域的网站链接,其中有CV牛人的主页,CV研究小组的主页,CV领域的paper,代码,CV领域的最新动态,国内的应用情况等等。打算从事这个行业或者刚入门的朋友可以多关注这些网站,多了解一些CV的具体应用。搞研究的朋友也可以从中了解到很多牛人的研究动态、招生情况等。总之,我认为,知识只有分享才能产生更大的价值,真诚希望下面的链接能对朋友们有所帮助。 (1)googleResearch; http://research.google.com/index.html (2)MIT博士,汤晓欧学生林达华; http://people.csail.mit.edu/dhlin/index.html (3)MIT博士后Douglas Lanman; http://web.media.mit.edu/~dlanman/ (4)opencv中文网站; http://www.opencv.org.cn/index.php/%E9%A6%96%E9%A1%B5 (5)Stanford大学vision实验室; http://vision.stanford.edu/research.html (6)Stanford大学博士崔靖宇; http://www.stanford.edu/~jycui/ (7)UCLA教授朱松纯; http:

【计算机视觉】机器视觉HALCON初步了解

谁都会走 提交于 2020-01-10 03:38:25
今天看到了HALCON的一个资料,记录下来,作为学习记录,同时感谢网上各种大佬 总结   1、HALCON是德国MVtec公司开发的一套完善的标准的机器视觉算法包,它节约了产品成本,缩短了软件开发周期。   Halcon:底层功能算法多,运算性能快,开发需要一定软件功底和图像处理理论。   快速学习做法:研究实例、做实战项目。halcon不能提供相应的界面编程需求,需要和vs来构造MFC界面或者QT使用,才能构成一套完整软件。   2、需求主要有二维三维二维:(1)识别定位;(2)OCR识别;(3)二维码识别;(4)测量;(5)缺陷检测;(6)机器控制等三维:(1)多目标定(2)三维重建(3)三维匹配等   3、成为合格的机器视觉工程师须具备三个方面的知识   图像处理涉及以下几大领域:   A、图像处理的基本理论知识(图像理论的基础知识)   B、图像增强(对比度拉伸、灰度变换等)   C、图像的几何变换(仿射变换,旋转矩阵等)   D、图像的频域处理(傅里叶变换、DFT、小波变换、高低通滤波器设计)   E、形态学(膨胀、腐蚀、开运算和闭运算以及凸壳等)   F、图像分割   G、图像复原   H、运动图像   I、图像配准(模板匹配等)   J、模式识别(分类器训练,神经网络深度学习等)   (2)软件编程功底   具备C,C++,C#及MFC界面开发的功底   A

推荐一些计算机视觉相关的书籍

孤街醉人 提交于 2020-01-09 03:01:38
经常碰到有人问我关于计算机视觉(机器视觉)领域的入门书籍或者相关书籍,下面我就推荐一些自己看的,当然,不见得满足所有人的需求,不过,还是真诚的希望能对你有所帮助。 (1)数字图像处理,冈萨雷斯,阮秋琦(译),电子工业出版社; (2)opencv基础篇,于仕琦,刘瑞祯,北京航空航天大学出版社; (3)Learning OpenCV computer vision with the opencv library, Gary Bradski, Adrian Kaebler, O'REILLY (4)模式识别,边肇琪,张学工,清华大学出版社; (5)模式分类,Richard O. Duda, 机械工业出版社的;好像是CMU的教科书,很经典了,国外模式识别领域的经典教材; (6)机器学习,Mitchell,曾华军(译),机械工业出版社; (7)Computer Vision: Algorithms and Applications, Richard szeliski,该书去年刚完成,前几天才面世,貌似没见到中文版,不过,可以在他的主页上下载到英文电子版。他的主页在我的博客( http://blog.csdn.net/carson2005 )里面有链接。 (8)Pattern Recognition & Machine Learning, M.Bishop, Springer.这本书