计算机视觉

计算机视觉实验之直方图均衡化和对数变换

随声附和 提交于 2020-01-03 02:22:12
这篇简单的文章主要是针对我们老师布置的实验作业做的一些简单总结。不足之处,请指正。 1.实验题目 1.1 直方图均衡化 1.2对数变换 2.实验内容 2.1 直方图均衡化 2.1.1 实验目的 利用图像直方图对对比度进行调整的方法,使得变换后的图像直方图均匀分布,增加了图像的全局对比度,图像也就越清晰,色彩也就越丰富。 2.1.2 实验步骤 n 统计灰度直方图 n 求出对应的概率密度 n 求对应的累积概率 n 求出每个灰度级对应的输出灰度级 n 映射到新的图像 2.1.3 实现代码 import numpy as np #import cv2 from PIL import Image from pylab import * import matplotlib.pyplot as plt mpl.rcParams['font.sans-serif']=['SimHei'] def grayhis(img): a = [0]*256 #存储图像的灰度值像素 sum_all=row*column for i in range(row): for j in range(column): gray = img[i][j] # print(gray) a[gray]+= 1 #计算不同灰度值的频数 # sum_all+=a[gray] #print(a) print("总数为:",sum

计算机视觉小结18/09/30

丶灬走出姿态 提交于 2019-12-29 21:33:30
一、图像的传统特征介绍 1.HOG   方向梯度直方图( Histogram of Oriented Gradient, HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。例如,区别圆形的大小或者不一样的形状,此时有用的是边缘信息的特征,而图像的梯度(x和y导数)的大小在边缘和拐角处(突然强度变化的区域)很大,因此可以作为区分的特征。具体提取参考: 2.LBP    局部二值模式(Local Binary Pattern, LBP)是一种用来描述图像局部纹理特征的算子,它具有旋转不变性和灰度不变性等显著的优点。 3.Haar   Haar特征分为三类:边缘特征、线性特征、中心特征和对角线特征,组合成特征模板。特征模板内有白色和黑色两种矩形,并定义该模板的特征值为白色矩形像素和减去黑色矩形像素和。Haar特征值反映了图像的灰度变化情况。 注:参考链接: https://blog.csdn.net/q123456789098/article/details/52748918 二、传统的图像特征提取与深度学习对比 难点:传统的图像特征提取需要自主选择提取哪些特征,并需要相关领域知识,像角点、边缘、纹理,只有使用不同的特征才能更好地描述不同的类别,而在训练的时候,面对很多特征需要对大量参数进行微调。 优点

人工智能的现状及今后发展趋势展望---周鑫

耗尽温柔 提交于 2019-12-27 21:54:23
论文导读:介绍了人工智能的概念及其目前发展概况,对人工智能的几种类型及应用,如:模式识别、专家系统作了简要的介绍。并对人工智能今后的发展前景进行了分析。 关键词:人工智能   1引言   人工智能(ArtificialIntelligence) ,英文缩写为AI,也称机器智能。“人工智能”一词最初是在1956年Dartmouth学会上提出的。它是计算机科学、控制论、信息论、神经生理学、心理学、语言学等多种学科互相渗透而发展起来的一门综合性学科。从计算机应用系统的角度出发,人工智能是研究如何制造智能机器或智能系统,来模拟人类智能活动的能力,以延伸人们智能的科学。   2目前人工智能技术的研究和发展状况   目前,人工智能技术在美国、欧洲和日本依然飞速发展。在AI技术领域十分活跃的IBM公司,已经为加州劳伦斯·利佛摩尔国家实验室制造了ASCIWhite 电脑,号称具有人脑的千分之一的智力能力,而正在开发的更为强大的新超级电脑—— “蓝色牛仔”(Blue Jean),据其研究主任保罗·霍恩称, “蓝色牛仔”的智力水平将大致与人脑相当。   3技术应用   随着AI的技术的发展,现代几乎各种技术的发展都涉及到了人工智能技术,可以说人工智能已经广泛应用到许多领域,其典型的应用包括:   3.1符号计算   计算机最主要的用途之一就是科学计算,科学计算可分为两类:一类是纯数值的计算

入门人工智能

情到浓时终转凉″ 提交于 2019-12-27 20:53:14
【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>> 一、引言 1、什么是人工智能? 如果你是一个新技术的爱好者或者从事工科学习的学生,你一定听说过人工智能(AI),对于什么是人工智能,百度是这样子给出的定义: 人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。 人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。人工智能可以对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那样思考、也可能超过人的智能。 人工智能是一门极富挑战性的科学,从事这项工作的人必须懂得计算机知识,心理学和哲学。人工智能是包括十分广泛的科学,它由不同的领域组成,如机器学习,计算机视觉等等,总的说来,人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作。但不同的时代、不同的人对这种“复杂工作”的理解是不同的。 2017年12月,人工智能入选“2017年度中国媒体十大流行语”。 ---

网易杭研易盾实习心得

自闭症网瘾萝莉.ら 提交于 2019-12-26 19:55:28
本文来自 网易云社区 。 网易杭研易盾实习心得 ====================================================== 实习时间:2017年11月到2018年4月 实习部门:网易易盾计算机视觉算法组 总体而言,网易真是一家很棒的公司,实习体验超级赞,氛围一级棒,周围的同事也很nice,能学到很多东西,可以说是我理想中的公司了。 先说一下易盾是做什么的吧,网易云易盾是网易云旗下一站式云安全服务,覆盖内容安全、业务安全、移动安全和网络安全,基于云计算、大数据和人工智能等技术。。。吧啦吧啦。那我们计算机视觉组主要是利用深度学习相关技术来解决现实中与图像或视频相关的各种问题。更详细的介绍大家可以看官网: https://www.163yun.com/ 我认为对于实习生而言,最关心莫过于能否在技术的深度上有所突破,所幸在这点上我很有收获。在易盾实习,是一对一的导师制,实习生入职之后,会有一位导师在你实习期间专门来带你。组里大部分都是与我年龄相当的哥哥们(是的我也不想骗你们,组内师姐师妹不多。。。。),所以平时我们也有很多话题可聊,他们人也都很nice,平时很愿意和你分享一些自己工作生活中遇到的问题或者是经验。这对于我来说,真的是一笔财富。我想只要你肯学,在这里你可以学习到这个领域相关的很多知识。当然我自己也很幸运地遇到了一位和蔼可亲的导师

【计算机视觉】如何使用opencv自带工具训练人脸检测分类器

大城市里の小女人 提交于 2019-12-26 03:31:23
前言 使用opencv自带的分类器效果并不是很好,由此想要训练自己的分类器,正好opencv有自带的工具进行训练。本文就对此进行展开。 步骤 1.查找工具文件; 2.准备样本数据; 3.训练分类器; 具体操作 注意,本文是在windows系统实现的,当然也可以在linux系统进行。 1.查找工具文件 ; opencv中的自带的分类器训练工具在开源库中以应用程序的类型呈现的,具体目录如下。 .\opencv2410\build\x64\vc12\bin 可以在该目录下查找到相关的工具文件,有opencv_createsamples、opencv_haartraining、opencv_performance、opencv_traincascade; 其中,opencv_haartraining和opencv_traincascade是opencv开源库用于训练级联分类器的两个程序。opencv_traincascade是一个较新的程序,使用OpenCV2.x API以c++编写,二者的主要区别是opencv_traincascade支持Haar和LBP两种特征,并易于增加其他特征。与Haar特征相比,LBP特征是整数特征,因此训练和检测过程都会比Haar特征快几倍。LBP和Haar特征用于检测的准确率是依赖训练过程中训练数据的质量和训练参数

【计算机视觉】目标检测之ECCV2016 - SSD Single Shot MultiBox Detector

可紊 提交于 2019-12-23 01:25:49
本文转载自: http://www.cnblogs.com/lillylin/p/6207292.html SSD论文阅读(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector) 目录 作者及相关链接 文章的选择原因 方法概括 方法细节 相关背景补充 实验结果 与相关文章的对比 总结 作者 intro: ECCV 2016 Oral arxiv: http://arxiv.org/abs/1512.02325 paper: http://www.cs.unc.edu/~wliu/papers/ssd.pdf slides: http://www.cs.unc.edu/%7Ewliu/papers/ssd_eccv2016_slide.pdf github: https://github.com/weiliu89/caffe/tree/ssd video: http://weibo.com/p/2304447a2326da963254c963c97fb05dd3a973 github(MXNet): https://github.com/zhreshold/mxnet-ssd github: https://github.com/zhreshold/mxnet-ssd.cpp github(Keras): https:/

计算机视觉大型攻略 —— SLAM(4) ORB SLAM2(四)Loop closing线程与全局BA

余生颓废 提交于 2019-12-19 21:51:10
ORB SLAM2系列的最后一篇,Loop closing线程与全局BA。 开源代码: https://github.com/raulmur/ORB_SLAM2.git 前三篇链接: 系统架构 , 跟踪线程 , Local Mapping线程 参考文献: [1] ORB-SLAM: a Versatile and Accurate Monocular SLAM System [2] ORB-SLAM2: an Open-Source SLAM System for Monocular, Stereo and RGB-D Cameras [3] Double Window Optimization for Constant Time Visual SLAM [4] Bags of Binary Words for Fast Place Recognition in Image Sequences [5] ORB: an efficient alternative to SIFT or SURF 系统架构 论文[2]中给出的算法框架图。这一篇写Loop Closing线程与全局BA线程。 Loop Closing 线程 当机器人的轨迹完成一个环的时候,称为Loop closure。Loop closing线程需要首先检测到闭环事件,之后优化Pose Graph,启动全局BA线程

【3D计算机视觉】Deep Hough Voting for 3D Object Detection in Point Clouds

元气小坏坏 提交于 2019-12-18 02:08:57
Deep Hough Voting for 3D Object Detection in Point Clouds 一、论文贡献 二、模型实现 2.1 霍夫投票 2.2 VoteNet 2.2.1 总体架构 2.2.2 Point cloud feature learning 2.2.3 Hough voting with deep networks 2.2.4 Object Proposal and Classification from Votes 2.2.5 损失函数 三、实验结果 代码 论文 一、论文贡献 这篇文章是PointNet的作者近期的一篇文章,也是ICCV2019的oral。这一篇文章主要解决了点云上目标检测在一些室内场景中容易效果不好。具体的原因是因为点云上的目标检测与2D图像的目标检测不一样,没有规整的网格一说,而很多物体的质心都存在于点云的外面(例如桌子、椅子),因此利用2D的检测思想很难在点云上面实现。因此作者借鉴了霍夫投票机制,其投票出空间上的一些‘虚拟点’。 二、模型实现 2.1 霍夫投票 传统的霍夫投票机制包含以下几个步骤: 步骤1: 关键点,通过SIFT算子之类的方式找到一些图像上的关键特征; 步骤2-3: 投票,通过一个离线训练好的codebook,找到关键点附近的一些像素,并对这些像素点学习一个唯一,将其唯一到物体的中心; 步骤4: 聚合

本人常用资源整理(ing...)

旧时模样 提交于 2019-12-17 20:28:09
Deep Learning(深度学习): ufldl的2个教程(这个没得说,入门绝对的好教程,Ng的,逻辑清晰有练习):一 ufldl的2个教程(这个没得说,入门绝对的好教程,Ng的,逻辑清晰有练习):二 Bengio团队的deep learning教程,用的theano库,主要是rbm系列,搞python的可以参考,很不错。 deeplearning.net主页,里面包含的信息量非常多,有software, reading list, research lab, dataset, demo等,强烈推荐,自己去发现好资料。 Deep learning的toolbox,matlab实现的,对应源码来学习一些常见的DL模型很有帮助,这个库我主要是用来学习算法实现过程的。 2013年龙星计划深度学习教程,邓力大牛主讲,虽然老师准备得不充分,不过还是很有收获的。 Hinton大牛在coursera上开的神经网络课程,DL部分有不少,非常赞,没有废话,课件每句话都包含了很多信息,有一定DL基础后去听收获更大。 Larochelle关于DL的课件,逻辑清晰,覆盖面广,包含了rbm系列,autoencoder系列,sparse coding系列,还有crf,cnn,rnn等 。 虽然网页是法文,但是课件是英文。 CMU大学2013年的deep learning课程,有不少reading