计算机视觉

【计算机视觉】Lecture 5:梯度和边缘检测

微笑、不失礼 提交于 2020-02-28 13:36:54
什么是边缘? 简单的回答:灰度不连续处 物体的边界 不同材料性质的边界 光照的边界 边缘的类型(一维剖面) 边缘可以根据灰度剖面来建模 阶跃边缘 Step edge:图像灰度突然从不连续一侧的一个值变为另一侧的另一个值 斜坡边缘 Ramp edge:灰度变化不是瞬间的而是在有限距离内发生的一种阶跃边缘 例子 边缘的类型(一维剖面) 山脊边缘 Ridge edge:图像灰度值突然变化,然后在很短的距离内回到开始的值;通常由图像中的线产生 例子 边缘的类型(一维剖面) 屋顶边缘:灰度变化不是瞬间的而是在有限距离内发生的一种山脊边缘;通常在曲面相交处产生 例子 阶跃/斜坡边缘术语 边缘描述子 —— 边缘法向 :最大灰度变化方向的单位矢量。 —— 边缘方向 :沿着边缘的单位矢量(垂直于边缘法线)。 —— 边缘位置/中心 :边缘所在图像中的位置 —— 边缘强度/幅值 :沿着边缘法向的局部图像对比度 重点:所有这些信息都可以从梯度向量场计算出来!! 梯度的总结 边缘像素是在梯度幅值局部最大的地方 梯度方向垂直于边缘方向 梯度向量: 幅值: 方向: 来源: CSDN 作者: USRL所长 链接: https://blog.csdn.net/u010307048/article/details/104550540

零基础入门深度学习(三):卷积神经网络基础之初识卷积

北城余情 提交于 2020-02-27 09:27:19
课程名称 | 零基础入门深度学习 授课讲师 | 孙高峰 百度深度学习技术平台部资深研发工程师 授课时间 | 每周二、周四晚20:00-21:00 编辑整理 | 孙高峰 内容来源 | 百度飞桨深度学习集训营 出品平台 | 百度飞桨 01 导读 本课程是百度官方开设的零基础入门深度学习课程,主要面向没有深度学习技术基础或者基础薄弱的同学,帮助大家在深度学习领域实现从0到1+的跨越。从本课程中,你将学习到: 深度学习基础知识 numpy实现神经网络构建和梯度下降算法 计算机视觉领域主要方向的原理、实践 自然语言处理领域主要方向的原理、实践 个性化推荐算法的原理、实践 本周为开讲第三周,百度深度学习技术平台部资深研发工程师孙高峰,开始讲解深度学习在计算机视觉方向实践应用。今天为大家带来的是卷积神经网络基础之初识卷积。 02 计算机视觉概述 计算机视觉作为一门让机器学会如何去“看”的科学学科,具体的说,就是让机器去识别摄像机拍摄的图片或视频中的物体,检测出物体所在的位置,并对目标物体进行跟踪,从而理解并描述出图片或视频里的场景和故事,以此来模拟人脑视觉系统。因此,计算机视觉也通常被叫做机器视觉,其目的是建立能够从图像或者视频中“感知”信息的人工系统。 计算机视觉技术经过几十年的发展,已经在交通(车牌识别、道路违章抓拍)、安防(人脸闸机、小区监控)、金融(刷脸支付、柜台的自动票据识别)、医疗

计算机视觉——图像处理基础

风格不统一 提交于 2020-02-24 08:05:27
目录 1. PIL-Python图像库 1.1 图像灰度处理 代码实现 运行结果 1.2 调整尺寸及旋转 代码实现 运行结果 2. Matplotlib库 2.1 画图、描点和线 代码实现 运行结果 2.2 图像轮廓和直方图 代码实现 运行结果 3. NumPy库 3.1 灰度变换 代码实现 运行结果 3.2 直方图均衡化 代码实现 运行结果 4. SciPy模块 4.1 高斯模糊 代码实现 运行结果 1. PIL-Python图像库 1.1 图像灰度处理 代码实现 # -*- coding: utf-8 -*- from PIL import Image from pylab import * # 添加中文字体支持 from matplotlib.font_manager import FontProperties font = FontProperties(fname=r"c:\windows\fonts\SimSun.ttc", size=14) figure() pil_im = Image.open('D:\\python\pcv_data\data\empire.jpg') gray() subplot(121) title(u'原图',fontproperties=font) axis('off') imshow(pil_im) pil_im = Image.open

计算机视觉数字图像处理基础

北慕城南 提交于 2020-02-23 12:23:11
图像处理基础 一、软件安装 在计算机视觉课程中要在python的环境下面进行图像处理,所以需要选择可以编辑python语句的软件,在此选择的是PyCharm的可视化界面,除此之外,还有VScode,Sublime等编辑器 PyCharm要编译的话需要在Setting的Project interprete解释器中选择python.exe。在PyCharm中是没有自带的,所以使用PyCharm之前需要有python。 二、环境配置 python环境配置 ,可以选择去官网下载最新python或者使用Anaconda,Anaconda可以直接配置好Python 环境、pip 包管理工具、常用的库、配置好环境路径等等,对于新手比较友好。 1.Anaconda安装 使用Anaconda2-5.0.0版本一直安装失败,具体原因不是很清楚,后来换了一个镜像Anaconda2-5.3.1安装就虽然没有出错了,但是在编译代码后出现了这样的错误 UnicodeDecodeError: 'ascii' codec can't decode byte 0xcd in position 9: ordinal not in range(128) 解决办法:python2经常会遇见乱码的问题,并且一遇到中文就乱码。所以我们在安装的时候要注意,无论是解释器interpretor的安装路径还是用户项目的路径

计算机视觉 Computer Vision 综述

给你一囗甜甜゛ 提交于 2020-02-22 15:47:18
1. 计算机视觉的任务 (1)图像分类(Image Classification) ,指的是图像中是否存在某种物体,对图像进行特征描述。通过是CNN网络,结构基本是由卷积层、池化层以及全连接层组成,算法包括AlexNet(2012)、ZFNet(2013)、GoogleNet(2014)、VGGNet(2014)、ResNet(2015)以及DenseNet(2016)。 (2)图像定位(Image Location) ,指的是在图像分类的基础上,得到图像中的目标具体在图像的什么位置,通常是以包围盒的(bounding box)形式。网络带有两个输出分支,一个分支用于做图像分类,另一个分支用于判断目标位置。 (3)目标检测(Object Dection) ,指的是在图像定位基础之上,输入图片/视频,经过处理,得到多个目标的位置信息(左上角和右下角的坐标)、目标的预测类别、目标的预测置信度(confidence)。算法包括R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD、 RetinaNet。 (4)目标跟踪(Object Track) ,指的是在给定场景中跟踪感兴趣的一个或多个具体对象的过程。算法包括FCNT、MD Net。 (5)语义分割(Semantic Segmentation) ,指的是在目标检测基础之上,将整个图像分成像素组

当神经网络遇上计算机图形学,会碰撞出怎样的火花?

99封情书 提交于 2020-02-14 14:33:05
来源商业新知网,原标题:TensorFlow也可以做图形渲染了:当神经网络遇上计算机图形学 谷歌给TensorFlow加入了计算机图形处理功能 TensorFlow Graphics ,让神经网络可以更好地理解计算机世界里的图形操作。 计算机图形 (Computer Graphics)和 计算机视觉 (Computer Vision)是一对孪生兄弟,二者互为逆过程。 计算机图形是预先知道3D物体的形状、位置、材料构成,以及场景的灯光和相机,然后渲染出场景。 计算机视觉是已知拍到的图像,从中推断出有哪些物体,它们由什么材料制成,以及它们的3D位置和方向。 图像识别自然不必多说。在TensorFlow Graphics,图像渲染包括对图形进行旋转、缩放、光影、3D网格等操作。 旋转 旋转在与一些机器人任务中非常重要,比如,用机械臂抓住物体需要精确估计这些物体相对于臂的位置。 缩放 缩放计算机视觉中起着重要作用,因为它会极大地影响投影到平面上的三维物体的外观。 光影材质 材质模型定义光与对象的交互方式,展现这种材料独特的外观。在某些虚拟环境中,可以预测某些物体的真实外观。 几何形状 从手机深度传感器到自动驾驶汽车激光雷达,近年来3D传感器越来越多。它们以网格或者点云的方式输出3D数据。 由于它们的不规则结构,与提供规则网格结构的图像相比,这些表示上的卷积很难实现。TensorFlow

我如何在计算机视觉顶级会议CVPR上发表论文?[转]

点点圈 提交于 2020-02-11 17:09:10
Scalers 点评: 两个月前,成长会的Ramon(S290)收到了计算机视觉顶级会议CVPR论文录取的通知,而且是口头报告。CVPR在计算机视觉领域属于三大顶级会议之一,具有较高的影响力,对于一名在校博士生,能在这个会议上能发表论文,是很不错的一件事情。于是我请Ramon特意撰文,分享了这篇论文从想法到获得成果的一路历程。这篇文章比较长,但是却让我感慨良多。一方面让我想到自己在读研究生期间的经历,科研的生活仿佛历历在目;另外一方面,里面那段关于熬夜赶论文,不到截止不停工的精神,自己也是感同身受。正是因为在科研领域许许多多研究人员夜以继日的持续投入,才能有我们信息领域的科技发展。 另外还要说的一点是,Ramon也是成长会 机器学习 小组组长。我们机器学习小组最近完成了Stanford的在线机器学习课程,下一步即将启动 深度学习 的任务,如果你对这一领域有兴趣,欢迎来参加。详细情况参见 ScalersTalk 成长会深度学习研习计划招募启动 以往机器学习小组日志参见 ScalersTalk 成长会机器学习小组第10~11周学习笔记 ScalersTalk成长会机器学习小组第9周学习笔记 首先做一个自我介绍,我是Ramon(公众号RamonsVoice),中山大学在读博士生(直博第五年),2013年到2014年间在香港理工大学计算学系交流访问。主要的研究方向为计算机视觉

随笔分类整理

≯℡__Kan透↙ 提交于 2020-02-04 14:11:20
整理一下博客的随笔,以便查询和浏览。 计算机知识 Linux备忘录 linux备忘录-基本命令 linux备忘录-文件系统管理 linux备忘录-vi和vim linux备忘录-档案与文件系统的压缩与打包 linux备忘录-shell脚本 linux备忘录-正则表达式与文件格式化处理 linux备忘录-bash linux备忘录-账号管理与ACL权限设定 linux备忘录-磁盘配额与进阶文件系统管理 linux备忘录-例行性工作排程 (crontab) linux备忘录-程序管理与SELinux linux备忘录-系统服务daemon linux备忘录-日志档案 Windows系统 PE文件结构 计算机网络 [网络协议概览] [链路层 Data Link] [网络层 Network] [传输层 Transport] [应用层 Application] 计算机安全 openssl 使用方法 RSA [AES对称加密算法] 其他呢 RegularExpression知识点 编程 C & C++ C/C++知识点 算法-C++篇 数据结构-C++篇 [数据结构-表 (List)] [数据结构-栈 (Stack)] [数据结构-队列 (Queue)] [数据结构-简单的树 (Tree)] [数据结构-平衡二叉查找树 (AVL Tree)] [数据结构-散列 (hashing)] [数据结构

计算机视觉学习小结

≯℡__Kan透↙ 提交于 2020-02-01 22:21:24
为什么学习计算机视觉 为了更好的收入和自己兴趣所在。 如何学习 我报了csdn官方的人工智能学习课程,刚好那段时间搞活动有优惠,销售老师也挺热心的,对我提出的问题都是孜孜不倦的解答,就选择了csdn培训课。 目前的学习状况 通过自学和寻求助教跟老师的帮助答疑,基本上都跟上了学习进度,虽然还有很多疑问,但我觉得这不长不短的几个月要学习很多知识跟内容,肯定是来不及的,一些问题都没深究。受到疫情影响,课程和工作估计也都延后了,不过也正好缓冲下,总结总结,同时可以补充学习其他的知识。2020年开头不怎么好呢,但我相信每个人都能挺过去,祝福武汉,祝福中国,加油。 课程主要学习内容 1.计算机视觉的四要素 2.hsi、hsv、hsl颜色模型 3.c++和python语言的学习 4.python使用anaconda作为开发环境管理工具、c++使用自己编译的opencv-4.1.2和contrib包,分别使用vscode和CLion进行开发。 5.opencv开发环境的构建 6.我的第一个opencv程序,lena图片的读取跟显示,颜色分量的提取,图像的灰度化 7.图像滤波:中值滤波、均值滤波、高斯滤波、形态学滤波 8.边缘检测:roberts、sobel、canny、log算子 9.图像分割:大津算法(优化:局部阈值化)、区域生长法(优化:分水岭算法) 10.特征值检测:霍夫变换检测直线