像素

亮度、对比度与饱和度

拈花ヽ惹草 提交于 2019-11-29 05:50:16
亮度是指图片的明暗程度,对比度是指图片明暗的差异,饱和度则是图片颜色的饱满程度。 图片文件一般是RGB格式,当然也有的是YCBR格式。前者主要用于显示,后者则主要用于印刷。当然世上没有绝对的事情,也有人喜欢在电脑或手机上看YCBR格式的,至于印刷嘛,如果用RGB格式则可能会偏色。 RGB是三种颜色的缩写,其中R是指红色(Red)、G是指绿色(Green),B是指蓝色(Blue)。现代的时候颜色理论认为所有颜色都是红、绿和蓝三种颜色的组合。 YCBR则是四种颜色的缩写,其中Y是指黄色(Yellow),C是指青色(Cyan),B是指蓝色(Blue),R是指红色(Red)。现代的彩色印刷,最好的都是用黄色、青色、蓝色和红色的四色胶片来完成的。 在计算机中,每一种颜色都是用一个字节(Byte)来记录,RGB图片文件中就用三个字节来分别记录红绿蓝三种颜色,所以比较好的图片文件都是24位的。有的图片文件还支持透明度,透明度也可以用一个字节来记录,因此支持透明度的图片文件就是32位的。 在 用一个字节记录颜色 时,字节可以看成数字,一个字节有8位(bit),每位可代表一个数值为0或1的二进制数,这样一个8位的二进制数转换成十进制数就可以表示从0到255的范围。 颜色值就可以用从0到255的数值来表示颜色的明暗 。当数值为0时颜色最暗,而当数值为255时颜色最亮。当红绿蓝三个的颜色值都是0的时候

Paper Reading:Mask RCNN

Deadly 提交于 2019-11-29 02:28:52
Mask RCNN 论文:Mask R-CNN 发表时间:2018 发表作者:(Facebook AI Research)Kaiming He, Georgia Gkioxari, Piotr Dollar, Ross Girshick 论文链接: 论文链接 论文代码:Facebook 代码链接 ;Tensorflow版本 代码链接 ; Keras and TensorFlow版本 代码链接 ;MxNet版本 代码链接 Mask R-CNN是一个实例分割(Instance segmentation)算法,可以用来做“目标检测”、“目标实例分割”、“目标关键点检测”。Mask RCNN以Faster RCNN原型,增加了一个分支用于分割任务。Mask RCNN比Faster RCNN速度慢一些,达到了5fps。 Mask R-CNN引入了RoI Align代替Faster RCNN中的RoI Pooling。因为RoI Pooling并不是按照像素一一对齐的(pixel-to-pixel alignment),也许这对bbox的影响不是很大,但对于mask的精度却有很大影响。使用RoI Align后mask的精度从10%显著提高到50%。引入语义分割分支,实现了mask和class预测的关系的解耦,mask分支只做语义分割,类型预测的任务交给另一个分支。这与原本的FCN网络是不同的

Image Processing for Embedded Devices <8>

不问归期 提交于 2019-11-29 01:44:55
2.4 像元尺寸减小 2.20 CMOS图像传感器的发展:ITRS曲线:CMOS尺寸效应蓝图。工艺节点曲线:构造CMOS图像传感器的工艺尺寸。像素尺寸曲线:CMOS图像传感器的像素间距 40年前,Intel联合创始人,Gordon Moore,预测处理器的处理速度没18个月会翻一番。虽然这一说法在计算机科学家间广泛争论,但已经被证明是正确的,因此被命名为“Moore’s Law”。随着技术的发展,成本显著下降。对于数码相机,数数每美元有多少像素可作为价值的基本衡量,每美元可以买到的像素个数在新出品相机上持续稳定增长,这和摩尔定律保持一致。1998年澳大利亚PMA DIMA大会上Barry Hendy第一次提出相机价格的预测,称作“Hendy’s Law”。图2.20为IEDM和ISSCC公布的CMOS 图像传感器发展数据概述。最下面那条曲线说明这几年的CMOS尺寸效应,通过ITRS蓝图表示。第二条曲线构造所述CMOS图像传感器的工艺节点,第三掉曲线展示同一器件的像素尺寸。详述如下: l CMOS图像传感器的工业节点落后与ITRS的工业节点,理由非常简单:先进的CMOS工序,用于构造数字电路,往往对图像处理不友好(严重泄电问题,低光照灵敏度,噪声性能,等); l CMOS图像传感器技术程度基本和标准数字CMOS工序保持同步; l 像素尺寸随着所用工艺节点升级。

图像特征-图像的数字化

痴心易碎 提交于 2019-11-29 00:26:08
图像的数字化就是把一幅图像分割成一个个小的单元区域(叫做像元或者像素),这些单个的像素可以单个的用一个量化的区域来表示,灰度用整数来表示,形成一个阵列式的图像,每个像素的属性包含位置灰度/颜色,数字化包含采样和量化两个过程。 数值图像如何表示的? 黑白图像:每个像素只能是黑白,没有中间的过渡,故又称为二值图像,二值图像只能用0和1来表示。 灰度图像:由一个量化的灰度来表示,没有彩色信息,用8位字节来表示,可表示256级灰度[0,255] (由上图可见。图像存储在了矩阵中,黑色用0来描述,白色用250描述,灰色大概是180~200) 彩色图像:彩色图像用三个字节(24位)来描述一个像素,R,G,B是由不同的灰度级来描述。 (由上图可见红色可用(255,0,0)来描述,黄色可由(255,255,0)来描述,绿色可由(0,255,0)描述,蓝色可由(0,0,255)描述) 我们已经知道图像数字化包含两个过程,即采样和量化,图像数字化的过程是怎样的呢? 所谓采样,就是把一幅连续图像在空间上分割成M×N个网格,每个网格用一亮度值来表示。一个网格称为一个像素。M×N的取值满足采样定理。 采样包含两个参数:采样间隔和采样孔径 采样间隔 采样孔径:一般分为圆形,正方形,长方形,椭圆形 采样的方式分为有缝,无缝,重叠三种。 量化:指将像素灰度级转换成离散的整数值的过程。

摄影基础知识入门

故事扮演 提交于 2019-11-28 22:46:07
声明:本博文绝非本人原创,也绝不用于商业用途,只是对信息进行了收集整理。对博文中的图片、文字等信息等进行了来源标注。侵权请联系删除。 焦距 https://youtu.be/8RVawY24YnI?t=277 https://youtu.be/8RVawY24YnI?t=279 https://youtu.be/8RVawY24YnI?t=280 从图中可以清晰地看出,焦距越大拍摄距离越远,但是视野也就越小;焦距越小拍摄距离越近,视野越大。 光圈 https://youtu.be/8RVawY24YnI?t=316 https://youtu.be/8RVawY24YnI?t=319 https://youtu.be/8RVawY24YnI?t=320 https://youtu.be/8RVawY24YnI?t=351 光圈 是 照相机 上用来控制 镜头 孔径 大小的部件,以控制 景深 、镜头成像素质、以及和 快门 协同控制进光量。光圈f值=镜头的 焦距 /光圈口径。简单而言,光圈值越小光圈就越大,进光量也越大, 景深 越浅。(wiki) https://youtu.be/8RVawY24YnI?t=572 景深 ) http://www.csray.com/NewsDetail/900986.html https://youtu.be/8RVawY24YnI?t=371

设备分辨率与像素密度对网页缩放的影响

女生的网名这么多〃 提交于 2019-11-28 20:28:16
此处设置一个默认分辨率 1920*1080 , 设备尺寸15.6吋. (一般笔记本尺寸和分辨率) 默认dpi(win屏幕一般为72或96dpi) (PS默认新建文档默认值72, 72一般在网络上传输,300dip用于输出打印) 当设备的分辨率和设备尺寸不变的情况下,设备屏幕dpi(win屏幕一般为72或96dpi)在高于某个值(72或96dpi)的时候。屏幕的dpi就会影响网页缩放(从而影响网页布局) 屏幕dpi是如何变化的呢? 默认情况下:设备尺寸过小 , 分辨率过高导致设备dpi大于每英寸/72像素, windows会自动对屏幕显示进行放大 . 进而导致浏览器展示的网页被放大 (从而导致网页中、字体、元素尺寸变大,导致网页布局错乱)。 开发者为了调试在不同dpi下网页的缩放和布局故意更改设备dpi。 win10 调整dpi 125%、150%、175%、200%、300%代表放大等级,数值会由 windows系统自动设置,同时自己也可手动设置。 苹果手机4s以后与苹果电脑retina屏 都代表着 系统dpi大于72或96或115dpi。 附常用尺寸表以及dpi https://uiiiuiii.com/screen/ 默认情况下,手机的尺寸较小,分辨率过大(1080或2k)导致设备dpi非常高(一般400以上)所以这就导致了网页在手机上字体会被放大 解决方案 设置CSS

(CVPR 2019)The better version of SRMD

这一生的挚爱 提交于 2019-11-28 16:39:22
CVPR2019的文章,解决SRMD的诸多问题, 并进行模拟实验。 进行双三次差值(bicubic)===>对应matlab imresize() %% read images im = {}; scale_factor = 6; im_ = dir('E:\A_paper\TEM降噪用GAN\matlab_codes\images\*.jpg'); path = ['E:\A_paper\TEM降噪用GAN\matlab_codes\images\',im_(1).name]; im{1} = imread(path); if size(im{1},3) > 1 im{1} = rgb2gray(im{1}); im{1} = im{1}(:,:,1); end %% bicubic interpolation img_up = imresize(im{1}, scale_factor, 'bicubic'); img_down = imresize(im{1}, 1/scale_factor, 'bicubic'); %% image showing figure,imshow(im{1}); figure,imshow(img_up); figure,imshow(img_down); 对应的图片: 当scale_factor放大图像,图像更为平滑,而缩小图像,则更为模糊。

[译]Multi-View Stereo: A Tutorial(3)

孤者浪人 提交于 2019-11-28 16:34:47
chapter 3 基于图像一致性的三维重建 基于第二章的图像一致性算法,本章将会详细介绍最近几年流行的多视角立体几何算法。区分MVS算法有许多因素,例如图像一致性函数,场景表达,可视化计算和初始化条件。因此提出一个单独的分类并不容易。本文将会依据输出的场景表示方法作为主要分类方式。因为它决定了应用的场景,有兴趣的读者可以参考[165]查看mvs算法的分类方法。 Fig3.1 表示4种常用的表示方法:深度图、点云、体素场、mesh面片,本章将会介绍每种重建算法的state-of-the-art 方法。点云重建方法的渲染方式是采用基于点的渲染技术[160,83],展示了一个完整的纹理渲染模型,但是点云模型仅仅是独立的带颜色的3D点;体素场常用于计算机视觉和计算机图形学表示3D平面,常将体素场当成距离一个平面的带符号的距离函数,该平面是函数场的零势面。 Fig3.2表示MVS算法的重建步骤和中间或者最终几何形态类型,许多MVS算法集中于单个重建步骤,然而有些将多个步骤组合成操作管线,本表表达了大多数MVS算法/系统,除了一种算法-直接通过图像一致性体素构建mesh,通过体素融合方法[190,102],在这个方法中,图像一致性体素替换了点云图或者深度图。 当然有许多过去开发的算法再这里没有列举出来,例如level-set方法,level-set曾经在MVS算法中非常流行

[译]Multi-View Stereo: A Tutorial(1)

对着背影说爱祢 提交于 2019-11-28 16:34:18
摘要: 该教程是MVS领域专注于实用算法的实践手册,MVS算法只依赖于图像,基于一些合理的假设(比如?)重建出真实精确的3d模型. 最重要的是场景固定.该教程将mvs问题转化成图像/几何约束优化问题.详细来说主要在两方面: 1.鲁棒实现图像一致性检测;2.有效的优化算法. 主要讲了这两因素在应用程序和工业中如何应用.本教程还描述了高级方法涉及到领域专业知识如:结构优化,以及接下来的挑战和未来的研究方向. 1简介 1.1 图像获取 有序无序 1.2 相机投影模型 如简介所述,为了使重建效果更好,MVS算法需要额外的信息,尤其是每个图片对应的相机模型-它描述了如何将3D点投影到对应的2D空间,MVS算法常采用针孔相机模型,它的相机投影矩阵是3X4的矩阵[88],按比例定义的.这是通常用于拍摄静态照片的现成数码相机的模型。任何一个3X4的矩阵都可以分解成3x3的上三角矩阵K和3X4姿态矩阵的乘积[R|T]. K --- 相机内参矩阵 (fx, fy): 垂直/水平焦距 (cx, cy): 主点 s : 扭曲畸变 [R|T] --- 外参矩阵 R : 旋转参数 T : 平移参数 矩阵K是相机的内参矩阵,它是由相机的内参组成,垂直、水平焦点(光心)长度(f x , f y ),主点(c x , c y ),畸变参数s。[R|T]矩阵为外参矩阵,R是相机的旋转矩阵,T是相机的平移矩阵