12、数据读取(四)——图片文件读取
1、图片组成 (1)如何对一张图片进行识别,输入特征值,输出目标值。 在计算机中,对于每一张图片,都是通过像素进行显示,每张图片由像素组成,每一个点的像素值不同。 在一张200x200的图片中: 黑白图片,单通道图片,每一个像素点只有 一个值 ,即 灰度值 ,范围0-255,所以共有200x200,即20000个像素,共有20000个特征。 彩色图片,三通道图片,每一个像素点只有 三个值 ,即 RGB ,范围0-255,所以共有200x200x3,即20000x3个像素,共有60000个特征。 (2)图片数字化三要素, [ 长度、宽度、通道数 ] (3)三要素与张量的关系 指定3-D张量:[height,width,channels] ,即 长度,宽度,通道数 4-D张量:[batch,height,width,channels],即 图片的 张数(批量),长度,宽度,通道数 2、图片的基本操作 每一个图片样本必须保持特征值数量一样,这就需要所有图片统一特征的数量(像素值一样) Ⅰ. 目的:①增加图片数据的统一性 ②所有图片转换为指定大小 ③缩小图片数据量,防止增加开销 Ⅱ. 操作API: 缩放图片的大小 tf.image.resize_images(images, size) 缩小图片 ● images: 4-D形 状