课程4-第一周-卷积神经网络(Convolutional Neural Networks)
1.1计算机视觉(Computer Vision) 问题分类: 图片分类(Image Classification); 目标检测(Object detection); 神经风格转换(Neural Style Transfer)。 挑战: 数据的输入可能会非常大 。例如一张 1000x1000x3 的图片,神经网络输入层的维度将高达三百万,使得网络权重 W 非常庞大。 后果: 1.经网络结构复杂,数据量相对较少,容易出现 过拟合 ; 2.所需内存和计算量巨大。 措施: 因此,一般的神经网络很难处理蕴含着大量数据的图像。解决这一问题的方法就是使用 卷积神经网络(Convolutional Neural Network, CNN) 。 1.2卷积运算(Convolutional Operation) 以以边缘检测为例,来解释卷积是怎样运算的。 边缘检测 垂直边缘(Vertical Edges)检测 水平边缘(Horizontal Edges)检测 图片的边缘检测可以通过与相应滤波器进行卷积来实现。 举例: 以垂直边缘检测为例,原始图片尺寸为 6x6,中间的矩阵被称作 滤波器(filter) ,尺寸为 3x3,卷积后得到的图片尺寸为 4x4,得到结果如下(数值表示灰度,以左上角和右下角的值为例): 可以看到,卷积运算的求解过程是从左到右,由上到下