深度学习(三)——卷积神经网络
深度学习(三)——卷积神经网络 文章目录 深度学习(三)——卷积神经网络 概述 CNN的神经网络层 卷积层 卷积核和卷积操作 零填充和填充卷积 感受野与扩张卷积 池化层 全连接层 转置卷积层 感兴趣区域(RoI)池化层 概述 这篇博文主要讨论 卷积神经网络 (Convolutional Neural Networks,CNN)。CNN是目前最流行的神经网络类型之一,特别是对于图像或是视频这种高维数据。与 多层感知器 不同,CNN层中的每层单元是一个二维(或高维)滤波器,这样的滤波器又被称为 卷积核 ,它能够对输入数据进行卷积运算,这是最关键的区别。 CNN的产生也同样来源于人类对自我认知过程的思考。考虑人类辨识一头大象的过程,人类往往是在看到大象的一部分,才能够辨识出这是大象的。例如看到大象的大耳朵、长鼻子、粗壮的腿等。但在计算机中,图像的每一个像素点都是三个数字。人类辨识图像的过程启示我们在辨识过程中, 单一的像素点是没有意义 的,只有将像素点放在一块区域中,才能显示出它的作用。 因此,利用卷积核,可以将一块区域中的像素值进行一些运算得到一个值,就实现了上面的过程。也因为这个,CNN在计算机视觉领域得到了非常广泛的应用。接下来就依次介绍CNN的各个组成部分和一些模型上的细节。 CNN的神经网络层 CNN是由几个基本构建块组成的,称为 CNN层 。最基本的CNN具备的层次有: