卷积层自我理解

☆樱花仙子☆ 提交于 2020-03-05 20:01:33

卷积层相对全连接层的优势:
全连接层用于图片分类的用法是,假如有一张1000*1000的图片,通过神经元和激励函数产生非线性,假如说有10^6 方的神经元,那么便有10^12 方的权重即参数。

现在利用卷积层的生物特征,人眼是通过各种局部特征组合来做分类的,所以利用感受野的概念。
提出卷积核,用来感受局部特征。因此假设有10^6 方个神经元,此时只有10^8 个权重。

这10^8 个权重提取了10^6 个局部特征,但如果不需要这么多的局部特征,只需要几十,几百个,那么参数量就大大减少了。这样做的依据是同一个卷积核能被用来提取某一固定特征,所以某一固定特征的提取共享一个卷积核,称之为参数共享。但其实就是降低了隐藏层神经元的数量!

卷积层提取特征:
一般利用多层卷积层来提取图片特征,原理是,第一层通过几十个卷积核提取几十个局部特征,可能是线段、圆弧段这类的简单几何特征,然后将几十个局部特征分布在不同通道输入下一层卷积层。

下一层卷积层用与输入通道数一致的卷积核来卷积输入的局部特征进一步提取特征,此时的提取出什么和卷积核如何设计已经极为抽象,但是可以相信的是此时经过学习,可以提取更高级抽象的特征。
参考:https://www.zhihu.com/question/39022858第二个答案。

下一层继续上述操作,如此经过了多层之后,最后输出一张高级特征的特征图,可能每个通道代表一种高级特征的heatmap。

拿人脸检测来说,高级特征包含五官等特征,最后输出可能有几十个通道的高级特征,但是每个通道代表的高级特征是固定的,所以可以用固定的全连接方式检测人脸。比如说输出通道的1,2,3和10通道分别代表眼睛,嘴巴,鼻子和眉毛。那么只要保证这几个通道有热点响应,就可以基本确定含有人脸。但是似乎此种方式当图像中出现必要的高级特征但是没有遵循空间位置关系时,会继续判定为人脸,比如鼻子嘴巴错位。

拿一千种分类来说,提取出来很多高级特征之后,每个分类热响应的通道数是不一样的,对应的全连接结果也不同,所以可以用来做多分类。

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!