论文笔记:ZFNet
ZFNet 1、四个问题 要解决什么问题? 卷积神经网络具有很好的效果,在ImageNet上取得了开创性的成果,但是我们对其却没有一个直观的认识,以及它为何效果这么好,全当成黑盒子来用。 用了什么方法解决? 提出了一个新的卷积神经网络可视化技术,来辅助观察中间层以及最后的分类层的输出特征图。 提出了ZFNet,并应用了反卷积技术来做可视化。 效果如何? ZFNet的效果在ImageNet上超过了AlexNet,这篇论文是14年的,放到现在效果不算最好。 中间层可视化,不同层注重的部分可以较明显地看出来。 还存在什么问题? 这篇文章主要是帮助理解CNN内部工作机制的,了解思路就足够了。 2、论文概述 2.1、实现方法 实验主要使用AlexNet和LeNet。 使用反卷积(deconvnet)网络来进行可视化操作。提出了一种将激活值映射回输入时的像素空间的方法,从结果可以看出输入特征图的哪些部分造成了特征图的激活。 网络的每一层都使用一个反卷积得到像素级的输出,输入是feature map,输出是图像像素,如下图所示。右图是正常卷积过程,左图是反卷积过程。 过程分为三部分:unpooling --> rectification -->filtering。 unpooling(反池化):卷积神经网络中的max_pooling操作是不可逆的,但是可以用一组switch变量来记录它激活的位置