Deformable ConvNets v2: More Deformable, Better Results
之前介绍过dai老师的DCN v1 Deformable Convolutional Networks解读 ,现在出了V2效果更赞,实验分析也很充分。 分析DCN Spatial Support Visualization Effective receptive fields 理论上现在很多深层网络最后feature上每个位置的视野域都是铺满全图的,但是实际视野域中每个点对响应的不同,有效视野域即为输入扰动后实际能对输出产生影响的区域。比如求conv2上某一位置的有效视野域,那就依次扰动图像观察该位置处的输出变化,看看哪些像素点能对输出产生影响。一般来说输出点对应回去的中心点对输出影响最大。 Effective sampling/bin locations DCNv1中只对采样位置进行了可视化,但是每个采样位置的权重也是不一样的,现在对采样点或者采样的bin的位置和权重都进行了可视化 Error-bounded saliency regions 已经有一些工作做mask掉图片一些区域使最后输出没有变化,在这个基础上我们可以可视化出最小的能给出和原始一样的输出,也即是最小的最有效识别部分 spatial support of nodes in the last layer of the conv5 stage 图中第一行是Effective sampling/bin