论文学习——《Good View Hunting: Learning Photo Composition from Dense View Pairs》
本文贡献 1.建立了一个大型数据集——Comparative Photo Composition (CPC) dataset; 2.提出了一个新颖的知识转移框架来训练基于锚框的实时VPN模型(view proposal model); 首先使用Siamese架构在视图对上训练一个视图评估模型,然后我们将这个模型作为一个老师来对各种图像上的候选锚盒进行评分, 这些教师评分将视VPN训练为学生模型,以输出相同的锚框评分排名。 为了训练学生,我们提出了平均两两误差(MPSE)损失。 VPN模型:以图像作为输入,并输出与预定义锚框列表相对应的分数。 训练View Proposal Networks 本文提出一个知识转移框架,在教师模型VEN(View Evaluation Net)的监督下将View Proposal Net(VPN)训练为学生模型。 VEN,它需要一个视图作为输入,并预测组成的分数,因此这可以直接在我们的CPC数据集训练。 为了转移知识,我们在给定图像的锚点框上运行VEN,然后使用预测的分数、新颖的平均成对平方误差(MPSE)损失训练VPN。 VPN:SSD+MultiBox 骨干网络是基于SSD(Conv9之后被截)的,在骨干网的顶部,我们添加了一个卷积层、一个平均池化层和一个全连接层,输出N个分数,对应于N个预定义的锚盒