基于区域的网络

谁说胖子不能爱 提交于 2020-02-07 02:06:26

基于区域的网络

R-CNN网络框架流程
(1)原始图像经过选择性搜索(SS)算法提取出约2000个候选区域框。
(2)把所有候选框缩放到固定大小(如227*227)
(3)候选框图像逐个通过CNN网络模型提取其特征。
(4)使用SVM分类器对CNN提取的特征进行分类
(5)通过线性回归算法对候选框位置进行微调(边框回归)。
R-CNN不足
(1)重复计算量大,速度慢
(2)训练阶段步骤繁琐
(3)训练耗时且占用空间大
(4)候选框缩放丢失图像信息

SPP-Net网络框架流程
(1)原始图像经过选择性搜索(SS)算法提取出约2000个候选区域框
(2)原始图像通过卷积神经网络直到最后一层卷积层,获得特征图
(3)对选择性搜索(SS)算法提取到的候选框映射在特征图上,称其为特征图上的window。
(4)对每个window进行SPP操作,获得固定的特征向量传入后续的全连接层。
(5)对全连接层输出特征向量使用SVM进行分类,边框回归算法微调Bounding-box的位置与大小。
SPP-Net不足
(1)训练阶段步骤繁琐
(2)训练耗时且占用空间大

Fast R-CNN网络框架流程
(1)原始图像经过选择性搜索(SS)算法提取约2000个候选区域
(2)将原始图像经过一次CNN网络,得到最后一次卷积层的特征图
(3)把候选区域投影到特征图上,经过RoI Pooling层得到固定尺寸的特征
(4)RoI特征通过两个全连接层后,分别用Softmax对候选区域进行分类和边框回归,微调候选框的位置与大小
优点:获得更高的检测精度;基于多任务损失函数使得训练方式变得更加简单;采用RoI Pooling层,方便实现卷积神经网络模型端到端的训练
缺点:候选区域建议算法的提取方法使用了选择性搜索(SS)算法,该算法占用目标检测总时间的2/3,因此还无法满足实时性要求;由于候选区建议总是预先使用(SS)算法提取得到的,因此并没有实现真正意义上的端到端的训练和预测。

Faster R-CNN
(1)原始图像经过卷积神经网络最后一层卷积层得到特征图,该特征图被共享用于RPN层和RoI Pooling层
(2)RPN层:经过卷积神经网络得到的特征图作为RPN网络层的输入,用于生成候选区域框。
(3)RoI Pooling层:输入为特征图和候选区域矿,输出RoI特征图用作后续全连接层的输入
(4)最后利用候选区域的特征图判定候选框的类别,同时使用边框回归获得Bounding-box的精确位置

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!