基于区域的网络
R-CNN网络框架流程:
(1)原始图像经过选择性搜索(SS)算法提取出约2000个候选区域框。
(2)把所有候选框缩放到固定大小(如227*227)
(3)候选框图像逐个通过CNN网络模型提取其特征。
(4)使用SVM分类器对CNN提取的特征进行分类
(5)通过线性回归算法对候选框位置进行微调(边框回归)。
R-CNN不足:
(1)重复计算量大,速度慢
(2)训练阶段步骤繁琐
(3)训练耗时且占用空间大
(4)候选框缩放丢失图像信息
SPP-Net网络框架流程
(1)原始图像经过选择性搜索(SS)算法提取出约2000个候选区域框
(2)原始图像通过卷积神经网络直到最后一层卷积层,获得特征图
(3)对选择性搜索(SS)算法提取到的候选框映射在特征图上,称其为特征图上的window。
(4)对每个window进行SPP操作,获得固定的特征向量传入后续的全连接层。
(5)对全连接层输出特征向量使用SVM进行分类,边框回归算法微调Bounding-box的位置与大小。
SPP-Net不足:
(1)训练阶段步骤繁琐
(2)训练耗时且占用空间大
Fast R-CNN网络框架流程
(1)原始图像经过选择性搜索(SS)算法提取约2000个候选区域
(2)将原始图像经过一次CNN网络,得到最后一次卷积层的特征图
(3)把候选区域投影到特征图上,经过RoI Pooling层得到固定尺寸的特征
(4)RoI特征通过两个全连接层后,分别用Softmax对候选区域进行分类和边框回归,微调候选框的位置与大小
优点:获得更高的检测精度;基于多任务损失函数使得训练方式变得更加简单;采用RoI Pooling层,方便实现卷积神经网络模型端到端的训练
缺点:候选区域建议算法的提取方法使用了选择性搜索(SS)算法,该算法占用目标检测总时间的2/3,因此还无法满足实时性要求;由于候选区建议总是预先使用(SS)算法提取得到的,因此并没有实现真正意义上的端到端的训练和预测。
Faster R-CNN
(1)原始图像经过卷积神经网络最后一层卷积层得到特征图,该特征图被共享用于RPN层和RoI Pooling层
(2)RPN层:经过卷积神经网络得到的特征图作为RPN网络层的输入,用于生成候选区域框。
(3)RoI Pooling层:输入为特征图和候选区域矿,输出RoI特征图用作后续全连接层的输入
(4)最后利用候选区域的特征图判定候选框的类别,同时使用边框回归获得Bounding-box的精确位置
来源:CSDN
作者:~没有名字~
链接:https://blog.csdn.net/lushanghuafei/article/details/104196488