基于区域的网络

R-CNN网络框架流程：
（1）原始图像经过选择性搜索（SS）算法提取出约2000个候选区域框。
（2）把所有候选框缩放到固定大小（如227*227）
（3）候选框图像逐个通过CNN网络模型提取其特征。
（4）使用SVM分类器对CNN提取的特征进行分类
（5）通过线性回归算法对候选框位置进行微调（边框回归）。
R-CNN不足：
（1）重复计算量大，速度慢
（2）训练阶段步骤繁琐
（3）训练耗时且占用空间大
（4）候选框缩放丢失图像信息

SPP-Net网络框架流程
（1）原始图像经过选择性搜索（SS）算法提取出约2000个候选区域框
（2）原始图像通过卷积神经网络直到最后一层卷积层，获得特征图
（3）对选择性搜索（SS）算法提取到的候选框映射在特征图上，称其为特征图上的window。
（4）对每个window进行SPP操作，获得固定的特征向量传入后续的全连接层。
（5）对全连接层输出特征向量使用SVM进行分类，边框回归算法微调Bounding-box的位置与大小。
SPP-Net不足：
（1）训练阶段步骤繁琐
（2）训练耗时且占用空间大

Fast R-CNN网络框架流程
（1）原始图像经过选择性搜索（SS）算法提取约2000个候选区域
（2）将原始图像经过一次CNN网络，得到最后一次卷积层的特征图
（3）把候选区域投影到特征图上，经过RoI Pooling层得到固定尺寸的特征
（4）RoI特征通过两个全连接层后，分别用Softmax对候选区域进行分类和边框回归，微调候选框的位置与大小
优点：获得更高的检测精度；基于多任务损失函数使得训练方式变得更加简单；采用RoI Pooling层，方便实现卷积神经网络模型端到端的训练
缺点：候选区域建议算法的提取方法使用了选择性搜索（SS）算法，该算法占用目标检测总时间的2/3，因此还无法满足实时性要求；由于候选区建议总是预先使用（SS）算法提取得到的，因此并没有实现真正意义上的端到端的训练和预测。

Faster R-CNN
（1）原始图像经过卷积神经网络最后一层卷积层得到特征图，该特征图被共享用于RPN层和RoI Pooling层
（2）RPN层：经过卷积神经网络得到的特征图作为RPN网络层的输入，用于生成候选区域框。
（3）RoI Pooling层：输入为特征图和候选区域矿，输出RoI特征图用作后续全连接层的输入
（4）最后利用候选区域的特征图判定候选框的类别，同时使用边框回归获得Bounding-box的精确位置

来源：CSDN

作者：~没有名字~

链接：https://blog.csdn.net/lushanghuafei/article/details/104196488

标签

卷积

算法