YOLO学习总结 | 易学教程

confidence代表了所预测的box中含有object的置信度和这个box预测的有多准两重信息。

OLO的一些细节：

1：每个grid有30维，这30维中，8维是回归box的坐标，2维是box的confidence，还有20维是类别。

3：激活函数：leaky rectified linear activation

YOLO的网络结构图：

YOLO直接从一张图片中提取特征，来预测每一个Bounding box，最小化和ground turth的误差。由于YOLO是一个端到端的训练，并且中间没有region proposal生成，所以在速度上有了很大的提升。

loss损失函数

实验：

YOLO一张图片只会预测98个Bounding Box和所述类的可能性。所以YOLO在计算过程中，速度很快。
但是YOLO的局限性也相当明显，首先一个cell只能预测两个Bounding Box，预测一类物体，所以当
有一群小物体密集的时候很难得到正确的Bounding Box，小物体在卷积和pooling的过程中，损失的

信息越来越多，得到的有用信息已经很少，所以YOLO在检测小目标效果不尽人意。

总结：
每个 grid cell 中只能预测两个 boxes，以及有一个类别。这种太强的空间约束，限制了 YOLO 对于相邻物体的检测能力，一旦相邻的物体数量过多，YOLO 就检测不好了。
YOLO开辟了一种新的目标检测的思路，改变了原来的pipeline，虽然牺牲了一些检测的精度，但是大幅度的提升了目标检测的速度。

文章来源: YOLO学习总结

标签

yolo

box