YOLO学习总结

匿名 (未验证) 提交于 2019-12-03 00:22:01


confidence代表了所预测的box中含有object的置信度和这个box预测的有多准两重信息。



OLO的一些细节:

1:每个grid有30维,这30维中,8维是回归box的坐标,2维是box的confidence,还有20维是类别。


3:激活函数:leaky rectified linear activation


YOLO的网络结构图:

YOLO直接从一张图片中提取特征,来预测每一个Bounding box,最小化和ground turth的误差。由于YOLO是一个端到端的训练,并且中间没有region proposal生成,所以在速度上有了很大的提升。


loss损失函数


实验:






YOLO一张图片只会预测98个Bounding Box和所述类的可能性。所以YOLO在计算过程中,速度很快。
但是YOLO的局限性也相当明显,首先一个cell只能预测两个Bounding Box,预测一类物体,所以当
有一群小物体密集的时候很难得到正确的Bounding Box,小物体在卷积和pooling的过程中,损失的

信息越来越多,得到的有用信息已经很少,所以YOLO在检测小目标效果不尽人意。

总结:
每个 grid cell 中只能预测两个 boxes,以及有一个类别。这种太强的空间约束,限制了 YOLO 对于相邻物体的检测能力,一旦相邻的物体数量过多,YOLO 就检测不好了。
YOLO开辟了一种新的目标检测的思路,改变了原来的pipeline,虽然牺牲了一些检测的精度,但是大幅度的提升了目标检测的速度。


文章来源: YOLO学习总结
标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!