Facebook AI的DETR,一种基于Transformer的目标检测方法
作者|PRATEEK JOSHI 编译|VK 来源|Analytics Vidhya 介绍 机器学习框架或库有时会更改该领域的格局。今天,Facebook开源了一个这样的框架,DETR(DEtection TRansformer) 在本文中,我们将快速了解目标检测的概念,然后直接研究DETR及其带来的好处。 目标检测 在计算机视觉中,目标检测是一项任务,我们希望我们的模型将对象与背景区分开,并预测图像中存在的对象的位置和类别。当前的深度学习方法试图解决作为分类问题或回归问题或综合两者的目标检测任务。 例如,在RCNN算法中,从输入图像中识别出几个感兴趣的区域。然后将这些区域分类为对象或背景,最后,使用回归模型为所标识的对象生成边界框。 另一方面,YOLO框架(只看一次)以不同的方式处理目标检测。它在单个实例中获取整个图像,并预测这些框的边界框坐标和类概率。 要了解有关目标检测的更多信息,请参阅以下文章: 基本目标检测算法的分步介绍 https://www.analyticsvidhya.com/blog/2018/10/a-step-by-step-introduction-to-the-basic-object-detection-algorithms-part-1/?utm_source=blog&utm_medium=facebook-detection