coco

目标检测算法之YOLOv1与v2

有些话、适合烂在心里 提交于 2021-01-30 14:05:13
YOLO:You Only Look Once(只需看一眼) 基于深度学习方法的一个特点就是实现端到端的检测,相对于其他目标检测与识别方法(如Fast R-CNN)将目标识别任务分成目标区域预测和类别预测等多个流程,YOLO将目标区域预测和类别预测整合到单个神经网络中,将目标检测任务看作目标区域预测和类别预测的回归问题。速度非常快,达到每秒45帧,而在快速YOLO(Fast YOLO,卷积层更少),可以达到每秒155帧。 与当前最好系统相比,YOLO目标区域定位误差更大,但是背景预测的假阳性(真实结果为假,算法预测为真)优于当前最好的方法。 一、YOLO的核心思想 1. YOLO的核心思想就是利用整张图作为网络的输入,直接在输出层回归bounding box(边界框)的位置及其所属类别 2. Faster R-CNN中也直接用整张图作为输入,但是Faster R-CNN整体还是采用了RCNN那种proposal + classifier的思想,只不过将提取proposal的步骤放在CNN中实现,而YOLO则采用直接回归的思路。 二、YOLO的实现方法 1. YOLO首先将图像分为SxS个网格(grid cell)。如果一个目标的中心落入格子,该格子就负责检测其目标。每一个网格中预测B个Bounding box和置信值(confidence score)

两种端到端通用目标检测方法

自古美人都是妖i 提交于 2021-01-30 12:35:59
摘要: 本文介绍两种端到端训练通用目标检测算法--DETR和DeFCN。 通用目标检测作为计算机视觉中一个基础的任务,对着图像理解、信息提取有着极为重要的意义。对于该任务目前已经发展出了许多方法,如基于全卷积的单阶段方法DenseBox,YOLO,SSD, RetinaNet和CenterNet等,以及更加复杂的多阶段方法RCNN, Fast RCNN, Faster RCNN和 Cascade RCNN等。根据目标检测任务的定义,这些方法需要对图像中出现的目标物体进行定位和分类,为了确保目标的召回率,结合卷积神经网络的采用的滑动窗口预测的特性,上述的方法均使用卷积进行密集的候选区提取和目标预测,因此对于输入的每个目标,往往有多个网络预测值相对应。 这些方法通常使用非极大值抑制方法(NMS)对重复的预测结果进行过滤,从而得到最终预测结果。不同于卷积操作,NMS过程不可导,模型无法对去重的过程进行优化,最终的检测检测模型也由于该操作的存在不能做到完全端到端。 通用目标检测近期的一些进展中,一些方法实现了端到端训练,训练和推理均无需NMS操作。如基于Transformer的DETR[1]和全卷积DeFCN[2], 两种方法采用了较为不同的实现路线,分别具有不同的优势和潜力,下面对这两种方法进行介绍。 DETR Transformer在自然语言处理任务中取得了巨大的成功

几款好用的录屏软件推荐

孤者浪人 提交于 2021-01-29 08:23:37
[TOC] 1. 更多推荐 好用的视频播放器、转换器以及录屏软件: https://www.cnblogs.com/coco56/p/11331018.html 2. 关键词 好用的录屏软件下载 oCam去广告版、屏幕录像专家 v20190501 破解版 下载 3. 录屏软件 班迪录屏- Bandicam v4.5.6——可修复因意外断电等原因导致的发生损坏后的mp4录屏文件 详细介绍: https://coco56.blog.csdn.net/article/details/104916306 oCam 我分享的是去广告版的,感觉这个超好用,也是我现在一直在用的,很轻量,推荐大家用这个。 屏幕录像专家 v20190501 破解版 云盘下载 这个也有很多人在用 4. 下载地址 城通网盘: https://coco56.ctfile.com/dir/13403389-34897992-5e8b92/ 在 录屏软件 那里。 城通网盘下载帮助(新手必看,以防出现问题): https://blog.csdn.net/COCO56/article/details/91939925 来源: oschina 链接: https://my.oschina.net/u/4419748/blog/3428051

语义分割--(DeepLabv3+)Encoder-Decoder with Atrous Separable Convolution for Semantic

拈花ヽ惹草 提交于 2021-01-22 04:42:31
语义分割--(DeepLabv3+)Encoder-Decoder with Atrous Separable Convolution for Semantic .. https://blog.csdn.net/u011974639/article/details/79518175 DeepLabv3+ Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation 原文地址: DeepLabv3+ 注意本文的一作 L i a n g − C h i e h C h e n Liang-Chieh Chen L i a n g − C h i e h C h e n 参与了 DeepLab系列 ,MaskLab和 MobileNet系列 的工作。本文是在DeepLabv3的基础上将多个技术融合到一起,达到新的state-of-the-art。 论文在提出了DeepLabv3+架构。主要以DeepLabv3做encoder架构,decoder采用一个简单却有效的模块。并探索了了改进的Xception和深度分离卷积在模型中的应用,进一步提升模型在语义分割任务上的性能。 Abstract 空间金字塔模块在输入feature上应用多采样率扩张卷积、多接收野卷积或池化,探索多尺度上下文信息。

测试集没有标签,我们可以拿来测试模型吗?

百般思念 提交于 2021-01-21 09:48:16
1. 概述 为了评估一个模型在计算机视觉任务(例如目标识别)上的表现,我们通常需要一个有标注且训练不可见的测试集合。大多数情况下,我们都默认这个带标注测试集合的存在(比如各种常用的数据benchmarks)。然而,在许多实际场景中,数据的标注往往很难获取(成本、标注难度等等),进而使得我们难以快速了解模型的性能。那么,测试集没有标签,我们可以拿来测试模型吗? 我们重点研究自动模型评估(AutoEval)这一重要的且尚未开发的问题。具体来说,给定带标签的训练集和分类器,我们需要估计出分类器在未标记的测试数据集上的分类准确性。围绕这一问题,我们从数据分布差异角度提出解决方案。方法的出发点是:测试集合和训练集合数据分布差异越大,那么分类器在测试集合上的准确率就会越低。为此,我们采用回归模型来估计分类器的性能。回归器的输入为一个测试集与数据分布差异相关的特征(如均值和协方差),输出为分类器在其上的准确率。我们发现回归器可以较为准确地预测分类器在不同测试集合上的表现,进而能很好地帮助我们理解分类器在不同测试场景下的性能表型。 Are Labels Necessary for Classifier Accuracy Evaluation? ​ arxiv.org 2. 自动模型评估 该问题的主旨是了解未知环境下的分类器性能。给一个在训练集上训练好的分类器

你的YOLO V4该换了 | YOLO V4原班人马改进Scaled YOLO V4,已开源(附论文+源码)

风格不统一 提交于 2021-01-21 07:08:53
点击订阅【 人工智能初学者 】,让我们一起前行 YOLOv4-large在COCO上最高可达55.8 AP!速度也高达15 FPS!YOLOv4-tiny的模型实现了1774 FPS!(在RTX 2080Ti上测试) 作者单位:YOLOv4原班人马 1、简介 基于CSP方法的YOLOv4目标检测方法,可以上下缩放,并且适用于小型和大型网络,同时保持速度和准确性。基于此本文提出了一种网络缩放方法,该方法不仅可以修改深度、宽度、分辨率,还可以修改网络的结构。YOLOv4-Large模型达到了最先进的结果:在Tesla V100上以15FPS/s的速度,MS COCO数据集的AP为55.8% AP(73.3 % AP50)。这是目前所有已发表文章中COCO数据集的最高准确性。YOLOv4-tiny模型在RTX 2080Ti上以443FPS/s的速度实现了22.0%的AP(42.0%AP50),而使用TensorRT,batchsize=4和FP16精度,YOLOv4-tiny的模型实现了1774FPS/s。 2、Scaled YOLO V4 首先对YOLOv4进行了重新设计,提出了YOLOv4-CSP,然后在YOLOv4-CSP的基础上开发了Scaled-YOLOv4。在提出的Scaled-yolov4中讨论了线性缩放模型的上界和下界,并分析了小模型和大模型缩放时需要注意的问题。因此

1.8M超轻量目标检测模型NanoDet,比YOLO跑得快,上线两天Star量超200

♀尐吖头ヾ 提交于 2021-01-20 22:49:43
点击上方 “ 机器学习与生成对抗网络 ”,关注"星标" 获取有趣、好玩的前沿干货! 盘点GAN在目标检测中的应用 机器之心报道 项目作者:RangiLyu 如何把 anchor-free 模型移植到移动端或嵌入式设备?这个项目对单阶段检测模型三大模块(Head、Neck、Backbone)进行轻量化,得到模型大小仅 1.8m、速度超快的轻量级模型 NanoDet-m 。 目标检测一直是计算机视觉领域的一大难题,其目标是找出图像中的所有感兴趣区域,并确定这些区域的位置和类别。目标检测中的深度学习方法已经发展了很多年,并出现了不同类型的检测方法。 目前,深度学习目标检测方法主要分为两大类,分别是两阶段式和单阶段式目标检测算法。两阶段式目标检测框架首先生成候选区域,然后将其分类成不同的目标类别,代表模型有 R-CNN、Fast R-CNN 等;单阶段式目标检测框架将目标检测任务视为一个统一的端到端回归问题,代表模型有 MultiBox、YOLO、SSD 等。这类框架通常结构更简单,检测速度也更快。 深度学习目标检测方法还可划分为 Anchor-base 和 Anchor-free 两大类,今年又出现了将 Transformer 用于目标检测 的尝试,各种方法百花齐放。但是,在移动端目标检测算法上,YOLO 系列和 SSD 等 Anchor-base 的模型一直占据主导地位。 近日

1.8M超轻量目标检测模型NanoDet,比YOLO跑得快

核能气质少年 提交于 2021-01-20 22:49:18
机器之心报道,项目作者:RangiLyu 目标检测一直是计算机视觉领域的一大难题,其目标是找出图像中的所有感兴趣区域,并确定这些区域的位置和类别。目标检测中的深度学习方法已经发展了很多年,并出现了不同类型的检测方法。 目前,深度学习目标检测方法主要分为两大类,分别是两阶段式和单阶段式目标检测算法。两阶段式目标检测框架首先生成候选区域,然后将其分类成不同的目标类别,代表模型有 R-CNN、Fast R-CNN 等;单阶段式目标检测框架将目标检测任务视为一个统一的端到端回归问题,代表模型有 MultiBox、YOLO、SSD 等。这类框架通常结构更简单,检测速度也更快。 深度学习目标检测方法还可划分为 Anchor-base 和 Anchor-free 两大类,今年又出现了将 Transformer 用于目标检测的尝试,各种方法百花齐放。但是,在移动端目标检测算法上,YOLO 系列和 SSD 等 Anchor-base 的模型一直占据主导地位。 近日,GitHub 上出现了一个项目 nanodet,它开源了一个移动端实时的 Anchor-free 检测模型,希望能够提供不亚于 YOLO 系列的性能,而且同样方便训练和移植。该项目上线仅两天,Star 量已经超过 1600+。 项目地址:https://github.com/RangiLyu/nanodet NanoDet 模型介绍

ICLR 2021 | 美团、上交大等:鲁棒的可微分神经网络搜索DARTS-

旧街凉风 提交于 2021-01-17 14:56:53
©PaperWeekly 原创 · 作者|陆顺 学校|中科院计算所硕士 研究方向|神经网络架构搜索 注:该工作由作者在美团实习期间由初祥祥(美团 Mentor,前小米 AutoML 负责人)指导参与。 论文标题: DARTS-: Robustly Stepping out of Performance Collapse Without Indicators 论文作者: 初祥祥、王晓星、张勃、陆顺、魏晓林、严骏驰 论文链接: https://openreview.net/forum?id=KLH36ELmwIB 彩蛋: 团队正在招聘实习生,详情见 : 美团视觉智能中心实习生招聘 简介 可微分方法(DARTS)是神经网络架构搜索(NAS)中最流行的方法。现有不少方法都致力于解决性能崩塌的问题,从而提升其稳定性。RobustDARTS [1] 提出了用超网的特征根作为判别是否进入崩塌的标志,而我们在本篇工作发现了反例,即在特征根不断增大的情形下,搜索出的模型性能仍在提升。我们受 FairDARTS [2] 中跳跃连接存在不公平竞争优势的启发,使用了一个额外的跳跃链接(auxiliary skip),简单有效地提升了 DARTS 的鲁棒性,且不使用额外的超参数和指示标志。 研究动机 可微分神经网络搜索(DARTS)存在普遍的性能崩塌,现有提升方法使用了先验知识或用指示信号来判别崩塌是否发生

2020年余额不足,送你3本Python好书充值

拥有回忆 提交于 2021-01-12 01:49:51
VOL 189 26 2020-12 今天距2021年5天 这是ITester软件测试小栈第189次推文 点击上方蓝字“ ITester软件测试小栈 “关注我,每周一 、 三 、 五早上 08:3 0 准时推送,每月不定期 赠送技术书籍 。 微信公众号后台回复“ 资源 ” 、 “ 测试工具包 ”领取测试资源, 回复“ 微信交流群 ”、“ 内推群 ”一起进群打怪。 本文2191字,阅读约需6分钟 尊敬的旅客 您搭乘的 2020号 列车即将到站 请带好您的随身物品 开门请当心 , 下车请走好 Hi,大家好,我是CoCo。 2020年似乎过得又快又乱,年初突如其来发生的事情打乱了我们的生活,大家齐心协力打赢这场没有硝烟的战争。产业链慢慢恢复,生活逐渐步入轨,打工人有序复工,学子们重返校园。 2020年就要结束了,年初立下的升职加薪的Flag实现了吗?打工人辛辛苦苦一整年,和老板申请升职加薪,老板说没看到能力的提升……既然如此,那我们悄悄努力,然后惊艳所有人,包括老板! 在2020年的最后一周, 特此赠送由北京大学出版社出版的 3 本Python好书,希望助你用更好的状态迎接2021 。 01 《Python自动化测试》 鹿瑞峰/著 推荐理由: 1.以实战项目为核心,多种测试框架和测试工具为基础的入门教程。 2.内容丰富,包括Selenium、Appium、Postman