coco

深度学习笔记(十三)YOLO V3 (PyTorch)

六眼飞鱼酱① 提交于 2020-08-10 00:35:19
上次记录了下 TensorFlow 版本 ,这次由于 剪枝 需要,尝试下 PyTorch 版本 。 源码目录总览 yolov3- ultralytics ├── cfg // 网络定义文件 │ ├── yolov3.cfg │ ├── yolov3 - spp.cfg │ ├── yolov3 - tiny.cfg ├── data // 数据配置 │ ├── samples // 示例图片,detect.py 检测的就是这里的图片 │ ├── coco.names // coco 用于检测的 80 个类别的名字 │ ├── coco_paper.names // coco 原始 91 个类别的名字 │ ├── coco2014.data // coco 2014 版本的训练测试路径配置 │ └── coco2017.data // coco 2017 版本的训练测试路径配置 ├── utils // 核心代码所在文件夹 │ ├── __init__ .py │ ├── adabound.py │ ├── datasets.py │ ├── google_utils.py │ ├── layers.py │ ├── parse_config.py │ ├── torch_utils.py │ └── utils.py ├── weights // 模型所在路径 │ ├──

NLP+VS︱深度学习数据集标注工具、图像语料数据库、实验室搜索ing....

痴心易碎 提交于 2020-08-09 23:30:28
from: https://blog.csdn.net/sinat_26917383/article/details/54908389 一、NLP标注工具 来源: 《构想:中文文本标注工具(附开源文本标注工具列表)》 Chinese-Annotator 来源: https://github.com/crownpku/Chinese-Annotator 能不能构建一个中文文本的标注工具,可以达到以下两个特点: 标注过程背后含有智能算法,将人工重复劳动降到最低; 标注界面显而易见地友好,让标注操作尽可能简便和符合直觉。 答案是可以的。事实上很多标注工具已经做到了这一点,最先进的如Explosion.ai的Prodigy;然而开发了著名的NLP开源包Spacy的explosion.ai选择了将Prodigy闭源,而Spacy支持中文也仍然遥遥无期。我们希望构建一个开源的中文文本标注工具,而本文很多的技术灵感正是来自Prodigy文档。 流程: 用户标一个label 主动学习的后台算法分为online和offline部分。online部分即时更新模型,可使用诸如SVM、bag of words等尽可能快的传统方法;offline部分当标注数据积累到一定数量时更新模型,可使用准确度较高的深度学习模型。 模型更新后,对尽可能多的example做预测,将确信度排序

pytorch版yolov3训练自己数据集

↘锁芯ラ 提交于 2020-08-09 20:39:04
目录 1. 环境搭建 2. 数据集构建 1. xml文件生成需要Labelimg软件 2. VOC2007 数据集格式 3. 创建*.names file, 4. 更新data/coco.data,其中保存的是很多配置信息 5. 更新cfg文件,修改类别相关信息 6. 数据集格式说明 3. 训练模型 4. 测试模型 5. 评估模型 6. 可视化 7. 高级进阶-网络结构更改 1. 环境搭建 将github库download下来。 git clone https://github.com/ultralytics/yolov3.git 建议在linux环境下使用anaconda进行搭建 conda create -n yolov3 python=3.7 安装需要的软件 pip install -r requirements.txt 环境要求: python >= 3.7 pytorch >= 1.1 numpy tqdm opencv-python 其中只需要注意pytorch的安装: 到 https://pytorch.org/ 中根据操作系统,python版本,cuda版本等选择命令即可。 关于深度学习环境搭建请参看: https://www.cnblogs.com/pprp/p/9463974.html anaconda常用用法: https://www.cnblogs.com

AI大有可为:NAIE平台助力垃圾分类

旧城冷巷雨未停 提交于 2020-08-09 13:33:24
摘要: 生活垃圾的分类和处理是目前整个社会都在关注的热点,如何对生活垃圾进行简洁高效的分类与检测对垃圾的运输处理至关重要。AI技术在垃圾分类中的应用成为了关注焦点。 如今AI已经是这个时代智能的代名词了,任何领域都有AI的身影,垃圾分类及监管等场景自然也少不了“AI+”的赋能。 不过,垃圾往往属于商品的极端变形体,情况比较特殊。目前的技术在视觉可见的基础上,是可以做到垃圾分类报警提醒的,比如判断垃圾是否是经过分类整理的。至于是否能够直接进行视觉检测并分类,且达到某种效果,需要更多的数据和实验支撑才能判断这件事情的可行性。针对这些问题,我们或许可以从海华垃圾分类挑战赛中去听听参赛者都是如何用技术来改变世界的。 海华垃圾分类挑战赛数据包括单类垃圾数据集以及多类垃圾数据集。单类垃圾数据集包含80,000张单类生活垃圾图片,每张单类垃圾图片中仅有一个垃圾实例。多类垃圾数据集包括4998张图像,其中2,998张多类垃圾图片作为训练集数据,A榜和B榜各包含1000张测试图像,每张多类垃圾图片中包含至多20类垃圾实例。我们将对两种数据集分别进行介绍。 一、多类别垃圾 图1 多类垃圾数据类别分布 如图1所示,多类别垃圾涵盖了204类垃圾,但这204类的数据非常不均衡,有一些类别数目非常少甚至没有出现。 图2 多类垃圾数据可视化 图2中两张图是训练集中的两张图像

Office2019、Office365自定义安装组件及转批量授权并激活的工具下载

人走茶凉 提交于 2020-08-09 12:14:28
@ 目录 1. 关键词 2. 免费申请office365 A1 和 a1p 带OneDrive 5T 网盘 office365学生版 3. office2019VOL版 3.1. 官方视频教程 3.2. 卸载旧版本Office 3.3. 下载Office Deployment Tool (ODT) 3.4. 创建/修改配置文件 3.5. 下载&安装 4. 激活 4.1. 为什么我安装的office无法使用批量激活 4.2. 工具下载 4.3. 工具使用说明 4.3.1. 激活 4.3.2. 转换 1. 关键词 Office2019 VOL版本 自定义安装组件、Office自定义安装仅Word、PPT、Excel。 Office激活以及无法使用批量授权激活的解决方案。 2. 免费申请office365 A1 和 a1p 带OneDrive 5T 网盘 office365学生版 参考: https://blog.csdn.net/COCO56/article/details/95715671 3. office2019VOL版 众所周知,Office VOL版本可以连接KMS服务器激活,但是office2019没有镜像可以下载,所以只能依靠Office Deployment Tool来进行操作。注:Office2019 Retail零售版有官方镜像可以下载。

预、自训练之争:谷歌说预训练虽火,但在标注数据上自训练更有效

我的梦境 提交于 2020-08-08 10:20:03
预训练是当前计算机视觉领域的主要范式,但 何恺明等人先前的研究 发现,预训练对目标检测和分割任务的影响有限。因而,重新探究预训练和自训练的效果成为一个非常重要的课题。在这篇谷歌团队的论文中,Quoc V. Le 等研究者发现,当具有大量的标注数据时,自训练的运行效果要优于预训练,并在 COCO 检测和 PASCAL 分割任务上实现了 SOTA 结果。 选自arXiv,作者:Quoc V. Le等人,机器之心编译,参与:魔王、杜伟。 众所周知,预训练是计算机视觉领域的主导范式,研究人员也热衷于预训练。 但是,预训练真的有用吗? 早在 2018 年,何恺明等人在论文《Rethinking ImageNet Pre-training》中重新思考了 ImageNet 预训练模型。他们发现这种利用预训练模型抽取「通用」特征,并借此解决大多数视觉任务的方法是值得质疑的。因为即使在比 ImageNet 还大 3000 倍的数据集上进行预训练,它们对目标检测任务的性能提升仍然不是很大。 近日,谷歌大脑研究团队首席科学家 Quoc V. Le 公布了其团队的一项新研究,主题是「重新思考预训练和自训练」。在这篇论文中,谷歌研究者展示了 当标注数据很多时,预训练不起作用。相比之下,当标注数据很多时,自训练可以运行良好,并在 PASCAL 分割和 COCO 检测数据集上实现 SOTA 效果 。 关于自训练

爆款何处寻,抖音网易云

扶醉桌前 提交于 2020-08-07 18:08:23
作者|谢明宏 编辑|李春晖 原创音乐人和短视频曾是两条不交汇的河流,甚至还存在某种鄙视链。2019年初的音乐综艺《我是唱作人》里,拥有多首“短视频神曲”的高进,就不无郁闷的谈到这一点。 当《我们不一样》在短视频圈高歌猛进时,高进在节目中演唱的《下雪哈尔滨》却没有被广泛接纳。这种现象曾被视为音乐牢不可破的圈层壁垒。但不知哪天起,短视频和原创音乐的交汇竟越来越明显。 被公认为最“文艺”的网易云音乐,和最“通俗”的抖音,其音乐榜单存在大量重合。“一支榴莲”的《海底》、阿冗的《与我无关》、柏松的《世间美好与你环环相扣》、颜人中的《晚安》、林啟得的《大田后生仔》…… 这些时下大火的新歌,几乎遵循同一条爆款路径:先在网易云音乐火起来,接着风靡抖音席卷全网,而且前后时间间隔越来越短。 两者神同步,让短视频的歌“高级”了,原创音乐人的歌也不再“曲高和寡”。歌曲的平台属性被打破,音乐人的发展方式也愈加灵活。 而随着8月3日网易云音乐和抖音官宣达成合作,这一趋势势必更加明显,并为整个华语乐坛带来新的产业机会。据悉,双方将共同致力于“音乐+短视频”内容生态建设,加强对音乐人和音乐作品的扶持、宣推,发掘音乐多样性。而当音乐的多样性浮出水面,更多优秀音乐人和作品也将出圈。 那么问题来了:什么类型的音乐可以横跨在线音乐平台和短视频平台?什么样的音乐人能够在未来市场脱颖而出?什么形式的合作可以更好的构建“音乐

Faster R-CNN论文详解【目标检测1——基于RPN的实时目标检测】

你说的曾经没有我的故事 提交于 2020-08-07 13:10:55
写在前面:大家好!我是【AI 菌】,一枚爱弹吉他的程序员。我 热爱AI、热爱分享、热爱开源 ! 这博客是我对学习的一点总结与思考。如果您也对 深度学习、机器视觉、算法、Python、C++ 感兴趣,可以关注我的动态,我们一起学习,一起进步~ 我的博客地址为: 【AI 菌】的博客 我的Github项目地址是: 【AI 菌】的Github 这篇论文原名为:《Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks》 作者豪华阵容:Shaoqing Ren(任少卿), Kaiming He(何凯明), Ross Girshick, and Jian Sun(孙剑) 其中有三位华人,这一点还是挺令我们自豪的;另一位作者Ross Girshick是R-CNN系列开篇之作的作者。 温馨提示 :Faster R-CNN的实战手把手教程也将更新,想学习的同学,可以关注我的博客动态。 文章目录 摘要 1. 介绍 2. 相关工作 3. Faster R-CNN 3.1 Region Proposal Networks 3.1.1 Anchors 3.1.2 损失函数 3.1.3 训练RPNs 3.2 RPN和Fast R-CNN共享卷积 3.3 实施细节 4. 实验 4.1 PASCAL VOC上的实验

飞桨工程师亲授调参技巧,可使 MobileNetv3-YOLOv3 模型压缩 70%,推理速度提升 1 倍

寵の児 提交于 2020-08-07 10:59:44
随着端侧算力日益增长,以及模型小型化方案日趋成熟,使得高精度的深度学习模型在移动端、嵌入式等终端设备上流畅运行成为可能。然而将深度学习融合到终端设备上依旧面临平衡复杂神经网络结构的精度和设备性能约束的挑战,往往需要模型开发者在深入理解模型结构的基础上,各种调参并进行细致全面的优化才能达到理想的效果。 下载安装命令 ## CPU版本安装命令 pip install -f https://paddlepaddle.org.cn/pip/oschina/cpu paddlepaddle ## GPU版本安装命令 pip install -f https://paddlepaddle.org.cn/pip/oschina/gpu paddlepaddle-gpu ​近期 Paddle Detection推出了一系列针对端侧设备的紧致高效模型,覆盖单阶段及两阶段等主流网络结构,在速度、精度上均取得了不错的表现。这里将模型迭代过程中的设计思路及用到的技巧做一个总结,供感兴趣的同学参考。 为方便大家快速练手,这里提供了一个基于MobileNetv3-YOLOv3的模型优化项目,使用了剪裁、蒸馏的优化策略,所有代码均可以在AI Studio跑通,大家也可以通过AI Studio在线调试。 https:// aistudio.baidu.com/aist udio/projectdetail

如何用Amazon SageMaker 做分布式 TensorFlow 训练?(千元亚马逊羊毛可薅)

人走茶凉 提交于 2020-08-07 08:07:08
机器之心转载,来源:AWS官方博客,作者:Ajay Vohra。 TensorFlow 是广泛被用于开发大型深度神经网络 (DNN) 的开放源机器学习 (ML) 库,此类 DNN 需要分布式训练,并且在多个主机上使用多个 GPU。Amazon SageMaker 是一项托管服务,可通过主动学习、超参数优化、模型分布式训练、监控训练进展,部署培训模型作为自动扩展的 RESTful 服务,以及对并发 ML 实验进行集中式管理,从标签数据开始简化 ML 工作流。 本文将重点讨论使用 Amazon SageMaker 进行分布式 TensorFlow 训练。 概念概述 尽管本文中的许多分布式训练概念通常适用于多种类型的 TensorFlow 模型,但本文着重要介绍的是在 Common Object in Context (COCO) 2017 数据集上对 Mask R-CNN 模型进行的分布式 TensorFlow 训练。 模型 Mask R-CNN 模型用于对象实例分割,其中模型生成像素级掩膜(Sigmoid 二进制分类)和以对象类别(SoftMax 分类)注释的目标框(Smooth L1 回归)描绘图像中的每个对象实例。Mask R-CNN 的一些常见用例包括:自动驾驶汽车的感知、表面缺陷检测和地理空间图像分析。 文中选择 Mask R-CNN 模型的关键原因有三个: 大型数据集上的