coco

【pytorch-ssd目标检测】训练自己创建的数据集

陌路散爱 提交于 2020-08-17 18:11:39
制作类似pascal voc格式的目标检测数据集: https://www.cnblogs.com/xiximayou/p/12546061.html 代码来源:https://github.com/amdegroot/ssd.pytorch 拷贝下来的代码好多坑要踩。。。 我将其上传到谷歌colab上,当前目录结构如下: 需要说明的是,虽然我们只有2类,但是,要加上背景一类,所以总共我们有3类。 首先我们要读取自己的数据集 在config.py中 # config.py import os.path # gets home dir cross platform # HOME = os.path.expanduser("~") HOME = os.path.expanduser("/content/drive/My Drive/pytorch_ssd/") # for making bounding boxes pretty COLORS = ((255, 0, 0, 128), (0, 255, 0, 128), (0, 0, 255, 128 ), (0, 255, 255, 128), (255, 0, 255, 128), (255, 255, 0, 128 )) MEANS = (104, 117, 123 ) mask = { 'num_classes': 3, 'lr

【pytorch-ssd目标检测】训练自己创建的数据集

拟墨画扇 提交于 2020-08-17 16:11:34
制作类似pascal voc格式的目标检测数据集: https://www.cnblogs.com/xiximayou/p/12546061.html 代码来源:https://github.com/amdegroot/ssd.pytorch 拷贝下来的代码好多坑要踩。。。 我将其上传到谷歌colab上,当前目录结构如下: 需要说明的是,虽然我们只有2类,但是,要加上背景一类,所以总共我们有3类。 首先我们要读取自己的数据集 在config.py中 # config.py import os.path # gets home dir cross platform # HOME = os.path.expanduser("~") HOME = os.path.expanduser("/content/drive/My Drive/pytorch_ssd/") # for making bounding boxes pretty COLORS = ((255, 0, 0, 128), (0, 255, 0, 128), (0, 0, 255, 128 ), (0, 255, 255, 128), (255, 0, 255, 128), (255, 255, 0, 128 )) MEANS = (104, 117, 123 ) mask = { 'num_classes': 3, 'lr

【pytorch-ssd目标检测】训练自己创建的数据集

断了今生、忘了曾经 提交于 2020-08-17 16:10:39
制作类似pascal voc格式的目标检测数据集: https://www.cnblogs.com/xiximayou/p/12546061.html 代码来源:https://github.com/amdegroot/ssd.pytorch 拷贝下来的代码好多坑要踩。。。 我将其上传到谷歌colab上,当前目录结构如下: 需要说明的是,虽然我们只有2类,但是,要加上背景一类,所以总共我们有3类。 首先我们要读取自己的数据集 在config.py中 # config.py import os.path # gets home dir cross platform # HOME = os.path.expanduser("~") HOME = os.path.expanduser("/content/drive/My Drive/pytorch_ssd/") # for making bounding boxes pretty COLORS = ((255, 0, 0, 128), (0, 255, 0, 128), (0, 0, 255, 128 ), (0, 255, 255, 128), (255, 0, 255, 128), (255, 255, 0, 128 )) MEANS = (104, 117, 123 ) mask = { 'num_classes': 3, 'lr

论文解读:腾讯少样本目标检测(CVPR2020)

北城以北 提交于 2020-08-17 06:21:52
自己做的ppt,找个地方存下,万一有人看呢。 少样本目标检测的问题是这样的,给予 包含目标特写的辅助图片 以及 可能包含目标的查询图片 ,任务是找出查询图片中所有辅助图片对应的类别目标,并且标记其准确的位置。这里与普通目标检测任务的不同就在于 训练集每一类的样本数很少,并且用来测试的目标类别是不出现在训练集中的。 这篇论文主要贡献有两个:一是提出了一个通用的少样本目标检测算法,设计的网络通过 对比训练策略 以及 RPN 和 检测器中加入的attention模块 来提取目标间的匹配关系,不需要微调就可以进行靠谱的新目标检测;二是腾讯还自己做了一个包含1000个种类的少样本训练集FSOD,这是为数不多的在目标检测领域的少样本数据集。 该数据集以 ImageNet 和 Open Images dataset V4 为基础,作者团队首先将这两个数据集中语义相同的类别合成为一类,然后去除质量差的和占图片比例小于0.05%的边界框,训练集包含800类、测试集包含200类。在分割测试集和训练集时,作者尽量让这些种类的差距够大。该数据集总共有大约六万六千张图片,十八万个边界框。跟COCO的十二万图片、88万边界框比算是比较少了。从下面这个表里也可以看到,这个数据集的边界框的大小和宽高比也是分布的比较广泛,可以作为一个基准数据集。 整个算法的框架是以 Faster-RCNN为主进行改造 的,首先

pytorch版yolov3训练自己数据集

ぐ巨炮叔叔 提交于 2020-08-17 03:44:18
目录 1. 环境搭建 2. 数据集构建 1. xml文件生成需要Labelimg软件 2. VOC2007 数据集格式 3. 创建*.names file, 4. 更新data/coco.data,其中保存的是很多配置信息 5. 更新cfg文件,修改类别相关信息 6. 数据集格式说明 3. 训练模型 4. 测试模型 5. 评估模型 6. 可视化 7. 高级进阶-网络结构更改 1. 环境搭建 将github库download下来。 git clone https://github.com/ultralytics/yolov3.git 建议在linux环境下使用anaconda进行搭建 conda create -n yolov3 python=3.7 安装需要的软件 pip install -r requirements.txt 环境要求: python >= 3.7 pytorch >= 1.1 numpy tqdm opencv-python 其中只需要注意pytorch的安装: 到 https://pytorch.org/ 中根据操作系统,python版本,cuda版本等选择命令即可。 关于深度学习环境搭建请参看: https://www.cnblogs.com/pprp/p/9463974.html anaconda常用用法: https://www.cnblogs.com

CNN模型演变

若如初见. 提交于 2020-08-16 14:23:44
 参考: 

CCAI 2020 | 耿新—经典论文工作推荐

£可爱£侵袭症+ 提交于 2020-08-16 01:37:57
   CCAI 2020年8月29日-30日   2020年中国人工智能大会(Chinese Congress on Artificial Intelligence 2020,简称“CCAI 2020”)将于8月29日-30日在南京召开。CCAI 2020以“智周万物”为主题,探讨人工智能作为引领未来的战略性技术,如何以周知万物的学术境界赋能未来,带动时代发展,实现互联世界的远大理想。    东南大学计算机学院、软件学院院长、人工智能学院执行院长,国家优青,IETI Distinguished Fellow耿新将出席本次大会并担任《青年科学家专题论坛》论坛主席。    耿新 :分别于2001年和2004年在南京大学计算机科学与技术系获得学士和硕士学位,于2008年获得澳大利亚Deakin大学博士学位。创建东南大学模式学习与挖掘(PALM)实验室并担任实验室主任至今。目前主要从事机器学习、模式识别、计算机视觉等方面的研究。曾获国家级教学成果奖一等奖、教育部自然科学奖一等奖等多项教学、科研奖励,入选国际工程与技术学会(IETI)杰出会士。曾获国家优秀青年科学基金、江苏省杰出青年科学基金资助,主持国家重点研发计划课题、国家自然科学基金等多个科研项目。       01       Partial Multi-Label Learning with Label Distribution  

残差网络ResNet笔记

夙愿已清 提交于 2020-08-16 00:22:09
发现博客园也可以支持Markdown,就把我之前写的博客搬过来了~ 欢迎转载,请注明出处: http://www.cnblogs.com/alanma/p/6877166.html 下面是正文: Deep Residual Learning for Image Recognition 1. 思想 作者根据输入将层表示为学习 残差函数 。实验表明,残差网络更容易优化,并且能够通过增加相当的深度来提高准确率。 核心是解决了增加深度带来的副作用(退化问题),这样能够通过单纯地增加网络深度,来提高网络性能。 作者在ImageNet上实验了一个152层的残差网络,比VGG深8倍,取得了3.57%的错误率。 作者通过一系列实验证明了表示的深度(即网络的深度)对很多视觉识别任务都至关重要。仅仅由于使用了非常深的网络,作者就在COCO目标检测数据集上获得了 28% 的相对提升。 2. 笔记 网络的深度为什么重要? 因为CNN能够提取low/mid/high-level的特征,网络的层数越多,意味着能够提取到不同level的特征越丰富。并且,越深的网络提取的特征越抽象,越具有语义信息。 为什么不能简单地增加网络层数? 对于原来的网络,如果简单地增加深度,会导致梯度弥散或梯度爆炸。 对于该问题的解决方法是 正则化初始化 和 中间的正则化层(Batch Normalization)

香奈儿四色眼影之王,2020秋限定#364 #362红酒玫瑰色美到醉了

蹲街弑〆低调 提交于 2020-08-15 16:25:19
  香奈儿最最最热门的四色眼影盘断货王#268,2020年秋季限定彩妆将以它为灵感延伸,推出一系列以红色能量为主题的彩妆,眼影也再推出全新红色调!   2020 红色正能量      香奈儿此次系列「红色正能量」,以2016年秋季彩妆「红色力量」香奈儿四色眼影#268 纯真作为设计原点。露西娅皮卡希望进一步挖掘色彩背后的寓意。将红色变化为两款深浅不一的鲜明风格,以「红粉色」为表现,凸显女性天真到世故的二元两面。推出一系列丰富彩妆作品,让女性挥洒不同样貌。   香奈儿四色眼影      此系列最主要的角色就是香奈儿四色眼影,以露西娅皮卡的初创作品2016 年秋季彩妆「香奈儿四色眼影#268纯真」作为女性双重对比的灵感,延伸出全新两款新色:      1.香奈儿四色眼影#362清新   丝缎般的桃粉色、饱和柔雾的珠光粉、带有红色光泽的暖梅色、雾棕色   2.香奈儿四色眼影#364诱惑(限量)   雾面棕梅色、丝缎般的粉钛金色、雾面梅棕色、雾面干燥莓果色      以两盘眼影盘混用的眼妆效果,显色同时又内敛的红色系,相当好看!   香奈儿粉红香槟聚光棒      香奈儿水润聚光棒这次推出充满活力青春的色泽#粉红香槟,以法王路易十五的情人庞巴度夫人所钟情的淡粉红色为灵感,当年在法国皇室蔚为风潮。润泽质感直接涂抹或使用专属刷具,也能轻点于眼部与眼影上,强调并勾勒深邃感性的轮廓

TensorFlow非常出色的30个机器学习数据集

拟墨画扇 提交于 2020-08-15 12:14:15
本文转自雷锋网,如需转载请至雷锋网官网申请授权。 TensorFlow是由谷歌大脑的研究人员创建、最大的机器学习和数据科学的开源数据库之一。它是一个端到端平台,适合完全没有经验的初学者和有经验的数据科学家。TensorFlow库包括工具、预训练模型、机器学习教程以及一整套公开数据集。为了帮助你找到所需的训练数据,本文将简单介绍一些TensorFlow中用于机器学习的大型数据集。我们将以下数据集的列表分为图像、视频、音频和文本。 TensorFlow图像数据集 CelebA:明星脸属性数据集(CelebA)是最大的公开可用的人脸图像数据集,其中包含200,000多个名人图像。 每个图像包括5个面部标注和40个二进制属性标注。 Downsampling Imagenet:该数据集是为密度估计和生成性建模任务而建立的。它包括了130多万张物体、场景、车辆、人物等图像。这些图像有两种分辨率规格:32×32和64×64。 Lsun—Lsun是一个大规模的图像数据集,创建该数据集是为了帮助训练模型进行场景理解。该数据集包含超过900万张图像,按场景类别划分,如卧室、教室和餐厅。 Bigearthnet—Bigearthnet是另一个大规模数据集,它包含来自Sentinel-2卫星的航空图像。每张图像覆盖了1.2公里×1.2公里的一片地面。该数据集中有43个类别不平衡的标签。 Places