coco

新摩尔定律时代,地平线让AI芯片算力可感知

风格不统一 提交于 2020-10-03 08:31:06
近日,地平线的联合创始人兼副总裁黄畅在CCF-GAIR大会上进行了《构建与时俱进的性能标准,让AI芯片算力可感知》的主题分享。 以下是演讲内容实录 : 今天不跟大家讲太多我们在业务方面的进展,更多是分享一个观点,就是在今天我们有太多的围绕AI计算的芯片推出,大家从各个角度诠释自己芯片的方方面面,但是究竟什么才是一颗芯片的合理的 AI性能,今天跟大家探讨一下。 我是黄畅,来自地平线。我的分享分成三个部分,第一部分介绍一下新摩尔定律,AI算法效率快速提升这样一件事情。 新摩尔定律——AI 算法效率快速提升 自从摩尔在1965年提出摩尔定律之后,在过去将近半个世纪里面我们一直受益于此,但是在最近5到10年,大家可以看到从传统的旧摩尔定律,半导体工艺演进角度上讲,已经接近了它的尾声。而在AI算法方面,尤其是2012年后大家开始关注大数据量、高算力推动算法的精度持续提升的进程,大家发现通过堆砌算力可以极大地提升算法的精度达到甚至超越人的水平,比如说AlphaGo,它的训练的量从2012年到2019年提升了7个数量级。如果仅仅依靠半导体技术,尤其是传统半导体技术,它是远远不能满足AI需求的快速增长。 关注过去几年的发展,我们会发现有一条之前少有关注的线,就是新的摩尔定律不断收益于AI算法演进和效率提升。先举一个例子, 2016年谷歌推出WaveNet,大家觉得惊为天人

CVPR2020|解决目标检测长尾问题简单方法:BalancedGroupSoftmax

我与影子孤独终老i 提交于 2020-10-02 17:10:05
     本文解读的是 CVPR 2020 Oral 论文《Overcoming Classifier Imbalance for Long-tail Object Detection with Bbalanc ed Group Softmax》,论文作者来自中科院、新加坡国立大学。该论文解读首发于“AI算法修炼营”。    作 者 | SFXiang    编辑 | 丛 末      论文地址:http://openaccess.thecvf.com/content_CVPR_2020/papers/Li_Overcoming_Classifier_Imbalance_for_Long-Tail_Object_Detection_With_Balanced_Group_CVPR_2020_paper.pdf   代码地址:https://github.com/FishYuLi/BalancedGroupSoftmax   视频讲解地址:https://www.youtube.com/watch?v=ikdVuadfUo8   论文的主要思想是提出了长尾分布目标检测器性能下降主要原因是与类别数量正相关,于是通过分组平均分配类别数的思想,提出了Balanced Group Softmax,这是一个简单的思想,效果很不错,大家可以多尝试。    1    前言  

喜茶和奈雪的茶:从交叉线走向平行线

丶灬走出姿态 提交于 2020-10-01 10:35:19
配图来自Canva 奶茶作为一种风靡全球的饮品,自17世纪以来就有“奶茶经济”的出现,至今已经有300多年的历史。而在上个世纪末,奶茶也从中国台湾推向了内地市场。 如今,奶茶已经成为现在年轻人口中所说的“续命水”,心情好了来一杯,心情不好更要来一杯,总之无论什么情况下大家总能找到理由买奶茶。 在这场奶茶热潮下,一些号称“新派中式茶饮”的网红奶茶店层出不穷,他们号称独创和个性,如暴风雨之势般瞬间席卷全国各地。而喜茶与奈雪の茶(以下简称“奈雪”),这对中国茶饮界的头部品牌表现则更为突出。 神仙打架 作为新中式茶饮的巨头,喜茶和奈雪一直免不了被比较的命运,正所谓一山不容二虎,近几年来,喜茶和奈雪也曾暗中数次交锋。 奈雪创建于2015年,以年轻女性为主要客群,主推茶饮和软欧包等产品。截至2020年6月,遍布全国50多个城市,共298家直营门店。 而喜茶创立于2012年,为25岁到30岁的白领人群提供芝士茶、奶霜茶、水果茶等系列产品,业务覆盖全国大、中城市。截止目前,喜茶在全国47个城市拥有超过498个门店。 在今年以来,喜茶与奈雪多次“不约而同”推出同类产品和同类营销模式用来吸引消费者,让消费者对两者傻傻分不清楚。而早在2018年,这两家品牌的创始人就在朋友圈发文对话,互相指责对方跟风抄袭,让喜茶奈雪较劲一度成为当时的热门话题。 由于两家大多都是以应季水果来推出茶饮产品,对于这种“巧合”

科学怪物!3D人体全身运动捕捉系统,港中文联合Facebook出品

空扰寡人 提交于 2020-10-01 02:04:59
     作者 | VVingerfly   编辑 | 陈大鑫   3D人体姿态和形状估计在最近几年是一个重要的研究热点,但大部分工作仅仅关注人体部分,忽略了手部动作,港中文联合Facebook AI研究院提出了一种从单张图片同时估计人体姿态和手部动作的新方法,展示效果好似科学怪物。      如下图左下和右下所示,易看出本文提出的方法姿态估计效果更好。       1    介绍   本文作者提出了一个3D人体全身运动捕捉系统 FrankMocap,能够从单目视频同时估计出3D人体和手部运动,在一块GeForce RTX 2080 GPU上能够达到 9.5 FPS。 作者提到 “FrankMocap” 是对现代普罗米修斯 (The Modern Prometheus)中科学怪人 (Frankenstein) 的怪物的致敬。   人们每天会拍大量的日常活动视频上传到网络,如果有一种基于普通摄像头的运动捕捉系统,能够捕捉视频中人体的运动,将在人机交互、人工智能、机器人等众多方向有所应用。   同时捕捉人体和人手的运动对这些应用同样重要,但人手只占身体的很小一部分,要想直接捕捉两者的运动是一个很难的问题。当前的大部分相关工作都只顾及图片中人体的3D姿态,忽略图片中人手的动作。有部分工作关注从单张图片同时估计人体的全身运动,但这些工作都是基于优化的方法,将参数化的人体模型拟合到图像信息

Pytorch

十年热恋 提交于 2020-09-29 07:48:03
Pytorch - torchvision 简介 model datasets transforms 代码实现 简介 torchvision是Pytorch的计算机视觉工具库,是Pytorch专门用于处理图像的库。 model torchvision.models中包含了许多已经训练好的模型,可以通过models直接调用。 模型 AlexNet VGG ResNet SqueezeNet DenseNet … datasets torchvision.datasets中,包含了许多已经被处理过的图片数据集,可以通过datasets直接调用。 数据集 MNIST:手写数字数据集 COCO:用于图像标注和目标检测 LSUN Classification ImageFolder Imagenet-12 CIFAR10 and CIFAR100 STL10 … transforms transforms模块提供了一般的图像预处理方法, 例如 数据中心化 数据标准化 缩放 裁剪 旋转 翻转 填充 噪声添加 灰度变换 线性变换 仿射变换 亮度 饱满度及对比度变换 … 这些方法可以用于对图像的数据增强,又称为数据增广,数据扩增,是对训练集进行变换,使训练集更加丰富,从而使模型具有泛化能力。 具体方法与函数: 裁剪 作用 CenterCrop 从图像中心裁剪图像 RandomCrop

Mask-RCNN:教你如何制作自己的数据集进行像素级的目标检测

南笙酒味 提交于 2020-09-29 05:54:17
概述 Mask-RCNN,是一个处于像素级别的目标检测手段.目标检测的发展主要历程大概是:RCNN,Fast-RCNN,Fster-RCNN,Darknet,YOLO,YOLOv2,YOLO3(参考 目标检测:keras-yolo3之制作VOC数据集训练指南 ),Mask-RCNN.本文参考的论文来源于 https://arxiv.org/abs/1703.06870 . 下面,开始制作用于Mask训练的数据集。 首先展示一下成果,由于个人设备有限,cpu仅迭代5次的结果。 使用labelme进行图片标注 注意:   **标注之前将图片的名字通过linux或者python脚本改名,改为有序即可,我的命名格式为 升序 , 下面为linux脚本。 i= 1 ; for x in *; do mv $x $i.png; let i=i+ 1 ; done   **将所有图片的尺寸改为 600*800 .(一般设置为2的整数次幂,否则,后序训练时会报错). 脚本自取 https://github.com/hyhouyong/Mask-RCNN/blob/master/train_data/resize.py pip install labelme labelme 1.新建文件夹train_data,并创建子文件夹json,将标注后的json格式的文件放入该文件夹中 2

19包之后又有新包诞生!香奈儿全新菱格纹小方包、金属链带束口包

旧城冷巷雨未停 提交于 2020-09-28 23:22:05
  从经典2.55、Boy Chanel到近几年Gabrielle流浪包、19包,香奈儿的迷人魅力始终让人无法抗拒,2020秋冬系列,创意总监Virginie Viard再度挥洒创意,打造小方包、束口包、丝绒手拿包等新包款。   一只香奈儿包是大多数女孩的心之所向,不论是能代表品牌的经典2.55,向Coco Chanel初恋情人Boy Capel致敬的Boy Chanel,睽违6年的全新包款Gabrielle流浪包,又或是时尚大师Karl Lagerfeld最终之作19 Bag,每一个包款都有非收藏不可的价值。      从卡尔拉格斐手中接棒的Virginie Viard,为香奈儿的经典隽永再添亮点,像是2020春夏系列的小金球系列手袋,一上架便在最短时间内销售一空,成为一包难求的缺货包款。2020秋冬,Virginie再使出看家本领,将香奈儿经典菱格纹图腾、金属粗链带、奢华绒面材质作为创作灵感,打造3个全新手袋: 菱格纹皮革皮穿链方包    在秋冬系列的配件中,最引人注目的绝对是这颗小方包,拥有香奈儿经典桃红色、黑色、纯白共3种颜色的选择,不同于其它方包的设计,背起来的样子会是菱形的形状,拉链开口也设置于包身三角顶部,搭配皮革金属穿链的长背带,方便女孩外出斜背使用,重点是不用10万元的售价,是不是超心动,女孩们可以开始存钱了。       亮皮菱格纹皮穿链束口包   

CVPR论文阅读:《D2Det: Towards High Quality Object Detection and Instance Segmentation》

十年热恋 提交于 2020-09-28 17:30:17
CVPR论文阅读笔记:《D2Det: Towards High Quality Object Detection and Instance Segmentation》 创新点 摘要撰写 1 我们的方法(第三部分) 1.1 稠密局部回归 1.2 区别 Rol Pooling(Discriminative RoI Pooling) 1.3 实例分割 2 实验 2.1 数据集和实现细节 2.2 MS COCO 数据集 2.3 UAVDT 数据集 3 实例分割方法比较 5 结论 参考 创新点 1、提出一种新的 Two-stage 检测方法——D2Det; 2、引入 稠密局部回归 (dense local regression),并通过 二值重叠预测策略 (binary overlap prediction strategy)进一步将其改进。解决了精确定位问题; 3、引入一种判别型 Rol pooling 方案,解决了精准分类的问题。 摘要撰写 1、提出了什么方法; 2、陈列并简述方法的创新点,不给予扩展; 3、说明数据集出处➡将新方法与就方法对比➡摆出实验数据➡套话结束。 1 我们的方法(第三部分) 给出总体框架,有逻辑性的陈述理论工作 新方法的原型是 Faster R-CNN,与 Faster R-CNN 不同的是: 采用独立的分类与回归方案; 用稠密局部回归代替 Faster R

【你只需看一次】YOLO 全系列目标检测算法

六月ゝ 毕业季﹏ 提交于 2020-08-20 02:56:22
文章目录 一、概述 二、Yolo系列全家桶 YOLOv1 开山鼻祖之作 YOLOv2 YOLOv3 YOLOv4 目标检测tricks集大成者 YOLOv5 Fast YOLO Complex-YOLO MV-YOLO YOLO3D YOLO-6D YOLO-LITE Spiking-YOLO DC-SPP-YOLO SpeechYOLO Complexer-YOLO SlimYOLOv3 REQ-YOLO YOLO Nano xYOLO IFQ-Tinier-YOLO DG-YOLO Poly-YOLO E-YOLO PP-YOLO 一、概述 我对yolo系列好感较高,虽不及其他系列的精度,速度,但是他现在已经精度与速度之中做了trade off ,侧端也友好。本文引自我爱计算机视觉,后续我将对这些算法消融对比,关注公众号(原文底部)敬请期待。 YOLO目标检测算法诞生于2015年6月,从出生的那一天起就是“高精度、高效率、高实用性”目标检测算法的代名词。 在原作者Joseph Redmon博士手中YOLO经历了三代到YOLOv3,今年初Joseph Redmon宣告退出计算机视觉研究界后,YOLOv4、YOLOv5相继而出,且不论谁是正统,这YOLO算法家族在创始人拂袖而出后依然热闹非凡。 本文带领大家细数在此名门之中自带“YOLO”的算法,总计 23 项工作

yolov5 简单教程

不打扰是莪最后的温柔 提交于 2020-08-18 07:42:15
该库代表Ultralytics对未来对象检测方法的开源研究,并结合了以前的YOLO库 https://github.com/ultralytics/yolov3在自定义数据集上训练了数千个模型而得到的最佳实践。**所有代码和模型都在积极的开发中,如有修改或删除,恕不另行通知。**如果使用,风险自负。 GPU速度测量:使用V100的GPU在超过5000张COCO val2017图像上测量批处理大小为8的平均每张图像的端到端时间,包括图像预处理,PyTorch FP16推断,后处理和NMS。 2020年6月22日 : PANet 更新:新的特性,更少的参数,更快的推理和改进的mAP 364fcfd 。 2020年6月19日 : FP16 作为新的默认设置,可用于更小的检查点和更快的推断 d4c6674 。 2020年6月9日 : CSP 更新:改进了速度,大小和准确性(归功于@WongKinYiu)。 2020年5月27日 :公开发布库。YOLOv5模型是所有已知YOLO实现中最先进(SOTA)的。 2020年4月1日 :未来开始发展基于 YOLOv3 / YOLOv4 的一系列PyTorch模型。 预训练的检查点(checkpoints) Model APval APtest AP50 SpeedGPU FPSGPU params FLOPS YOLOv5s 36.6 36.6 55