计算机视觉

阿里云视觉AI应用创新赛开启——技术公开篇之AlibabaWood

跟風遠走 提交于 2020-07-28 17:58:30
移动互联网时代以来,人工智能(AI)技术不断发展和完善,不断展现出巨大的商业潜力,并开始在各行各业落地开花,其中计算机视觉AI技术发展最快应用最广。阿里云为响应国家“加快新型基础设施建设“的号召,以“无行业不AI“为主题,特此举办阿里云视觉AI应用创新赛,为行业应用及解决方案落地提供展示创意和想法的舞台。 本次大赛向全行业开发者用户开放,针对优秀人才、优秀作品提供百万现金奖池,为创业人才提供包括阿里巴巴资源对接与扶持、技术培训和上云指导以及导师帮助等与初创企业相关的综合服务。同时为协助本次赛事,阿里云将会与参赛者共享阿里内部视觉AI开发的实践经验,从技术,资金,资源三方面帮助企业实现场景落地。 本文将会通过解析AlibabaWood视频生产工具的算法来介绍视觉AI技术在新零售电商领域中的应用,为参赛人员开发视觉AI应用提供一种可行的思路。 AlibabaWOOD介绍 AlibabaWOOD是阿里云为了提升电商营销视频制作效率和质量而推出的工具。在电商平台,投放商品视频展示可以增加信息传播途径提升引流曝光,针对同一商品,是否投放视频展示对各关键指标影响非常大,如下图所示。 图1 单一商品图像款对比视频款 但传统的批量视频制作通常依赖于设计师提前制作的固定模板,且大批量生产的视频通常千篇一律,缺乏感染力。为了解决这一问题,AlibabaWOOD充分利用目前最先进的AI技术

使用谷歌AI Open Images进行对象检测

生来就可爱ヽ(ⅴ<●) 提交于 2020-07-28 13:36:58
帮助计算机“ 看到 ”的技术被称为“ 计算机视觉 ”。近年来,由于计算能力的爆炸使得深度学习模型更快且更可行,计算机视觉应用正变得越来越普遍。亚马逊、谷歌、特斯拉、 Facebook 和微软等许多公司都在大力投资这项技术及其应用。 计算机视觉任务 我们主要专注于两种 计算机视觉任务 - 图像分类和对象检测。 图像分类侧重于将图像分组为预定义的类别。为了实现这一点,我们需要拥有我们感兴趣的类别的多个图像,并训练计算机将像素数转换为符号。这只是说计算机看到一张猫的照片,并说它里面有一只猫。 对象检测利用图像分类器来确定图像中存在的内容和位置。通过使用卷积神经网络( CNN ),这些任务变得更容易,可以在一遍扫描图像的过程中检测多个类别。 关于这些任务的区别的更多细节,请参考下面的文章 计算机视觉很酷! 认识到未来许多有趣的数据科学应用程序将涉及处理图像,我的团队和我决定尝试参加托管在 Kaggle 上的 Google AI Open Image 挑战赛。我们认为这是一个极好的机会,亲自应用神经网络和卷积,并可能给我们的教授和同学留下深刻的印象。该挑战赛为我们提供了 170 万个图像,其中包含 1200 个对象类的 1200 万个边界框标注(它们相对于图像的X和Y坐标)。你可以在这里 ( https://www. figure-eight.com/datase t/open-images

自动驾驶定位技术-粒子滤波实践

ぃ、小莉子 提交于 2020-07-28 13:24:21
点击上方“ 3D视觉工坊 ”,选择“星标” 干货第一时间送达 作者:william 链接:https://zhuanlan.zhihu.com/p/128521630 本文转载自知乎专栏:自动驾驶全栈工程师,作者已授权,未经许可请勿二次转载。 Particle Filter - Kidnapped vehicle project Github: https://github.com/williamhyin/CarND-Kidnapped-Vehicle Email: williamhyin@outlook.com 1. Definition of Particle Filter 粒子滤波器是贝叶斯滤波器或马尔可夫定位滤波器的实现。粒子过滤器基于“适者生存的原理”主要用于解决定位问题。粒子滤波的优势在于易于编程并且灵活。 三种滤波器的性能对比: 正如你在上面的图片中看到的,红点是对机器人可能位置的离散猜测。每个红点都有 x 坐标、 y 坐标和方向。粒子滤波器是由几千个这样的猜测组成的机器人后验信度表示。一开始,粒子是均匀分布的,但过滤器使他们生存的比例正比于粒子与传感器测量的一致性。 1.权重(Weights): 粒子滤波器通常携带离散数量的粒子。每个粒子都是一个包含 x 坐标、 y 坐标和方向的矢量。颗粒的存活取决于它们与传感器测量结果的一致性

3小时极致学习AI开发,WAIC开发者日有一堂必上公开课

℡╲_俬逩灬. 提交于 2020-07-28 12:34:52
  2020 年,人工智能商业化落地全面加速。百度,作为国内人工智能领军企业,围绕最早开源的自研 AI 框架飞桨,在人工智能开发领域有着长期高强度的投入。   今年 5 月份的「WAVE SUMMIT 2020」深度学习开发者峰会上,百度飞桨发布包括端到端图像分类开发套件 PaddleClas 在内的 7 项开源新品、23 项重要升级,全面助力开发者进行人工智能开发。   除了全新发布,面向中小企业,飞桨企业版 EasyDL 全新升级,预置丰富网络和模型,提供零门槛、便捷高效的开发。对企业开发者而言,EasyDL 可谓是一站式开发利器。   在 EasyDL 开发平台之外,2017 年百度 AI 开发者大会上也曾发布对话系统定制平台 UNIT,搭载了业界领先的对话理解与对话管理技术,可以帮助开发者赋予产品智能对话的交互能力。2019 年,UNIT 升级到 3.0 版本,提供强大的智能对话解决方案。   纵深布局人工智能技术十数年,开发者一直是百度极为重视的力量。当前百度飞桨累积开发者数量已超过 190 万,服务企业数量达到 84000 家,发布模型数量已超过 23 万个。   为了更好的服务广大开发者,帮助大家快速学习掌握人工智能技术。在今年 WAIC 开发者日期间,机器之心将联合百度组织「开发者日百度公开课」,为广大开发者提供 3 小时极致学习机会,从 NLP、CV 到零门槛

CVPR2020最新《小样本学习》综述教程,145页ppt带你学习最新FSL进展

六月ゝ 毕业季﹏ 提交于 2020-07-28 10:30:30
来源|专知 【导读】小样本学习是一类重要的机器学习方法,旨在解决数据缺少的情况下如何训练模型的问题。在CVPR2020的Tutorial,来自valeo.ai的学者给了Spyros Gidaris关于小样本学习的最新教程报告。 在过去的几年里,基于深度学习的方法在图像理解问题上取得了令人印象深刻的效果,如图像分类、目标检测或语义分割。然而,真实字计算机视觉应用程序通常需要模型能够(a)通过很少的注释例子学习,(b)不断适应新的数据而不忘记之前的知识。不幸的是,经典的监督深度学习方法在设计时并没有考虑到这些需求。因此,计算机视觉的下一个重大挑战是开发能够解决这方面现有方法的重要缺陷的学习方法。本教程将介绍实现这一目标的可能方法。小样本学习(FSL)利用先验知识,可以快速地泛化到只包含少量有监督信息的样本的新任务中。 https:// annotation-efficient-learning.github.io / 目录内容: 概述 小样本学习种类 度量学习 带记忆模块的元学习 基于优化的元学习 学习预测模型参数 无遗忘小样本学习 来源: oschina 链接: https://my.oschina.net/u/4397965/blog/4318125

最新《生成式对抗网络》技术综述课程,70页ppt带你学习GAN进展

对着背影说爱祢 提交于 2020-07-28 09:16:19
来源|专知 【导读】慕尼黑大学开设的《高级深度学习》技术课程,重点介绍计算机视觉的前沿深度学习技术。最新一期介绍了《生成式对抗网络》进展,讲述了GAN的知识体系,值得关注。 https:// dvl.in.tum.de/teaching/ adl4cv-ss20/ slides下载地址: Index of /slides/adl4cv-ss20 ​ dvl.in.tum.de 来源: oschina 链接: https://my.oschina.net/u/4360424/blog/4318126

Arm中国深陷控制权之争:董事长疑被总部免职,子公司称未发生变动

家住魔仙堡 提交于 2020-07-28 07:46:33
      6月10日上午,机器之心收到安谋科技(Arm中国)有限公司就公司法定代表人、董事长以及CEO任免问题的声明,内容称: 安谋科技(中国)有限公司(简称「安谋中国」)作为在中国依法注册的独立法人,依照有关法律法规,吴雄昂先生继续履行董事长兼CEO职责。安谋中国目前运营一切正常,对中国客户和产业合作伙伴的支持和服务也一如既往。 此前,业内多处传出消息,Arm中国执行董事长兼CEO吴雄昂突然被ARM剑桥总部董事会「免职」。 对于这场Arm中国与ARM总部董事会的「争夺硝烟」,有业内人士分析, Arm中国CEO吴雄昂被「免职」,看似是公司内部个人与董事会的利益矛盾,但是背后或许有更深层次的原因,或与华为有关。 美国的全面限制政策将对ARM以及其中国区业务带来何种影响,目前尚为未知数。唯一可以确定的是,中国市场对于ARM至关重要,并且总部正在试图收拢更多控制权。    撰文 | 四月   周三一早,一场国际IP大厂的「争夺大战」就在圈内传得沸沸扬扬——Arm中国执行董事长兼CEO吴雄昂突然被ARM剑桥总部董事会「免职」。   机器之心6月10日消息,据南华早报报道, 日本软银集团公司(SoftBank Group Corp.)旗下的芯片技术公司ARM表示,其中国合资企业的首席执行官已被替换。   报道称,董事会中的大多数中国区董事投票表决将吴雄昂(Allen Wu)免职

YOLOv5是真的吗?并不比YOLOv4强,不配这个名字

坚强是说给别人听的谎言 提交于 2020-07-28 06:26:25
YOLOv4 发布不到 2 个月,一个名叫 YOLOv5 的目标检测框架横空出世,但它真的够格继承 YOLO 之名并沿用社区公认的版本号吗?工程师 Ritesh Kanjee 近日在 Medium 上通过事实与社区观点对此给出了否定答案,并批评了这种「欺世盗名」的行为。 选自Medium,作者:Ritesh Kanjee,机器之心编译,参与:Panda、蛋酱。 2020 年 4 月 23 日,YOLOv4 发布…… 2020 年 6 月 10 日,YOLOv5 又来了…… 是不是超厉害?这不正表明我们的研究和科技发展速度超快吗?毕竟这个广受欢迎的目标检测框架的新一代 v4 版本刚发布不久,下一代 v5 版本就横空出世了。YOLOv5 真的这么厉害以至于自成一代?还是说仅仅是个噱头?本文将尽可能客观地研究其中一些相关证据,看看 YOLOv5 究竟是否名副其实? 来自:https://github.com/ultralytics/yolov5 首先简单介绍一下 YOLO。YOLO 是一个实时目标检测框架,其意思是 You Only Look Once(你只看一次)。也就是说待检测的目标图像仅会通过全卷积神经网络(FCNN)一次。碍于篇幅,本文不会介绍 YOLO 的技术细节,感兴趣的读者可参阅机器之心的文章《 教程 | 单级式目标检测方法概述:YOLO 与 SSD 》及《 YOLO v4

AI+数据科学:六种方式改变体育行业

狂风中的少年 提交于 2020-07-27 23:19:32
云栖号资讯:【 点击查看更多行业资讯 】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 随着科技的发展,人工智能与数据科学已经在体育领域发挥越来越重要的作用。世界上鲜有事物无法量化,而能够量化的一切,都可以使用数据分析加人工智能的组合进行精确预测。拿体育领域来说,其中的可量化元素就非常丰富,正合适人工智能在其中大显身手。另外需要澄清的一点是,人工智能在体育领域的应用绝不仅限于提高运动员的赛场表现。毕竟现代体育运动的涵盖范围已经非常广泛,绝不仅仅体现在运动员群体身上。 下面,我们具体聊聊AI与数据科学影响体育世界的六种具体方式。 1.发现人才、招募人才 无论是棒球、橄榄球还是其他体育项目,运动队伍都在越来越多地使用运动员个人表现数据来衡量他们是否拥有良好的身体条件与发展潜力。但在筛选下一位体育巨星的过程中,单凭公开的统计数据(例如奔跑速度、射门精度或者传球水平)是远远不够的,我们需要考虑更为复杂的多因素指标。 在这方面,人类天然的局限性导致我们无法准确记录并评估这些指标。随着大数据与人工智能全面入驻体育领域,对此类成功指标的管理、记录与衡量过程也变得愈发便捷且可靠。计算机视觉、机器学习以及其他形式的AI方案利用算法分析玩家的统计数据、比赛视频以及来自各类传感器的收集信息,借此发现那些可能被教练或球探忽略掉的宝贵人才。 具体来说,AI可以使用历史数据

负起责任、审慎对待论文创新和性能指数,ACM Fellow罗杰波教授分享他的审稿经验

百般思念 提交于 2020-07-27 22:40:47
近日,AI 领域诸多顶级学术会议相继召开,各类会议期刊的论文的审阅标准也再度成为社区讨论的焦点。在本文中,美国罗切斯特大学罗杰波教授分享了他自己对如何做好审稿人的一些经验和建议。 机器之心整理,参与:杜伟、小舟。 如何客观地审阅 AI 领域的论文,以及如何确保审阅出来的论文足够公正并使论文作者没有异议呢?对于这个话题,每个研究者想必都有自己的理念和方法。 在近期举办的视觉与学习青年学者研讨会(VALSE Webinar)上,IEEE 多媒体汇刊 TMM 总编、CVPR 2012 程序委员会主席、美国罗切斯特大学计算机科学系教授罗杰波分享了《如何做一个 AI 领域审稿人》的主题报告。 机器之心对此报告的主要内容进行了整理。 首先,罗杰波教授分析了当前学术会议在审稿方面的一些普遍现象,表现在三个方面: 首先,AI 领域目前正在爆炸性地发展,许多会议的论文提交量都接近一万篇,因此需要大量的审稿人。如果一个会议有 7000 篇提交论文,每篇论文需要写 3 个 reviews,假设每个审稿人平均能够写 7 个 reviews,那么将需要 3000 个审稿人。 其次,在审稿人需求量剧增的形势下,许多新的经验不足的审稿人就加入到这个行列中,包括博士生、硕士生、本科生以及其他领域的研究人员。这也造成了一些问题,比如审稿人缺乏系统的训练,往往都是从个人经验中进行 “无监督学习”,而个人经验