深度学习

科学怪物!3D人体全身运动捕捉系统,港中文联合Facebook出品

老子叫甜甜 提交于 2020-10-01 09:10:14
点击上方“ 3D视觉工坊 ”,选择“星标” 干货第一时间送达 作者 | VVingerfly 编辑 | 陈大鑫 3D人体姿态和形状估计在最近几年是一个重要的研究热点,但大部分工作仅仅关注人体部分,忽略了手部动作,港中文联合Facebook AI研究院提出了一种从单张图片同时估计人体姿态和手部动作的新方法,展示效果好似科学怪物。 如下图左下和右下所示,易看出本文提出的方法姿态估计效果更好。 1 介绍 本文作者提出了一个3D人体全身运动捕捉系统 FrankMocap,能够从单目视频同时估计出3D人体和手部运动,在一块GeForce RTX 2080 GPU上能够达到 9.5 FPS。 作者提到 “FrankMocap” 是对现代普罗米修斯 (The Modern Prometheus)中科学怪人 (Frankenstein) 的怪物的致敬。 人们每天会拍大量的日常活动视频上传到网络,如果有一种基于普通摄像头的运动捕捉系统,能够捕捉视频中人体的运动,将在人机交互、人工智能、机器人等众多方向有所应用。 同时捕捉人体和人手的运动对这些应用同样重要,但人手只占身体的很小一部分,要想直接捕捉两者的运动是一个很难的问题。当前的大部分相关工作都只顾及图片中人体的3D姿态,忽略图片中人手的动作。有部分工作关注从单张图片同时估计人体的全身运动,但这些工作都是基于优化的方法

揭秘798UCCA百度AI沉浸式互动展!十一北京新打卡地标

孤街醉人 提交于 2020-10-01 08:41:11
  见惯了 AI+教育,AI+医疗,AI+交通这些严肃又朴实的各种落地应用, 那么当AI遇见艺术,又会是怎样一种存在?   第一认知和答案或许是春节用AI机器人写对联,用AI画幅人像、抽象画,再高深一些用AI整首小诗或小说。   当然这都是开发者用人工智能能力在当下或者前期探索艺术的各种尝试,无可非议。      但就在刚刚,我们看到这样一种可能,将AI+艺术的表象、品质和定调大幅的拉升,用一场大展的形式,规模化全量的展现在大众面前,让人们得以置身其中,捕捉到AI+艺术的魅力悬念。   这里说的正是百度作为首席AI技术合作伙伴的“非物质 / 再物质:计算机艺术简史”大型群展,也是数字艺术有史以来最大规模的展览。   9月26日,在UCCA尤伦斯当代艺术中心已经正式开启。同期,百度与UCCA Lab联合策划的“百度AI沉浸式互动艺术体验展”也精彩呈现。   融合技术、艺术和情感的沉浸式互动体验,你的一举一动,将与AI激荡,迸发新的想象力。      新芒X在第一时间进行了探访,在惊叹其大胆的想象力和天马行空的艺术表现形式的同时,更对百度用世界级的AI能力,不遗余力帮助人类拓展想象的边界,突破生物性的局限,更好的探索世界的意愿,深感敬意。   我们也试图通过视频,图文等形式,将那些打动人心的、无与伦比的部分体验记录分享,一起感受有了百度AI的沉浸式艺术体验展有多惊艳。   此外

腾讯IEG开源AI SDK:自动化测试吃鸡、MOBA类游戏

青春壹個敷衍的年華 提交于 2020-10-01 06:54:33
  机器之心报道    SDK 还能自动玩游戏?这个 SDK 有点「酷」。      近日,腾讯互娱(IEG)开源了一款名为 GAME AI SDK 的自动化测试平台,该平台封装好了多种工具供开发者使用,目前支持的游戏类型有跑酷类、吃鸡类、射击类、MOBA 类等。   项目地址:https://github.com/Tencent/GameAISDK      平台内置的「天天酷跑」示例。左图为未训练随机做动作,右图是训练好的效果。   SDK(软件开发工具包)一般是软件工程师为特定的软件包、软件框架、硬件平台、操作系统等创建应用软件时可使用的开发工具集合。   似乎有些抽象。在实际项目中,我们只需记住,SDK 是手游渠道提供的,集成了用户登录、社区功能、社交分享功能、数据后台统计功能的功能模块。接入 SDK 后,游戏厂商和渠道都要对 SDK 包进行测试,测试通过才能上线。   看了上文展示的酷跑动图效果,是不是想上手试试吃鸡类、射击类的游戏体验呢?这个开源项目可以满足你的需求,它支持使用者进行项目接入以及二次开发。    AI SDK 平台   AI SDK 平台是一个基于游戏图像来开发游戏 AI 的开源工具包。工具包主要完成了 UI 检测、游戏内元素识别、AI 算法(DQN、IM)等功能。开发者可以基于此工具包完成游戏自动化测试。   目前该平台已支持的游戏类型有跑酷类、吃鸡类

重磅直播|基于格雷码结合相移技术的高鲁棒性高效率动态三维面形测量

ぃ、小莉子 提交于 2020-10-01 05:00:44
点击上方“3D视觉工坊”,选择“星标” 干货第一时间送达 大家好,本公众号现已开启线上视频公开课,主讲人通过B站直播间,对3D视觉领域相关知识点进行讲解,并在微信群内完成答疑。 往期精彩: 第一期:东北大学李奇 《基于深度学习的物体抓取位置估计》 第二期:上海交通大学沈毅君 《相机标定的基本原理与经验分享》 第三期:西安交通大学潘浩洋 《基于点云的三维物体表示与生成模型》 第四期:北京科技大学李阳阳《 求职经验分享 》 第五期:ChaucerG《 聊聊目标检测和秋招那些事 》 第六期:镭神智能创始人雷祖芳《 基于激光雷达的感知、定位导航应用 》 第七期:东北大学龚益群《 图像对齐算法 》 第八期:武汉大学李迎松博士《 立体视觉之立体匹配与实战 》 第九期:北京中科慧眼CTO崔峰《 深度相机与应用 》 第十期:博众精工技术总监杨军超《 结构光编码与三维重建技术 》 第十一期:熵智科技高磊博士 《结构光3D相机光机核心技术及3D成像性能分析》 第十二期:河海大学研究生李子宽 《大规模点云可视化技术》 主讲人对该领域的核心和主流技术进行了详解,干货满满,线下的答疑更是赢得了同学们的好评。 本期由四川大学三维传感与机器视觉实验室博士生吴周杰分享,分享的主题为 《 基于格雷码结合相移技术的高鲁棒性 高效 率动态三维面形测量 》 ,主讲人会对该领域的核心和主流技术进行详细讲解

重磅:辽宁副省长获"中国版诺贝尔奖" !2020未来科学大奖揭晓

元气小坏坏 提交于 2020-10-01 04:50:44
点击上方“ 3D视觉工坊 ”,选择“星标” 干货第一时间送达 转载自: 科研大匠 9月6日上午,被誉为“中国版诺贝尔奖”的 2020未来科学大奖 获奖名单揭晓。每个奖项的单项奖金100万美金 (约700万元人民币) ,使用方式不受限制。 图源:2020未来科学大奖官网 其中: “生命科学奖”获得者: 张亭栋 ( 哈尔滨医科大学第一附属医院 ) 王振义 ( 上海交通大学 ) “物质科学奖” 获得者: 卢柯 (中国科学院金属研究所) “数学与计算机科学奖”获得者: 彭实戈 (山东大学) 在今年的获奖者中,有两位高龄获奖者—— 张亭栋 (88岁)和 王振义 (96岁) , 王振义教授 也以96岁高龄成为未来科学大奖自创立以来年龄最大的获奖者。在获奖感言中, 王振义教授 的话感人肺腑又令人深思 (感言全文详见下文) ,他说: “ 我 96 岁了,很快就要离开这个世界。 为什么不奖励年轻人呢? 我觉得有一个问题: 我们 (在评审) 政策方面有一个缺陷, 因为它 不是鼓励有理想的年轻人、苦苦工作几十年的人,而是看论文 (发表情况), 看他有没有高级期刊论文。 “ 我忧愁的地方是, 年轻人跟上来的不够。 这跟我们的政策有关,我们的政策是看论文,而不是看实际的工作能力。” 同时,本次大奖还有一点备受关注的是,获得 “物质科学奖” 的中国科学院金属研究所研究员、中科院院士 卢柯 ,同时还是

2020云栖大会丨云基础设施赋能——打造新技术下的企业核心竞争力

青春壹個敷衍的年華 提交于 2020-10-01 03:30:49
随着技术变革的不断加速,新技术的成功应用成为企业在竞争中的制胜法宝。 创新技术助力新制造 实现工业仿真领域不可估量的价值 2017年底上海汽车集团股份有限公司乘用车分公司(以下简称上汽乘用车)携手阿里云、泛云科技建设业内首个laaS混合型工业仿真计算服务平台上汽仿真计算云SSCC。依托阿里云,上汽乘用车实现了工程开发仿真能力升级,仿真计算效率提升了25%,使工程开发人员更加专注于产品设计和性能优化,从而打造出世界级高品质的产品。 创新技术走进生命科学 全力加速药物研发过程 全球健康药物研发中心GHDDI将阿里云超算技术融入新冠药物研发,实现高通量分子筛选。原来药物研发的分子对接、分子动力学模拟、深度学习模型训练的工作需要几天的计算时间,借助阿里云的高性能计算服务E-HPC,全球健康药物研发中心(GHDDI)的计算工作时间缩短到了几个小时,计算速度提升了8到20倍,极大地提升了药物研发的效率。 阿里云高性能计算(EHPC)团队协助中山大学使用阿里云计算服务进行生信科学计算,提供 104 核处理器,相比线下服务器,数据组装、比对性能提升 25% 以上。在性能与资源的双重支持下,原本每个病例的测序结果需要 12 个小时左右的分析时间,在阿里云上的缩减到了 2 个小时,大大提高了工作效率,加快了研究进程,也为抗疫赢得了时间。 创新技术进入影视特效 提升作业效率,引领行业创新升级 MORE

解析KDTCN:知识图谱和深度学习模型联合实现股票预测

十年热恋 提交于 2020-10-01 02:55:48
背景概述 今天看了一篇论文我觉得挺有意思,一方面是讲的股票预测相关,另一方面是把深度学习和知识图谱相结合解决一个问题。通常知识图谱和深度学习很少有交集,一般是独立发展的两个人工智能领域解决问题的手段,两者如何一起解决问题呢?这个也引发了我的好奇心,因为一直对知识图谱这个领域念念不忘,在《机器学习实践应用》最后一章还要特意加入知识图谱的内容。 论文的名字叫:<Knowledge-Driven Stock Trend Prediction and Explanation via Temporal Convolutional Network>有兴趣的同学可以下载来自己也看一看。 股票预测的历史难题 KDTCN其实是KD和TCN的缩写,KD指的是Knowledge-Driven,也就是知识图谱。TCN是Temporal Convolutional Network,字面意思是临时卷积网络。其实在量化领域,已经有很多成熟的模型了,比如最早的Arima,到后来的RNN,再到LSTM,这些模型都是把股票预测看作是一组结构化的时间序列的时序预测问题。 KDTCN的出现,肯定是为了解决股票预测领域的一些痛点,我觉得有两点。其一是重大突发事件对股价的影响,如果单一把股票预测看成时间序列问题,一些突发问题的影响其实很难通过时序分析得到。比如喜闻乐见看到的,川普Twitter信息导致股价大跌:

国产开源,GitHub 标星 47000+ ,百度飞桨从打响第一枪到战役突围

不羁岁月 提交于 2020-10-01 00:02:34
作者 | 阿司匹林 出品 | AI科技大本营(ID:rgznai100) 封图 | CSDN付费下载自视觉中国 打响第一枪:占领高地 从 PaddlePaddle 到飞桨 2016 年,百度 PaddlePaddle 打响了国产 AI 框架开源的第一枪。 作为最早研究深度学习技术的公司之一, 百度早在 2013 年即设立了深度学习研究院,并于 2016 年正式开源深度学习框架 ,而 PaddlePaddle 也身负百度抢占人工智能时代高地的重要使命。 2018 年 7 月,李彦宏在百度 AI 开发者大会上喊出了要让“Everyone Can AI”的口号,其实这句口号后面还要加上一个限定——“通过百度的 AI 平台”。 这也意味着,PaddlePaddle 就是这场攻坚战中的突破点之一。 2019 年 4 月,时任百度高级副总裁(现百度 CTO)王海峰在 Wave Summit 深度学习开发者峰会上,为深度学习框架 PaddlePaddle 在百度内部的战略地位进行了定调。 PaddlePaddle 发布中文名“飞桨” , 开始强调自己更懂中国开发者,以及更加专注于深度学习模型的工业生产和部署。 随着 AI 成为国家战略,在自主可控的号召下,作为底层的深度学习框架更受关注,相比于国内的同行,百度更早的迈出了这一步,也就有了先发优势。 经过 4 年的发展,飞桨在 GitHub

【中文分词系列】 5. 基于语言模型的无监督分词

耗尽温柔 提交于 2020-10-01 00:02:16
转载:https://spaces.ac.cn/archives/3956/ 迄今为止,前四篇文章已经介绍了分词的若干思路,其中有基于最大概率的查词典方法、基于HMM或LSTM的字标注方法等。这些都是已有的研究方法了,笔者所做的就只是总结工作而已。查词典方法和字标注各有各的好处,我一直在想,能不能给出一种只需要大规模语料来训练的无监督分词模型呢?也就是说,怎么切分,应该是由语料来决定的,跟语言本身没关系。说白了,只要足够多语料,就可以告诉我们怎么分词。 看上去很完美,可是怎么做到呢? 《2.基于切分的新词发现》 中提供了一种思路,但是不够彻底。 那里居于切分的新词发现方法确实可以看成一种无监督分词思路,它就是用一个简单的凝固度来判断某处该不该切分。但从分词的角度来看,这样的分词系统未免太过粗糙了。因此,我一直想着怎么提高这个精度,前期得到了一些有意义的结果,但都没有得到一个完整的理论。而最近正好把这个思路补全了。因为没有查找到类似的工作,所以这算是笔者在分词方面的一点原创工作了。 语言模型 首先简单谈一下语言模型。 很多数据挖掘的读者都已经听说过Word2Vec,知道它是一个能够生成词向量的工具,很多人也知道将词向量作为模型的特征来进行输入。但相信不少读者不知道为什么会有词向量,为什么Word2Vec能生成词向量。Word2Vec本身的光芒(Google出品、速度快、效果也不错

印刷质量缺陷的视觉检测原理概述

▼魔方 西西 提交于 2020-09-30 16:57:27
点击上方“计算机视觉工坊”,选择“星标” 干货第一时间送达 本文转载自「计算机视觉工坊」,该公众号重点在于介绍深度学习、智能驾驶等领域,一个小众的公众号。 一、应用背景 印刷品作为产品包装的一种主要形式,具有外观精美、清洁卫生、成本低廉、使用方便等优点,在众多行业得到了广泛的应用,其特点是材质多样、工艺复杂、质量要求高。 在本问题域中,印刷品主要涉及三个主要类型:不干胶标签、烟盒包装和塑料薄膜软包装。其中,不干胶标签主要包括:药品标签、电子产品标签、日化品标签、食品标签;烟盒包装包括:软盒包装和硬盒包装;塑料薄膜软包装主要包括:药品包装、食品包装、日化品包装。标签、烟包和软包装典型的产品图像如图1~图3所示。 图 1 药品标签 图 2 烟包 图 3 塑料软包装 印刷品生产过程中可能会产生各种各样的缺陷,如墨点、异物、文字残缺、漏印、色差、套印不准、脏点、刀丝、拖墨、划伤、溢胶、气泡等。这些缺陷一旦出现在产品包装上,产品视觉观感将大打折扣,严重影响产品的品牌、降低客户满意度。 目前,印刷企业主要以频闪灯照明、人工粗略局部抽检进行质量控制。由于人眼的局限性,质量得不到有效控制。随着用户对产品品质要求的不断提高以及行业竞争的加剧,传统的以人工抽检为主的质量检测手段已经严重制约了企业竞争力的提高,用自动化质量检测设备代替人工是必然趋势。 目前,市场中已经出现了多种自动化质量检测系统