计算机视觉

中国AI青年科学家:当天才遇上烟火气

淺唱寂寞╮ 提交于 2020-07-25 00:29:52
云栖号资讯:【 点击查看更多行业资讯 】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 编者按:本文来自微信公众号“南方人物周刊”,36氪经授权发布。 来源 | 南方人物周刊(ID:Peopleweekly) 文 | 吴绵 图片来源 | 视觉中国 5月,上海商场四处是“五五购物节”的促销海报。全民消费浪潮下,朱明杰不忘和海外的朋友分享薅羊毛心得。十分钟后,他把朋友拉进了“MJ和他的朋友们一起拼多多”微信群。 作为深度网购用户,朱明杰和今天的中国消费者们在手机上看到什么、买到什么,会如何在技术的指引下走向未来生活,从某种意义上说,正是由他自己,以及和他一样的科学家们对算法的突破所决定的。 6月16日,朱明杰和他的前同事卢策吾等15位中国AI科学家、创业者,在《Nature》机器智能子刊联名发表了一篇论文,讨论人工智能在中国的应用和前景。这篇文章在国际科技界引发了诸多讨论,被称为“中国青年科学家的集体亮相”。 三年前,《麻省理工科技评论》首次针对中国评选了35岁以下的未来科技创新领军人物,这大概是西方世界最早开始好奇中国的这群“天才科学家”。 在西方媒体看来,中国正在成长中的这群青年人与上一辈有诸多不同。而这些不同,也即将改变中国——这个仅用三十年便穿越农业和工业社会,马不停蹄奔向信息技术革命前沿的国度。 这些35岁左右的AI科学家,曾经就是“别人家的孩子”

5行代码,快速实现图像分割,代码逐行详解,手把手教你处理图像 | 开源

僤鯓⒐⒋嵵緔 提交于 2020-07-24 19:09:47
云栖号资讯:【 点击查看更多行业资讯 】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 图像分割,作为计算机视觉的基础,是图像理解的重要组成部分,也是图像处理的难点之一。 那么,如何优雅且体面的图像分割? 5行代码、分分钟实现的库——PixelLib,了解一下。 当然,如此好用的项目,开源是必须的。 为什么要用到图像分割? 虽然计算机视觉研究工作者,会经常接触图像分割的问题,但是我们还是需要对其做下“赘述”(方便初学者)。 我们都知道每个图像都是有一组像素值组成。简单来说,图像分割就是在像素级上,对图像进行分类的任务。 图像分割中使用的一些“独门秘技”,使它可以处理一些关键的计算机视觉任务。主要分为2类: 语义分割: 就是把图像中每个像素赋予一个类别标签,用不同的颜色来表示。 实例分割: 它不需要对每个像素进行标记,它只需要找到感兴趣物体的边缘轮廓就行。 它的身影也经常会出现在比较重要的场景中: 无人驾驶汽车视觉系统,可以有效的理解道路场景。 医疗图像分割,可以帮助医生进行诊断测试。 卫星图像分析,等等。 所以,图像分割技术的应用还是非常重要的。 接下来,我们就直奔主题,开始了解一下PixelLib,这个神奇又好用的库。 快速安装PixelLib PixelLib这个库可以非常简单的实现图像分割——5行代码就可以实现语义分割和实例分割。 老规矩,先介绍一下安装环境

GAITC专题论坛丨AI女性:让科学绽放智慧柔美光辉

北城以北 提交于 2020-07-24 15:34:11
     020全球人工智能技术大会将于7月25-26日登陆杭州未来科技城。除了令人瞩目的大会主旨论坛,同期举行的20场专题论坛嘉宾层次高、主题范围广,聚焦模式识别、脑科学与人工智能等人工智能多个热门领域,内容精彩纷呈,观点将极具创见和现实针对性。   在国家不断鼓励创新的时代背景下,越来越多的女科学家不断坚持梦想,在科学研究中自立自强、自尊自信,绽放出耀眼光芒,真正撑起了祖国科研事业的“半边天”。7月26日上午,由北京理工大学人工智能研究院院长、特聘教授、CAAI Fellow黄河燕;澎思科技首席科学家、新加坡研究院院长申省梅担任论坛主席的 AI女性未来论坛 将拉开帷幕。当前,我国女性科学家的人数远远少于男性,科研界对科研女性的流失现象越来越重视,而激励她们继续从事科学事业显得尤为关键。敬请锁定本场论坛,让我们共同聆听“她声音”,成就“她力量”。 大会官网   扫码访问大会官网,获取最新会议动态   加入2020GAITC交流群,了解更多会议精彩内容 论坛主席       黄河燕    北京理工大学人工智能研究院院长、特聘教授    CAAI Fellow   CAAI第六、七届副理事长,CAAI女科工委主任委员;教育部计算机专业教育指导委员会副主任委员、中国中文信息学会和中国软件行业协会副理事长、信息技术新工科产学研联盟常务副理事长兼秘书长

达摩院再获自动驾驶权威测评第一,车辆可识别“厘米级”障碍物

南笙酒味 提交于 2020-05-09 17:42:22
达摩院再获自动驾驶权威测评第一。5月8日消息,在自动驾驶权威数据集Semantic KITTI上,达摩院凭借全新算法在“单帧3D点云语义分割”排行榜获得第一。该技术用于达摩院的无人物流车后,大幅提升了车辆的环境精细化理解能力,使车辆能够识别“厘米级”障碍物。 KITTI数据集是全球最权威的自动驾驶计算机算法评测数据集,为促进基于激光的语义分割研究,KITTI推出了细分数据集Semantic KITTI,通过全类别分割平均交并比(mIOU)和整体准确率(accuracy)两大指标,考察参赛者的技术能力。达摩院团队在两项指标的评比中均拿下第一。 点云(Point Cloud)是拥有三维坐标、强度等信息的激光点的集合,是计算机视觉领域常用的三维数据表示方式。自动驾驶车辆通常借助激光雷达、摄像头、毫米波雷达等传感器识别环境信息。对于激光雷达获取的周围环境的3D点云,识别每个点的语义标签,就是“3D点云语义分割”。 △ 图左为原始点云,图右为经过语义分割的点云,自动驾驶车辆辨别出了行人、车辆、树木、建筑等物体。 除了行人、车辆等常规检测目标,道路周围的建筑、绿化、不明障碍物也会影响自动驾驶车辆的驾驶行为,3D点云语义分割技术的目标,便是帮助车辆更精细地理解道路环境。 达摩院自动驾驶实验室资深算法专家卿泉介绍,业界通用的点云局部上下文特征建模方法难以满足自动驾驶实时、精准的感知需求

Serverless 实战:用 20 行 Python 代码轻松搞定图像分类和预测

爷,独闯天下 提交于 2020-05-09 17:17:14
图像分类是人工智能领域的一个热门话题,通俗来讲,就是根据各自在图像信息中反映的不同特征,把不同类别的目标区分开。图像分类利用计算机对图像进行定量分析,把图像或图像中的每个像元或区域划归为若干个类别中的某一种,代替人的视觉判读。 在实际生活中,我们也会遇到图像分类的应用场景,例如我们常用的通过拍照花朵来识别花朵信息,通过人脸匹对人物信息等。通常,图像识别或分类工具都是在客户端进行数据采集,在服务端进行运算获得结果。因此,一般都会有专门的 API 来实现图像识别,云厂商也会有偿提供类似的能力: 华为云图像标签 腾讯云图像分析 本文将尝试通过一个有趣的 Python 库,快速将图像分类的功能搭建在云函数上,并且和 API 网关结合,对外提供 API 功能,实现一个 Serverless 架构的 " 图像分类 API"。 入门 ImageAI 首先,我们需要一个依赖库: ImageAI 。 什么是 ImageAI 呢?其官方文档是这样描述的: ImageAI 是一个 python 库,旨在使开发人员能够使用简单的几行代码构建具有包含深度学习和计算机视觉功能的应用程序和系统。 ImageAI 本着简洁的原则,支持最先进的机器学习算法,用于图像预测、自定义图像预测、物体检测、视频检测、视频对象跟踪和图像预测训练。ImageAI 目前支持使用在 ImageNet-1000 数据集上训练的 4

Banana Pi BPI-EAI80 AIoT 开源硬件物联网AI开发板.

泄露秘密 提交于 2020-05-09 16:01:36
BPI-EAI80 AIoT 开发板采用格力零边界EAI80芯片设计.支持Dual-Cortex M4F@200MHz 500DMIPS和AI-NPU:CNN-NPU @300 MHz 300GOPS. 支持LVDS屏接口和摄像头接口,板载wifi,方便的做各种AI物联网应用。 目标应用 语音控制-关键字实时控制 计算机视觉-物体和生物(脸,身体,姿势)的检测和识别,vSLAM 终端AIoT -边缘计算,信息。安全,离线设备控制,系统监控 传感器、考勤机、广告显示、可穿戴设备、智能无人零售 家庭和建筑自动化-白色家电,暖通空调,照明,安全系统,物联网网关 工业计算- EBS, plc, M2M, T&M,Auto-factory, HMI控制总成,二维码 电机控制和功率转换- VFC,FOC, 3D/热敏打印机,ADAS,无人机,机器人 STEM教育 硬件规格 CPU Dual-Cortex M4F@200MHz 500DMIPS AI-NPU:CNN-NPU @300 MHz 300GOPS 2D Graph :Dual-Camera Max SDRAM 8M LCD 1024*768 TFT-LCD CANBUS 2.0 A/B ESP8266 Wifi onboard 40PIN GPIO (share with LCD ) 2 Mic support Size:

学术分享丨深度学习在术前手术规划中的应用

我只是一个虾纸丫 提交于 2020-05-09 15:34:00
  随着学会的队伍不断发展壮大,分支机构的发展愈发完善,丰富多彩的分支活动与学术分享也频频呈现。疫情期间,CAAI认知系统与信息处理专委会积极倡导学会“疫情防控不放松,学习充电不间断”的理念,邀请年轻学者结合本专委会自身领域研究精选相关文献进行研究与再解读,与大家分享《深度学习在术前手术规划中的应用》。   外科手术的进步对急性和慢性疾病的管理,延长寿命和不断扩大生存范围都产生了重大影响。如图1所示,这些进步得益于诊断,成像和外科器械的持续技术发展。这些技术中,深度学习对推动术前手术规划尤其重要。手术规划中要根据现有的医疗记录来计划手术程序,而成像对于手术的成功至关重要。在现有的成像方式中,X射线,CT,超声和MRI是实际中最常用的方式。基于医学成像的常规任务包括解剖学分类,检测,分割和配准。      图1:概述了流行的AI技术,以及在术前规划,   术中指导和外科手术机器人学中使用的AI的关键要求,挑战和子区域。 1、分类   分类输出输入的诊断值,该输入是单个或一组医学图像或器官或病变体图像。除了传统的机器学习和图像分析技术,基于深度学习的方法正在兴起[1]。对于后者,用于分类的网络架构由用于从输入层提取信息的卷积层和用于回归诊断值的完全连接层组成。   例如,有人提出了使用GoogleInception和ResNet架构的分类管道来细分肺癌,膀胱癌和乳腺癌的类型[2]

仅需少量视频观看数据,即可精准推断用户习惯:腾讯、谷歌、中科大团队提出迁移学习架构PeterRec

柔情痞子 提交于 2020-05-09 13:20:00
仅从一个人的抖音、快手、腾讯视频的观看记录里,我们能发现什么?近日,腾讯看点研发团队、Google London 和中科大的研究工作首次证实,仅依靠用户视频新闻观看记录,就可以精确地推测出用户的各种个人信息信息,包括但不限于用户年龄段、性别、喜好、人生状况(例如单身/已婚/怀孕等)、职业、学历等信息,甚至是否有心理抑郁暴力倾向。目前,这篇论文已经被信息检索领域顶级国际会议 SIGIR 接受为长文章。 机器之心发布,机器之心编辑部。 推导迁移学习对计算机视觉和 NLP 领域产生了重大影响,但尚未在推荐系统广泛使用。虽然大量的研究根据建模的用户-物品交互序列生成推荐,但很少有研究尝试表征和迁移这些模型从而用于下游任务(数据样本通常非常有限)。 在本文中,研究者深入研究了通过学习单一用户表征各种不同的下游任务,包括跨域推荐和用户画像预测。优化一个大型预训练网络并将其适配到下游任务是解决此类问题的有效方法。但是,微调通常要重新训练整个网络,并优化大量的模型参数,因此从参数量角度微调是非常低效的。为了克服这个问题,研究者开发了一种参数高效的迁移学习架构「PeterRec」。 论文链接: https:// arxiv.org/pdf/2001.0425 3.pdf PeterRec 可以快速动态地配置成各种下游任务。具体来说,PeterRec 通过注入一些小型但是极具表达力的神经网络

Visual Question Answering: Datasets, Algorithms, and Future Challenges文章翻译

寵の児 提交于 2020-05-09 10:34:45
Abstract 视觉问答(VQA)是计算机视觉和自然语言处理领域的一个新问题,引起了深度学习、计算机视觉和自然语言处理领域的极大兴趣。在VQA,一种算法需要回答基于文本的图像问题。自2014年第一个VQA数据集发布以来,已经发布了更多数据集,并提出了许多算法。在这篇综述中,我们从问题表述、现有数据集、评估指标和算法等方面批判性地考察了VQA的现状。特别是,我们讨论了当前数据集在正确训练和评估VQA算法方面的局限性。然后我们详尽地回顾现有的VQA算法。最后,我们讨论了VQA和图像理解研究未来可能的方向。 1 Introduction 计算机视觉和深度学习研究的最新进展使许多计算机视觉任务取得了巨大进展,如图像分类[1,2),物体检测[3,4],和活动识别[5,6,7]。给定足够的数据,深度卷积神经网络可以与人类进行图像分类的能力相媲美[2]。由于众包,带注释的数据集在规模上迅速增加,类似的结果也可以预期用于其他聚焦的计算机视觉问题。然而,这些问题范围狭窄,不需要对图像的整体理解。作为人类,我们可以识别图像中的物体,理解这些物体的空间位置,推断它们的属性和彼此的关系,并且在给定周围环境的情况下推断每个物体的用途。我们可以对图像随意提问,也可以交流从图像中收集的信息。 直到最近,开发一种能够回答关于图像的任意自然语言问题的计算机视觉系统一直被认为是一个雄心勃勃但棘手的目标。然而

人工智能全栈要学多久 用Python入门怎么样

走远了吗. 提交于 2020-05-09 10:30:09
  人工智能全栈要学习多久?用Python入门怎么样?目前,人工智能被列入国家战略和超级风口,国内外许多科技巨头企业都纷纷成立自己的人工智能实验室,人工智能行业是未来发展的重中之重。许多人都想来学人工智能,人工智能全栈学习时长多久呢?下面一同来看看吧。   一般来说,人工智能全栈学习时间在五个月左右,要有权威资深师资阵容,业内极具责任心、懂教学、拥有超强技术、有大型项目经验实战派讲师授课,由业内知名专家及企业技术骨干组成。   那么,你知道学人工智能可以从事哪些岗位吗?你知道人工智能将创造什么规模的市场吗?到2030年人工智能预计将创造七万亿美元规模的大市场!又可以新增无数个就业岗位,但是你能不能找到自己的位置呢?   而且人工智能主要使用语言是python,因为python的开发效率非常高,而且类库丰富,特别适合人工智能。目前我国人工智能人才缺口特别大,人工智能人才需求量远远大于供应量,竟然出现月薪四万都找不到合适的人才。   学会人工智能你可以从事这些岗位哦!AI算法工程师、AI机器学习软件工程师;AI语音工程师、AI游戏工程师;计算机视觉算法工程师、智能驾驶全栈部署软件工程师;高级前端工程师…这些还只是一部分而已,相信随着人工智能的发展,对人工智能人才的需求量会越来越大! 来源: oschina 链接: https://my.oschina.net/u/4418449