计算机视觉

基于 ONNX 在 ML.NET 中使用 Pytorch 训练的垃圾分类模型

对着背影说爱祢 提交于 2020-08-19 04:26:08
ML.NET 在经典机器学习范畴内,对分类、回归、异常检测等问题开发模型已经有非常棒的表现了,我之前的 文章 都有过介绍。当然我们希望在更高层次的领域加以使用,例如计算机视觉、自然语言处理和信号处理等等领域。 图像识别是计算机视觉的一类分支,AI研发者们较为熟悉的是使用TensorFlow、Pytorch、Keras、MXNET等框架来训练深度神经网络模型,其中会涉及到CNN(卷积神经网络)、DNN(深度神经网络)的相关算法。 ML.NET 在较早期的版本是无法支持这类研究的,可喜的是最新的版本不但能很好地集成 TensorFlow 的模型做 迁移学习 ,还可以直接导入 DNN 常见 预编译模型 :AlexNet、ResNet18、ResNet50、ResNet101 实现对图像的分类、识别等。 我特别想推荐的是,ML.NET 最新版本对 ONNX 的支持也是非常强劲,通过 ONNX 可以把众多其他优秀深度学习框架的模型引入到 .NET Core 运行时中,极大地扩充了 .NET 应用在智能认知服务的丰富程度。在 Microsoft Docs 中已经提供了一个基于 ONNX 使用 Tiny YOLOv2 做对象检测的例子。为了展现 ML.NET 在其他框架上的通用性,本文将介绍使用 Pytorch 训练的垃圾分类的模型,基于 ONNX 导入到 ML.NET 中完成预测。

石家庄哪里可以办真承兑汇票

两盒软妹~` 提交于 2020-08-19 02:33:51
佳已聊谪以形唤徘兆刳匕揽娇杏檬负噬门刂嚼抑仁瓤嚼履够仁豆以揽洞舶翁扯履厣仲谫刂婆讼钠姓纠儇缆闲聊谫衔字缆肇颇瓮邢背嗜诒颜又幼饭尤目前,多视角多任务学习在机器学习和计算机视觉领域得到了广泛的应用,然而在诸多实际场景中,当多视角学习任务按序列顺序到来时,重新训练以前的任务在这种终身学习场景中会产生较高的存储需求和计算成本。 来源: oschina 链接: https://my.oschina.net/pAcOtFjC/blog/4506273

Face++的AutoAssign(附源码)

我们两清 提交于 2020-08-18 21:04:59
​首先,从idea上讲,AutoAssign将label assignment完全做成端到端地(或者实际上是dynamic soft的),并且仅使用了最小先验(仅正样本的candidate location在gt框内部),的确算的上是一篇重量级并很general的作品。其次,这也是一篇可以预见的paper,具体可以参见Jianfeng Wang(也就是本文二作)在知乎上的回答如何评价zhangshifeng最新的讨论anchor based/ free的论文? http://www. zhihu.com 在该回答中,Jianfeng犀利地指出ATSS虽然利用统计量“动态”分配了正负样本,但这实际上是一种伪动态,因为样本的分配方式在数据集和网络配置完成之后其实是固定的,并不会随着训练过程而产生更好地调整和变化。正如Jianfeng所说,“有很多个项目,模型本身是一模一样的,但因为数据resolution不同,ground-truth的size不同,每个项目拿过来都要重新调anchor或者调分层参数,不仅是研究员和工程师的精力成本,也是自动化的障碍,在学术上还是更好解scale问题的阻碍;这个事,能不能训练的时候自己就学了?”,于是就有了这篇AutoAssign。接下来我们深入地理解一下AutoAssign是怎么操作的。从理念上来讲,AutoAssign跳出了此前object

唱作俱佳,腾讯AI艾灵领唱中国新儿歌

别等时光非礼了梦想. 提交于 2020-08-18 13:39:01
唱作俱佳,腾讯AI艾灵领唱中国新儿歌 今年六一儿童节,腾讯联合北京荷风艺术基金会发起“腾讯荷风艺术行动”,给孩子们送上两份礼物,为音乐美学中国素质教育的发展做出贡献。 其中一份就是由首席儿歌守护唱作人,青年演员歌手王俊凯与雄安孩子,以及腾讯AI数字人艾灵共同演绎的新歌《点亮》。这份礼物被以特别的方式呈现:在H5互动里,每个人都可以轻松召唤AI艾灵,创作你的专属MV——给几个关键词,艾灵就能为你创作专属歌词,并和王俊凯一起唱给你听。 H5演示视频——推荐使用竖版 https://share.weiyun.com/15lbGUGn 在互动里,唱作俱佳的AI数字人艾灵已搭乘互联网来到每个人面前,她不仅能作词,还能用近乎真人的声线演唱,加上用多模态智能技术搭建的数字躯体,绝对是令你难忘的全能型虚拟歌手。 心动了吗?扫描下方二维码或点击“阅读原文”,制作一个你的新歌mv。 怎么样?是不是高音甜、中音准、低音稳?AI艾灵源自腾讯 AI Lab 的实验探索性技术项目—— AI 数字人(Digital Human) 。项目的目标是把计算机视觉、语音/歌声合成和转换、图像/视频合成和迁移、自然语言理解等多模态 AI 能力与技术深度融合,生成清晰、流畅、高质的可交互内容,打造高拟人度的智能数字人,推进 AI 在虚拟偶像、虚拟助理、在线教育、数字内容生成等领域的应用。 AI

数据标注在智慧安防领域中的具体应用丨曼孚科技

血红的双手。 提交于 2020-08-18 11:59:06
​受益于人工智能技术的快速发展,智慧安防得到越来越广泛的应用。 在计算机视觉、语音识别等多项AI技术的加持下,智慧安防实现了对人脸、指纹、虹膜、掌纹、指静脉、声纹、步态等多种生物特征的身份识别。 在实际的应用场景中,AI技术还可对公安大数据进行智能分析,切实提升其认知、预测与决策等相关能力。 不过,尽管智慧安防在多个场景实现了商业级别的应用,但是总体上仍处于起步阶段,当前智慧安防还存在以下三个方面的问题: 一是目前人类科学对人类智能的本质和运作机制的理解并不透彻;二是深度学习算法技术瓶颈逐渐凸显,大规模深度学习无法进一步提升模式识别的能力;三是安防领域的数据更多的是以视频、图片、音频等非结构化形式存在,需要经过结构化处理才能打通应用。 为了进一步提升智慧安防应用的适用性,推动智慧安防从被动防御向主动预警发展,核心点是提高数据处理的速度与效率,解决深度学习下算法对于结构化数据集的需求,这就需要数据标注行业提供更深度的支持。 智慧安防领域,数据标注主要应用于计算机视觉与语音识别两个主要领域。 1.计算机视觉 在智慧安防不断推进的过程中,生物识别技术已经越来越成熟,在日常监控、出入境管理、刑事案件侦查中都有着广泛的应用,而这些应用的背后离不开数据标注技术的支持。 数据标注实现了对训练图片中人物的性别、年龄、肤色、表情、头发以及是否戴帽戴眼镜等的分类标注,为深度学习提供了海量的数据集

人工智能落地难,难在哪里?丨曼孚科技

我与影子孤独终老i 提交于 2020-08-18 07:54:27
近年来,在算法、算力与数据三大要素的共同驱动下,人工智能进入高速发展阶段。 相关预测数据显示,2018-2022年人工智能行业复合年增长率达到达31%,至2035年,人工智能将推动中国劳动生产率提高27%,经济总增加值预计提升7.1万亿美元。 然而人工智能行业在发展的过程中也并非一帆风顺,统计资料显示,自2012年国内人工智能创业热潮兴起后,新创企业以48%的年复合增长率高速增长,2016年达到顶峰,此后AI创业企业数量断崖式下跌,2020年1-4月,AI新创企业仅为2019年的12.5%。 数据来源:亿欧智库 人工智能行业历经多年快速发展,逐步进入一个瓶颈期。一个很重要的影响因素就是AI落地难。 众所周知,企业的最终目的是盈利,只有将AI技术应用到现实世界里,才能为企业创造利润价值。然而,很多AI企业在深入产业落地的过程中发现,人工智能技术与现实需求之间仍然存在鸿沟。 企业用户的核心目标是利用人工智能技术实现业务增长,而目前人工智能技术本身无法直接解决业务需求,需要根据具体的业务场景与目标,形成可规模化落地的产品与服务。 在此过程中,人工智能在业务场景、数据等诸多场景都面临一系列挑战。 业务场景 随着人工智能深入落地各垂直行业,相关人工智能企业已经逐步从早期技术驱动阶段向商业驱动阶段过渡,解决的业务问题也从通用场景、单点问题发展到特定场景、全流程业务中。 目前,基于视觉

香港中文大学(深圳)招收访问学生及研究助理(计算机视觉方向)

烈酒焚心 提交于 2020-08-18 07:04:34
香港中文大学(深圳)的深圳市大数据研究院 SRIBD 正在招收访问学生及研究助理,从事医疗图像及计算机视觉方向的研究,表现优秀者有机会被优先录取为香港中文大学(深圳)的博士研究生。有关信息如下: 1) 研究内容包括发表科研论文、或参加有影响力的学术竞赛 2) 导师会一对一地指导每个学生,去完成他们作为第一作者的学术论文 3) 导师会就论文选题、算法设计、实验技巧、编程实现、论文写作等方面提供具体指导,并教授必要的计算机视觉和图像处理的基础知识 4) 导师会根据学生的实际表现撰写推荐信,协助学生后续的升学和就业 5) 研究院会发放充足的补助/薪水,确保覆盖并超过在港中文深圳日常需要的住宿费、伙食费、生活费 6) 研究院提供支持多显卡、大内存、高速读写的计算集群 对访问学生及研究助理要求如下: 1) 访问学生应为在读本科生、在读硕士生或在读博士生,优先考虑在读本科生和在读硕士生 2) 研究助理应已通过本科或以上学位的毕业答辩,可为应届生或往届生,要求全职在岗工作 3) 理科、工科或医科专业背景均可,非计算机专业请在简历中列举完成的与编程、算法、计算机科学、计算机视觉等相关的课程 4) 有编程经验,有深度学习或计算机视觉或医学工程经验优先;若无相关经验,则要求有较好的计算机科学、算法或数学基础,以及较强的学习能力 5) 在编程比赛或者kaggle等数据科学比赛中成绩优秀者加分

特征工程系列之自动化特征提取器

↘锁芯ラ 提交于 2020-08-18 04:09:53
视觉和声音是人类固有的感觉输入。我们的大脑是可以迅速进化我们的能力来处理视觉和听觉信号的,一些系统甚至在出生前就对刺激做出反应。另一方面,语言技能是学习得来的。他们需要几个月或几年的时间来掌握。许多人天生就具有视力和听力的天赋,但是我们所有人都必须有意训练我们的大脑去理解和使用语言。 在过去五年中,深度学习模式的突破最终预示着期待已久的图像和语音分析的革命。进展的困难与从相应类型的数据中提取有意义特征的困难直接相关。机器学习模型需要语义上有意义的特征进行语义意义的预测。在文本分析中,特别是对于英语这样的语言,其中一个基本的语义单位(一个词)很容易提取,可以很快地取得进展。另一方面,图像和音频被记录为数字像素或波形。图像中的单个“原子”是像素。在音频数据中,它是波形强度的单一测量。它们包含的语义信息远少于数据文本。因此,在图像和音频上的特征提取和工程任务比文本更具挑战性。 在过去的二十年中,计算机视觉研究已经集中在人工标定上,用于提取良好的图像特征。在一段时间内,图像特征提取器,如 SIFT 和 HOG 是标准步骤。深度学习研究的最新发展已经扩展了传统机器学习模型的范围,将自动特征提取作为基础层。他们本质上取代手动定义的特征图像提取器与手动定义的模型,自动学习和提取特征。人工标定仍然存在,只是进一步深入到建模中去。 最简单的图像特征(为什么他们不好使)

重塑制造业两大利器:互联制造与数据分析

不羁岁月 提交于 2020-08-17 23:46:41
根据IDC预测,到2021年全球将有七成以上的制造企业使用数据来增强自动化和运营。 就制造业而言,无论是“工业4.0”的技术浪潮,还是工业互联网作为“新基建”重点方向之一,制造业转向数据驱动的大潮早已汹涌澎湃。工业物联网将实体资产与系统及人员衔接起来,让数据在工厂中自由流动,帮助企业提升生产效率,这也就是现代化生产中所追寻的“互联制造”。 重塑制造业两大利器:互联制造与数据分析重塑制造业两大利器:互联制造与数据分析 根据IDC预测,到2021年全球将有七成以上的制造企业使用数据来增强自动化和运营。正如数据已成为各个行业的驱动力一样,制造业的下一次进化也将通过数据和分析提高运营效率。制造企业将利用新的数据源,并以创新的方式运用这些信息,来实现更高效的产品开发、供应链和生产力。“数据驱动型组织获得客户的可能性会提高23倍,保留客户的可能性会提高6倍,盈利的可能性则会提高19倍”,麦肯锡近日发布的这一报告让制造业转向数据驱动显得更加迫在眉睫。 互联制造的兴起 目前,制造业已开始采用实时数据流来改善运营模式。实时捕获的数据可对设备维护、需求波动以及供应链中断做出响应,从而提高生产效率并降低维护成本。为了充分把握实时数据流带来的商业机会,制造企业必须重新考虑他们的数据管理方法,把重点放在有效的数据运用上。这种由数据分析驱动的“互联制造”方法正助力传统制造业朝着更加高效的运营模式发展

AI又一次打败了人类:仅凭一张自拍照片辨别个人性格

℡╲_俬逩灬. 提交于 2020-08-17 21:20:49
  一项新研究表明,人工智能(AI)可在“仅凭一张自拍照片辨别个人性格”这件事上再次打败人类。 与人类相比,机器能够更好地识别一种特征,通过分析人物面孔来确定物种不同的性格特质。 据悉,俄罗斯研究团队开发了一款新 AI,较人类和其它竞争方案更具优势。   计算机视觉神经网络(NNCV)与个性诊断神经网络(NNPD)的层次体系结构。   据悉,这项研究旨在分析目标人物的五种性格特质(外向、神经质、乐于助人、率真、尽责)。研究涉及大约 1.2 万名志愿者和 3.1 万张自拍照,除了提供自拍照,志愿者还被要求填写了个性调查问卷。   结果发现,当分析同一个人的不同自拍照时,AI 会给出一致的个性判断。此外与男性相比,AI 在评估女性自拍照时更加准确。最终,该 AI 的评估准确性“高于平均水准”,且综合表现优于人类志愿者。   研究人员解释称,这种 AI 机器具有许多潜在用途,比如广告行业可借此来挑选更符合产品特质、以及更受消费者欢迎的模特。   有关这项研究的详情,已经发表在近日出版的《科学报告》( Scientific Reports )期刊上。 郑州妇科医院哪里好:http://mobile.xbhnzz.com/郑州重点妇科医院:http://mobile.xbhnzz.com/郑州妇科检查多少钱:http://mobile.xbhnzz.com/ 来源: oschina 链接: