计算机视觉

ほら!2020年诺贝尔物理学奖颁布

假装没事ソ 提交于 2020-10-16 08:17:16
点击上方“ 迈微AI研习社 ”,选择“ 星标★ ”公众号 重磅干货,第一时间送达 当地时间10月6日,瑞典皇家科学院常任秘书戈兰·汉松宣布,将2020年诺贝尔物理学奖一半授予罗杰·彭罗斯(Roger Penrose),“因为发现黑洞的形成是对广义相对论的有力预测”。另外一半授予莱因哈德·根泽尔(Reinhard Genzel)和安德里亚·格兹(Andrea Ghez),因为在银河系中心发现了一个超大质量的致密天体,总奖金为1000万瑞典克朗(约合760万人民币)。 罗杰·彭罗斯爵士,英国数学物理学家、牛津大学数学系名誉教授。他在数学物理方面的工作拥有高度评价,特别是对广义相对论与宇宙学方面的贡献。 莱因哈德·根泽尔,德国天体物理学家,出生于巴特洪堡。 安德里亚·格兹,美国天文学家,加州大学洛杉矶分校物理学和天文学教授。 因新冠肺炎疫情,本次活动诺贝尔委员会对进入瑞典皇家科学院会场的人数进行了严格控制,全场人数不超过30人,并在进场时为每个人发放一个口罩。 来源:央视新闻 推荐阅读 (点击标题可跳转阅读) 英伟达开源「Imaginaire」:九大图像及视频合成方法,你学fei了吗? YouTube视频推荐系统为什么那么强?看了这篇文章你就知道了 尝试混搭,告别格子衫,这个GAN帮你展示真人高清混搭效果 让大卫雕塑跳舞、蒙娜丽莎说话,英伟达视频合成有如此多「骚操作」 MaiweiAI

计算机视觉学习之路(目录)------你想要的都在这里了

生来就可爱ヽ(ⅴ<●) 提交于 2020-10-16 07:51:15
计算机视觉学习之路------你想要的都在这里了 (根据自己的学习进度后期不断更新哟!!!) 一、OpenCV+TensorFlow入门人工智能图像处理基础 1.anaconda一站式环境的搭建(anaconda、tensorflow、opencv) 2.两个问题解答、opencv、tensorflow、numpy、matplotlib的基本使用 3.图像处理之几何变换 二、OpenCV学习 三、TensorFlow学习 四、Numpy学习 五、matplotlib学习 持续更新中。。。。。。 来源: oschina 链接: https://my.oschina.net/u/4398177/blog/4437657

创建CV数据集总共分几步?这款移动端APP帮你分分钟完成

二次信任 提交于 2020-10-15 01:28:36
  机器之心报道    参与:陈萍、魔王    创建数据集涉及许多费时费力的工作,那么有没有办法能够轻松实现数据集创建呢?这款不久前上架 Google Play 的 APP,可以让你在移动端轻松创建计算机视觉数据集。   数据集是进行模型训练的前提,它的质量直接影响到后续模型的准确率。   目前我们可以在网络上搜索到大量制作好的数据集,那么如何快速制作属于自己的数据集呢?   最近有一款简易小工具 Manthano 在 Google Play 上架了。这款 APP 支持在移动端直接操作, 几分钟内即可创建自己的计算机视觉数据集,并支持在任何需要的地方做数据标注 。      Manthano APP 界面及功能展示。   如果你刚刚涉足计算机视觉领域,或者要做目标检测方面的研究,那么这款 APP 非常适合你创建属于自己的 CV 数据集。   数据集的制作离不开三步:   收集图像   标注图像   下载标注   这三步看起来简单,实则工作量巨大。单就图像注释这一块就要耗费大量的人力、物力,因为训练模型需要的数据量可以从几百张到几十万张图片不等。   因此,简单便捷的图像标注工具显得尤为重要。这款标注工具 Manthano 支持从手机或 Web 界面(app.manthano.ai)上传图像,进而创建数据集。      Manthano 下载链接:https://play

数据采集,AI产业落地的“助推器”丨曼孚科技

末鹿安然 提交于 2020-10-15 00:45:28
算法、算力与数据是构成人工智能的三个基本要素。随着人工智能技术在算法与算力层面达到阶段性基本成熟,人工智能行业掀起一轮落地应用的热潮。 从技术层面分析,本轮人工智能落地热潮主要集中于计算机视觉领域和语音交互领域,较为依赖机器学习领域中的深度学习方式。​ 目前,主流的深度学习方式以有监督学习模式为主。在该模式下,算法训练需要依靠标注数据对学习结果进行反馈,对于数据有着强依赖性需求,这也带动了AI基础数据服务行业的繁荣。 AI基础数据服务是指为AI算法训练及优化提供相关产品与服务,主要以数据集产品和数据资源定制服务为主,具体包括数据采集、数据清洗和数据标注等内容。 其中,数据采集是指对目标领域、场景的特定原始数据进行采集的过程,采集的数据以图像类、文本类、语音类、视频类等非结构化数据为主。从业务流程角度来看,数据采集是AI基础数据服务行业全流程服务中的“第一步”,采集到的非结构化数据经过清洗与标注,才能被用于机器学习训练。 因此数据采集业务也是众多数据服务企业较为核心的业务之一,一家优秀的数据采集服务企业应当具备如下优势: 1.拥有丰富的采集渠道 采集的数据按照不同类型可以划分为图像、语音、文本、视频等内容,每一个大类又可以细分为众多小类。 以语音采集为例,按照语种的不同,可细分为普通话采集、方言采集、英语采集、小语种采集等,这对数据采集服务企业的采集覆盖能力提出了极高的要求。

一稿多投被拒稿,确实是你的错

可紊 提交于 2020-10-14 16:03:09
     作者 | 陈彩娴   编辑 | 青暮   今天,加拿大滑铁卢大学(University of Waterloo)的计算机系教授Gautam Kamath在推特上发文,谈到ICLR 2021拒绝了三篇论文投稿,原因是:一稿多投。这三篇论文的作者将投稿至ICLR 2021的同篇论文也投到了AAAI 2021。      注:“Desk-Rejected”(直接拒稿)指没有经过送审给同行而被编辑直接拒稿。   ICLR 20201直接拒稿页面链接:https://openreview.net/group?id=ICLR.cc/2021/Conference#desk-rejected-submissions   一稿多投是指同一作者或同一研究群体的不同作者,在编辑和审稿人不知情的情况下,试图或已经在两个或多个会议同时或相继发表内容相同或相近的论文。   严禁“一稿多投”/“双重提交”(no dual-submission rule)是各个顶会的硬性规定,但每年仍有许多投稿作者会犯同样的错误。   事实上, 严禁“一稿多投”不仅是顶会的规定,也是绝大多数正式会议、期刊投稿的规定 。   据AI科技评论了解, 各个出版期刊之间、顶会之间的数据库都是共享的 ,类似于国内的知网查重(当然操作要高级很多~)。   除了“一稿多投”, 在同一个顶会/期刊投多篇内容重合度与相似度很高的文章

不限机型,手机端实时玩转3D、混合现实,快手Y-tech有黑科技

一世执手 提交于 2020-10-13 06:44:57
  机器之心报道    机器之心编辑部   深度是实现 3D 场景理解的重要信息,快手 Y-tech 利用自研的单目深度估计技术获得了高质量的深度信息,并将模型部署到移动端,结合 Y-tech 已有的多项技术研发了 3DPhoto、混合现实等多种新玩法。这些黑科技玩法不限机型,可让用户在手机上无门槛的实时体验,给用户带来全新的视觉体验和交互方式的同时,可帮助用户更好的进行创作。      这项研究主要探究了如何更好的利用三维空间的结构性信息提升单目深度估计精度,此外还针对复杂场景构建了一个新的深度数据集 HC Depth,包含六种挑战性场景,有针对性地提升模型的精度和泛化性。该论文已被 ECCV 2020 收录,论文代码和模型即将在 GitHub 上开源,作者也将在 8 月 23-28 日的 ECCV 大会线上展示他们的工作。      论文链接:https://arxiv.org/abs/2007.11256   代码链接:https://github.com/ansj11/SANet    单目深度估计的挑战   从 2D 图像恢复 3D 信息是计算机视觉的一个基础性问题,可以应用在视觉定位、场景理解和增强现实等领域。在无法通过深度传感器或者多视角获得有效的深度测量时,单目深度估计算法尤为重要。传统方法通常使用先验信息恢复图像的深度信息,例如纹理线索,物体尺寸和位置

《落地之路:硅谷无人驾驶产品心经》_5折AI产品书籍推荐(截止本周日7月12日)

社会主义新天地 提交于 2020-10-12 04:59:02
无人驾驶,是一个非常明确的长期AI赛道,但目前仍处在技术思维主导的早期阶段 ;硅谷的无人驾驶公司已达60多家,却仍然没有一个公司能将无人车正式规模性地落地…… 很惊喜的,最近我发现了一本 AI产品经理视角 的相关书籍——《 落地之路:硅谷无人驾驶产品心经 》。 作者 @车袁 ,在 硅谷多家知名无人驾驶公司 带领过产品开发团队,在计算机视觉、高精地图、仿真平台、安全验证等多个领域从0到1打造过产品,可以说是无人驾驶领域的资深PM。 这本书,现在5折促销价 44.5元 ——据出版社的编辑朋友介绍, 5折活动到本周日(明天)就截止了 。感兴趣的同学,可以点击链接具体查看—— 《落地之路:硅谷无人驾驶产品心经》_5折AI产品书籍推荐(截止本周日) ​ mp.weixin.qq.com 注:由于公众号的文本编辑体验较好,大家直接看上面这个链接即可,我就不重复编辑了:) 来源: oschina 链接: https://my.oschina.net/u/4345306/blog/4357490

智能海滩、泳池来了!AI溺水防护系统实时跟踪、风险预测、自动警报

懵懂的女人 提交于 2020-10-12 04:57:43
云栖号资讯:【 点击查看更多行业资讯 】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 如今,人工智能(AI)在生活中的应用场景可谓百变多样。从医学诊断、图像识别、无人驾驶到个人助理、教育辅助,AI 的对现代生活的重要性不言而喻。然而,除了以上场景,AI 还可以应用于安全防护方面。 这不,眼看着炎炎夏日来临,人们纷纷涌向游泳馆、海滩等消暑胜地,渴望在灼热温度中寻求一丝“透心凉”的快感。但人生就是这样,你永远不知道明天和意外哪一个先来。尤其在热浪滚滚的夏日,游泳溺亡的意外事故层出不穷。 根据世界卫生组织(WHO)的数据,溺水是造成全球人口意外死亡的第三大原因,全球每年估计有 320,000 人因溺水而死亡。但现在,有了 AI 的帮助,溺水事故率很可能得到大幅降低。 近日,以色列内盖夫本古里安大学(BGU)的衍生企业 Sightbit,就针对频发的溺水事故,开发出一套 AI 溺水防护系统,该系统可以实时监测所有游泳者,并标记出潜在的危险情况,以弥补救生员肉眼观察的不足。 AI 海滩监控 Sightbit 的系统包含多组摄像头,这些摄像头并非普通相机,而是加持了基于深度学习和计算机视觉技术的软件。增强后的多组摄像头更加灵敏,能够清晰地显示出摄像范围内的所有物体。 而且,这种摄像机的摄像范围也大大提高,单个摄像机可以伸展到大约 1000 英尺(300 米)的海岸线。要知道

打造四大AI平台:腾讯优图的视觉AI To B打法

蹲街弑〆低调 提交于 2020-10-12 02:00:24
   腾讯的 AI 与产业互联网已进入全新发展阶段,优图实验室的视觉智能在其中将发挥怎样的作用?   「人工智能本身就是一场跨国跨学科的探索,正在将人类的认知推向更快更高更强,也势必带给我们一场前所未见的科技和产业革命,」在近日在上海举行的世界人工智能大会 WAIC 2020 上,马化腾对人工智能的未来发出了这样的预测。   今天,AI 技术正变得无所不在,新基建和产业互联网将为各行各业的发展带来新增量。面对新的发展机遇,腾讯提出了全新的战略,而腾讯优图实验室在其中正扮演着重要角色。   「我们可以看到,视觉 AI 相关应用业务正在飞速增长,这反映了企业端的人工智能技术需求正在释放,」腾讯优图实验室副总经理黄飞跃表示。    四大 AI 平台齐亮相   在 7 月 10 日的 WAIC 大会上,腾讯提出的「双引擎 + 双轮」驱动人工智能发展新形式再次引来人们的关注。与此同时,腾讯优图一口气发布了应用 视觉 AI 能力的四大平台:AI 泛娱乐平台、广电传媒 AI 中台、内容审核平台和工业 AI 平台,成为了大会的亮点。      在 WAIC 2020 上,腾讯优图实验室总经理吴运声进行了「新基建新生态下的计算机视觉」的主题演讲。   首先是泛娱乐平台,依托腾讯在社交娱乐产品上的丰富实践,优图在人脸融合、人像分割、人像变化、美颜美妆等方面积累了丰富的泛娱乐基础能力

MNIST数据集下载及可视化

只愿长相守 提交于 2020-10-12 01:57:34
MNIST数据集介绍 MNIST数据集官网: http://yann.lecun.com/exdb/mnist/ MNIST数据库是非常经典的一个数据集,就像你学编程起初写一个“Hello Word”的程序一样,学Deep Learning你就会写识别MNIST数据集的Model。 MNIST数据集是由0〜9手写数字图片和数字标签所组成的,由60000个训练样本和10000个测试样本组成,每个样本都是一张28 * 28像素的灰度手写数字图片。如下图所示。 MNIST数据库一共有四个文件案,分别为 1. train-images-idx3-ubyte.gz :训练集图片(9912422字节),55000张训练集,5000张验证集 2. train-labels-idx1-ubyte.gz :训练集图片对应的标签(28881字节), 3. t10k-images-idx3-ubyte .gz :测试集图片(1648877字节),10000张图片 4. t10k-labels-idx1-ubyte.gz :测试集图片对应的标签(4542字节) 图片是指0〜9手写数字图片,而标签则是对应该图片之实际数字。 MNIST 数据集下载及可视化 TensorFlow提供了一个库可以对MNIST数据集进行下载和解压。具体的是使用TensorFlow中input_data.py脚本来读取数据及标签