神经网络

斩获全球自动驾驶榜单第一!MIT曝光3D深度学习新成果,这类特斯拉驾驶隐患有望攻克

大兔子大兔子 提交于 2020-08-13 18:19:17
  “看来新鲜事物还是得有个过程,真不是闹着玩的。”   山东车主祁先生所说的 “新鲜事物”,正是他的爱车——特斯拉 Model S 100D。   据大众报业 · 齐鲁壹点报道,5 月 25 日,山东高速交警接到报警,祁先生的特斯拉轿车,与路面提示牌发生碰撞。   他说当时正在使用自动驾驶辅助模式,面对前方障碍物,车辆并未做出提醒。事后联系售后客服,得到的答复却是:“ 即使开启自动驾驶(辅助)模式,驾驶员也要全神贯注,不能完全相信该模式。 ”      图 | 祁先生的特斯拉出现轻微事故   无独有偶,6 月 1 日,台湾一辆特斯拉 Model 3 撞向货车,给本已发生侧翻的货车带来二次事故,两辆车均受到不同程度损伤。      图 | 撞向货车的特斯拉   据当事特斯拉司机黄某回忆称,当时他正在使用自动驾驶辅助功能,时速 110 公里左右,当看到侧翻货车、并进行刹车时,已经无济于事。      图 | 撞向货车后的特斯拉   近年来,车主在使用该功能时,已经引发多起事故。2016 年,美国海军海豹突击队前队员乔舒亚 · 布朗(Joshua Brown)的 Model S,因使用该模式撞上一辆卡车,最终不幸丧生。      图 | 乔舒亚 · 布朗生前照片   让人唏嘘的是,出事之前他曾在 YouTube 发布过自动驾驶如何避免撞车的视频,该视频还被特斯拉 CEO 马斯克转发

还原时代原声,AI修复老北京再次火爆全网

☆樱花仙子☆ 提交于 2020-08-13 16:56:48
点击上方“ 3D视觉工坊 ”,选择“星标” 干货第一时间送达 凭借AI修复老北京影像火爆B站的Up主大谷兄,今天又来带我们玩穿越了! 这次是1929年的老北京,除了AI上色、补帧、扩大分辨率外,还百分百还原了时代原声,老北京的味儿太足了! 人头攒动,熙熙攘攘,有赚吆喝的、看热闹的、闲聊的,老北京集市好不热闹。 大鼓、笛子、四胡、三弦,手艺人的一曲《打新春》,有内味了。 盲人"爵士"乐队 原来理发最低不是5块,还有2块的! 听他们聊天,网友表示想看相声了。 师傅:疼不疼? 小伙:不疼。我还不哭呢外带着。 小伙:这个头好,剃得不疼,剃不好,真疼,剃好了咱还找你去。 师傅:唉 ...... 如果精神小伙穿越到现在,会不会是一位优秀的Up主? 精神小伙理发记 溢出屏幕的开心劲儿,看来发型很满意。在我们这年代都不用理,用不了几年就能天然形成[傲娇] 吃饭还能这么热闹吗?我们现在都是隔着两米! 惊现“地摊经济” 3min的珍贵影像资料,可谓真真切切地感受了老北京九十年前的生活状态。虽然看起来物质生活不是很富裕,但隔着屏幕都是感受到那时候人们的欢乐。准确的来说,这段影像记录的是1927-1929年的老北京,出自南卡罗莱纳大学影像库馆藏胶片。 另外,这段影像修复视频依然出自B站Up主大谷之手,此前他曾用AI修复过1920-1927年的一段老北京影像,在B站爆火,视频点击量超过了200万

【译】十款性能最佳的压缩算法

我的未来我决定 提交于 2020-08-13 16:37:06
数据压缩是保留相同或绝大部分数据前提下减小文件大小的过程。 它的原理是消除不必要的数据或以更高效的格式重新组织数据。在进行数据压缩时,你可以选择使用有损方法或无损方法。有损方法会永久性地擦除掉一些数据,而无损方法则能保证持有全部的数据。使用哪类方法取决于你要让你的文件保持多大的精准度。 本文会为你介绍6种不同的无损数据压缩算法,以及4种基于深度学习的图像/视频压缩算法。 6款无损数据压缩算法 无损压缩算法通常被用于归档或其他高保真目的。这些算法能够让你在确保文件可被完整恢复的同时减少文件大小。有很多种无损压缩算法供你选择。下面介绍6种常用的算法: 1. LZ77 LZ77算法发布于1977年。作为很多其他无损压缩算法的基础,它使用了“滑动窗口”的概念。在这个概念中,LZ77管理了一个字典。该字典使用三元组的方式: 偏移量(Offset):短语起始处于文件开头之间的距离 行程长度(Run length):组成短语的字符数 偏离字符:表明新短语的标记符,匹配结束后,前向缓冲区中的第一个符号 当文件被解析时,字典会被实时更新以反映最新的压缩数据和大小。举个例子,如果一个文件包含字符串"abbadabba",那么被压缩到字典中的项就是"abb(0,1,'d')(0,3,'a')"。你可以看下下表的拆解过程: 这个例子中,被压缩后的数据并不比初始数据小多少。但一般情况下,当文件很长时

22课时、19大主题,CS 231n进阶版课程视频上线

不问归期 提交于 2020-08-13 16:20:47
讲 CS231n 的 Justin Johnson 在密歇根大学推出了一套计算机视觉的进阶课程。 机器之心报道,编辑:小舟、杜伟。 计算机视觉在日常生活中已经无处不在。从搜索引擎、图像理解、地图、医疗、无人机、自动驾驶到各类手机 app,都离不开计算机视觉。这些应用中有许多像图像分类和目标检测这样的视觉识别任务,而神经网络方面的进展大大提高了视觉识别系统的性能。 来自密歇根大学的 Justin Johnson 在 2019 年秋季推出了一套新的课程,该课程深入探讨了基于神经网络的计算机视觉深度学习方法的细节。这一课程近日已在 YouTube 上开放 。 课程视频链接: https://www. youtube.com/playlist? list=PL5-TkQAfAZFbzxjBHtzdVCWE0Zbhomg7r 课程概况 这套 2019 年秋季的计算机视觉课程名为「Deep Learning for Computer Vision」,课程讲授者是来自密歇根大学的 Justin Johnson。作为斯坦福大学李飞飞教授的学生,Justin Johnson 曾和李飞飞一起讲授斯坦福大学计算机视觉经典课程 CS231n。 Justin Johnson,图源:https://web.eecs.umich.edu/~justincj/。 目前, Justin Johnson

情感语音合成技术难点突破与未来展望

ε祈祈猫儿з 提交于 2020-08-13 14:40:58
Photo by Lukas from Pexels 语音技术的进步,让机器合成的声音不再顿挫、冰冷,在自然度和可懂度等方面取得了不错的成绩,但当前合成效果在合成音的表现力上,特别是语气和情感方面,还存在不足。声音如果缺少情感,何谈表现力 ,又如何能提高用户交互的意愿?本文由标贝科技联合创始人兼CTO李秀林LiveVideoStack线上分享内容整理而成。 文 / 李秀林 整理 / LiveVideoStack 回放链接:https://www.livevideostack.cn/video/sillon/ 大家好,我是标贝科技的李秀林,非常高兴能与大家分享情感语音合成的事情。 在语音交互中语音识别、语音合成、语音理解是必不可少的环节。语音识别,也就是识别用户说的话。识别完成后,系统需要理解用户语言背后的含义,我们称之为语义理解。理解到用户的诉求后,需要寻找答案并给出响应。通常情况下,我们会首先得到一份文本形式的答案,然后再将文本通过语音合成,模仿人说话的形式反馈给用户,这也就形成一轮完整的语音交互。 语音交互过程涉及语音合成,即把文字变成声音,声音是文字内容的一个信息载体。语音交互是日常生活中最常见、最被人熟悉并乐于接受的展现形式,例如:人与人说话、看电视、听收音机、与音响交互等等。体验效果的好坏,会对用户的感知造成很大影响。如果语音合成质量较好,说话效果更接近真人

又双叒来,谷歌网络嵌入函数新专利惹争议,网友:何时申请线性回归

∥☆過路亽.° 提交于 2020-08-13 13:39:45
  机器之心报道    参与:蛋酱、张倩    最近,谷歌又申请了一项深度学习算法专利,主题是「Using embedding functions with a deep network」。      对于每个深度学习研究者来说,有些算法、方法可以说是研究必备,拿来直接用也是一种日常,但如果有人申请了专利呢?   最近,谷歌一项新的 AI 专利申请再次引燃了社区对于专利问题的讨论。   该专利的摘要描述如下:    本专利适用于在深度网络中使用嵌入函数(embedding functions)的方法、系统和设备,包括在计算机存储媒介上编码的计算机程序。其中一种方法包括接收包含多个特征的输入,其中每个特征具有不同的特征类型;使用各自的嵌入函数处理每个特征以生成一个或多个数值,其中每个嵌入函数独立地运算彼此的嵌入函数,并且每个嵌入函数用于各自特征类型的特征;使用深度网络处理数值以生成输入的第一个替代表征,其中深度网络是由多个层次的非线性运算组成的机器学习模型;使用 logistic 回归分类器处理输入的第一个替代表征,以预测输入的标签。   专利界面:https://patents.google.com/patent/US10679124B1/en   这项专利的保护范围是怎样的呢?我们来看一下申请书的「权利要求(claims)」部分:    一种由一个或多个计算机执行的方法

使用python和vb控制cst进行自动化仿真之(一):环境配置

一世执手 提交于 2020-08-13 12:59:09
使用python和vb控制cst进行自动化仿真之(一):环境配置 做微波的童鞋会经常用到cst进行仿真。我有个朋友最近一个课题需要使用cst仿真大量数据,这些数据对应的一部分结构参数要求随机生成,这样就没办法使用扫参。cst自带了vb(visual basic)编程环境,可以使用vb脚本编程控制cst实现自动仿真。得到这些数据后,会被用到pytorch中作为神经网络的训练数据。 cst2020 提供了python编程接口,也提供了在pyhon环境中执行vb脚本的接口,如此一来,数据获取和训练都可以在pyhon中进行。不仅非常方便,而且将来可以实现模型参数的自动优化。(cst2020破解版安装包获取以及破解教程可以参考这个链接: https://www.bilibili.com/read/cv4982729/ ) 1.cst参考文档 每个版本的cst都带了非常非常全的参考文档,我们想知道的都在里面。打开cst自带的help文档,找到 automation and scripting,就可以看到关于python控制接口的详细介绍。 2.创建 python3.6虚拟环境 cst2020的python包是基于python3.6的,为了能够在pycharm中同时使用cst的接口和完整的python接口,需要先使用conda创建一个python3.6的虚拟环境(请事先安装好conda)。 打开

人工智能真的有那么神秘么,推荐一份机器学习入门书单搞定它!

﹥>﹥吖頭↗ 提交于 2020-08-13 11:50:30
​ 机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。 它是人工智能的核心,是使计算机具有智能的根本途径。 2020年,似乎没有哪一个方向能比机器学习还要火热了,即使我们不打算从事算法方向,了解一点机器学习的基础知识也不是什么坏事,这一份书单,将带你入门基础的机器学习知识。 机器学习系列书单 ​ 图解机器学习   《图解机器学习》用丰富的图示,从ZUI小二乘法出发,对基于ZUI小二乘法实现的各种机器学习算法进行了详细的介绍。第Ⅰ部分介绍了机器学习领域的概况;第Ⅱ部分和第Ⅲ部分分别介绍了各种有监督的回归算法和分类算法;第Ⅳ部分介绍了各种监督学习算法;第Ⅴ部分介绍了机器学习领域中的新兴算法。书中大部分算法都有相应的MATLAB程序源代码,可以用来进行简单的测试。 作者简介   杉山将,1974年生于大阪。东京工业大学计算机工程学博士毕业,现为东京大学教授、日本国立信息学研究所客座教授。主要从事机器学习的理论研究和算法开发,以及在信号和图像处理等方面的应用。2011年获日本信息处理学会长尾真纪念特别奖。著有《统计机器学习》、DensityRatioEstimationinMachineLearning等

如何让AI理解数学?Facebook神经网络通过“语言翻译”求解数学难题

落爺英雄遲暮 提交于 2020-08-13 11:43:46
云栖号资讯:【 点击查看更多行业资讯 】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 近年来,随着 AI 的崛起,神经网络一词也不断出现在人们的视线中。事实上,神经网络并不是什么新兴词汇。 早在 70 多年前,神经网络就被 AI 前沿的工作人员用来探索人类大脑的运作模式—— 人类大脑里有着数十亿的神经元相互连接,形成错综复杂的生物神经网络,负责处理各种感官数据,并作出相应的应激反应,使我们从不断尝试的反馈中总结经验,收获新知。同样,AI 中的“神经网络”也是通过相互连接的不同层面过滤处理大量的数据,通过自我学习,做出相应的预测或模式识别。 由于神经网络在 AI 中的决定性地位,以及它面临各种棘手的问题时表现出的强大到几乎无所不能的潜力,神经网络被推崇成“无所不能”的存在。 其中,最具有代表性的问题就是模式识别(pattern recognition)问题。或许你没听说过这个专业术语,但你一定熟悉通过模式识别衍生出许许多多功能强大的应用:比如,如何让 AI 给出地道而不是呆板的翻译,如何让手机相册自动识别并标记照片中反复出现的面孔,甚至包括让 AI 学习下围棋并战胜世界冠军等等,这些都离不开模式识别技术的强大助推。 模式识别,通过计算机技术自动地或半自动(人机交互)地实现人类的识别过程。这里,模式是这样定义的:为了能让机器执行识别任务

王家林大咖清华新书预发布:《企业级AI技术内幕:深度学习框架开发+机器学习案例+Alluxio解密》之盘古人工智能框架多层次神经网络的实现

倾然丶 夕夏残阳落幕 提交于 2020-08-13 09:21:51
本文是王家林大咖清华大学新书《企业级AI技术内幕:深度学习框架开发+机器学习案例+Alluxio解密》第2.1章节的内容,清华大学出版社将于9月份出版新书。 目录 盘古人工智能框架引言 盘古人工智能框架 盘古人工智能框架代码实战 实现神经网络的节点结构 新书预发布 新书 前 言 盘古人工智能框架引言 2017年3月21日,王家林大咖在硅谷,利用三个月的时间,于2017年6月22日实现了盘古人工智能框架,在该框架中实现了基本的ANN(Artificial Neural Network)和CNN(Convolutional Neural Network),那时还没实现RNN(Recurrent neural Network),但是实现了另外两个特别重要的算法,一个是自动编码(AutoEncoders),还有一个是非监督学习玻尔兹曼机算法(Boltzmann_ Machines),二者都跟推荐系统相关。对于深度学习中的算法,神经网络算法是必须掌握的,CNN、RNN等都是基于神经网络算法延伸出来的,包括自动编码算法,也是基于神经网络的算法延伸出来的。自动编码算法、玻尔兹曼机算法在实际中可用于推荐系统,在Facebook、谷歌、亚马逊的各种应用场景都可以看见推荐系统的身影;深度学习在图片识别、声音识别中可能暂时不那么重要。从2017年6月开始,用了将近10个月的时间