深度学习

清华大学朱小燕教授新著作,《人工智能:知识图谱前沿技术》面世

瘦欲@ 提交于 2020-10-25 00:46:53
  机器之心报道    编辑:蛋酱   2020 年,人工智能技术进入更加广阔的落地期,你一定需要这本深入浅出的 “知识图谱” 书籍。      知识图谱( Knowledge Graph )以结构化的形式描述客观世界中概念、实体及其关系,将信息时代各式各样的信息表达成更接近人类认知世界的形式,提供了一种更好地组织、管理和理解的能力。知识图谱给互联网语义搜索带来了新的驱动力,同时也在自然语言处理的各种应用中显示了强大威力,已经成为互联网知识驱动的智能应用的基础设施。知识图谱、大数据、深度学习一起,成为信息时代人工智能发展的核心驱动力之一。   知识图谱技术是指知识图谱建立和应用的技术,是融合机器学习、认知计算、知识表示与推理、信息检索与抽取、自然语言处理、语义 Web 、数据挖掘等方向的交叉研究。知识图谱技术的核心内容包括知识抽取与构建,知识表示,知识推理,知识存储和查询,知识图谱应用等。   作为人工智能领域的重要方向之一,目前知识图谱技术已在医疗、教育、金融、证券投资、推荐等多个领域广泛应用,并发挥着重要价值。   在最新出版的《人工智能:知识图谱前沿技术》一书中,清华大学计算机系教授朱小燕等作者从知识和知识图谱的基本概念和模型出发,着重介绍了近代知识图谱相关技术的发展情况,特别是大规模数据、人工神经元网络,以及深度学习背景下有关知识表示、知识图谱构建

纪念机器翻译概念的诞生:重新认识瓦伦·韦弗先生

放肆的年华 提交于 2020-10-25 00:37:19
来源:AI科技评论 作者:张家俊 编辑:丛 末 机器翻译旨在利用计算机实现自然语言之间的自动翻译,一直是自然语言处理与人工智能领域的重要研究方向,近年来更是取得了突破性进展,已成为大众较为熟知和常用的技术。 现在一提起机器翻译技术的起源,对该研究领域稍有了解的人们都知道是美国的瓦伦·韦弗(Warren Weaver,后面简称韦弗)最先于1947年提出机器翻译概念并于1949年7月正式记录于名为《翻译》的备忘录。不过,可能大多数人不是特别了解韦弗究竟是何许人也以及他怎么会提出机器翻译的概念。作为机器翻译领域的一名研究者,我对这些问题非常感兴趣,也希望让更多人了解机器翻译概念诞生的那些趣事和史实。 瓦伦·韦弗 如果让大家猜测的话,可能会认为韦弗是一位从事语言翻译的学者,由于人工翻译任务繁重从而产生利用计算机进行自动翻译的想法。其实不然,他的人生经历着实会让人惊叹不已。 如果您认为他提出了机器翻译的概念已经足够伟大,那么可以再告诉您 韦弗是位数学家,二战期间曾帮助美军革新了防控火控系统和轰炸机技术,而且他首次提出了分子生物学的概念,他还与信息论之父香侬一同撰写了划时代意义的著作《通信的数学原理》 (The Mathematical Theory of Communication)。有点尴尬的发现,机器翻译似乎仅仅是他的一个小小爱好而已。 如此多不同领域的贡献竟然集中于一人之身

第10课:动手实战基于 CNN 的电影推荐系统

自古美人都是妖i 提交于 2020-10-24 22:55:28
本文从深度学习卷积神经网络入手,基于 Github 的开源项目来完成 MovieLens 数据集的电影推荐系统。 什么是推荐系统呢? 什么是推荐系统呢?首先我们来看看几个常见的推荐场景。 如果你经常通过豆瓣电影评分来找电影,你会发现下图所示的推荐: 如果你喜欢购物,根据你的选择和购物行为,平台会给你推荐相似商品: 在互联网的很多场景下都可以看到推荐的影子。因为推荐可以帮助用户和商家满足不同的需求: 对用户而言:找到感兴趣的东西,帮助发现新鲜、有趣的事物。 对商家而言:提供个性化服务,提高信任度和粘性,增加营收。 常见的推荐系统主要包含两个方面的内容,基于用户的推荐系统(UserCF)和基于物品的推荐系统(ItemCF)。两者的区别在于,UserCF 给用户推荐那些和他有共同兴趣爱好的用户喜欢的商品,而 ItemCF 给用户推荐那些和他之前喜欢的商品类似的商品。这两种方式都会遭遇冷启动问题。 下面是 UserCF 和 ItemCF 的对比: 来源: oschina 链接: https://my.oschina.net/u/4330611/blog/4633737

OpenAI 发布模型实现自动定理证明,妈妈再也不用担心我的数学?

不羁岁月 提交于 2020-10-24 20:45:11
作者 | 八宝粥 出品 | CSDN(ID:CSDNnews) OpenAI 大招频出,染指数学江湖 日前,OpenAI 研究者Stanislas Polu和Ilya Sutskever在社交媒体发布消息,宣布在预印本发布文章,展示了一个基于Transformer 的自动定理证明模型。文章表示,团队在 Metamath 库上取得了新的进展,通过将深度学习和形式系统相结合能带来更好的效果。 论文两位作者在社交网络分享发布新模型的喜悦 团队表示,GPT-f 可以自动证明 Metamath 当中23个定理。横向对比上,GPT-f 最佳模型实现 Metamath 56.22% 的保留测试集,而目前最先进的 MetaGen-IL 只有 21.16% 的证明能力。 文章还给出了数据集 set.mm 和证明助手的一个 demo: “自动定理证明”对于饱受数学困扰的同学来说简直就是大杀器,比拟“步步高点读机”,笔者不禁想到自己中学数学做题时自信地刷刷写下“证明”二字和面对高等数学挠头时候的“这也能证?”,“要是机器能帮我证明就好了”。 实际上,在数学界,确实有很多问题需要机器来帮忙。但是 GPT-f 真的是数学界的 AlphaGo 吗?数学家也要望机器兴叹了吗?似乎也并不是这样。 数学天才也需要机器 前段时间获得诺贝尔物理学奖的科学家罗杰·彭罗斯,他在数学方面有一个很有趣的贡献,就是彭罗斯密铺

太厉害了!28岁任北大博导的她,再获科学大奖!

落爺英雄遲暮 提交于 2020-10-24 19:59:20
点击上方“3D视觉工坊”,选择“星标” 干货第一时间送达 9月25日,启动资金高达10亿元的“科学探索奖”正式公布第二届获奖名单,50位青年科学家获奖。该奖项每年遴选50位获奖者,每人在未来5年获得每年60万元(税后)、累计300万元的现金资助,并可对奖金做自由支配。 值得一提的是,50位获奖者中,最年轻的是来自北京大学微纳电子学系的博士生导师黄芊芊,仅30岁。 除此之外,黄芊芊研究员在今年还获得“2019 IEEE Electron Devices Society Early Career Award”,以表彰她在超低功耗微纳电子新原理器件等方面的出色工作,和2020年度“求是杰出青年学者奖”。 而在2017年,她就入选未来女科学家计划;2018年获获国家优青项目资助;2020年获中国电子学会优秀科技工作者荣誉称号 ,这几乎把所有青年科学家所能获的奖项都囊括了,说明了她是一位非常优秀的科研工作者。 黄芊芊出生于 1989 年,2006 年从江西上饶一中考入北京大学信息科学技术学院。自从考入北京大学以来,黄芊芊一直在北京大学学习和工作。 她在本科毕业后直博,2015 年获得北京大学微电子学与固体电子学专业博士学位。 2017 年,黄芊芊北京大学博士后出站,同年正式成为北大微纳电子学系的研究员、博士生导师,当时年仅28岁。 也是在 2017 年

干货 :深入浅出神经网络的改进方法!

老子叫甜甜 提交于 2020-10-24 18:41:05
高尔夫球员刚开始学习打高尔夫球时,通常会花很长时间练习挥杆。慢慢地,他们才会在此基础上练习其他击球方式,学习削球、左曲球和右曲球。本章仍着重介绍反向传播算法,这就是我们的“挥杆基本功”——神经网络中大部分工作、学习和研究的基础。 本文将着重讲解利用交叉熵代价函数改进神经网络的学习方法。 一、交叉熵代价函数 大多数人不喜欢被他人指出错误。我以前刚学习弹钢琴不久,就在听众前做了一次首秀。我很紧张,开始时错将八度音阶的曲段演奏得很低。我不知所措,因为演奏无法继续下去了,直到有人指出了其中的错误。我当时非常尴尬。不过,尽管不愉快,我们却能因为明显的错误而快速地学到正确的知识。下次我肯定能演奏正确!然而当错误不明确的时候,学习会变得非常缓慢。学习速度下降的原因实际上也是一般的神经网络学习缓慢的原因,并不仅仅是特有的。 引入交叉熵代价函数 如何解决这个问题呢?研究表明,可以使用交叉熵代价函数来替换二次代价函数。 将交叉熵看作代价函数有两点原因。第一,它是非负的,C > 0。可以看出(57)的求和中的所有单独项都是负数,因为对数函数的定义域是(0, 1)。求和前面有一个负号。 第二,如果对于所有的训练输入x,神经元实际的输出都接近目标值,那么交叉熵将接近0。假设在本例中,y = 0而a ≈ 0,这是我们想要的结果。方程(57)中的第一个项会消去,因为y = 0,而第二项实际上就是−ln(1 −

应该怎么快速学习Python?

假装没事ソ 提交于 2020-10-24 09:45:30
如今, Python 已然成为一门网红语言 ,即使是在非编程开发者当中,也掀起了一股学习的热潮。然而,有一个问题始终摆在许多零基础学习者面前:应该怎么快速学习Python ?虽然Python 语法简单,被认为是最好学的编程语言,但是计算机小白想要学习,也有不小的难度。因此,最好的解决方式就是参加培训班,通过资深讲师的指导和专门为零基础学习者打造的课程,几个月就能上手Python 语言的开发。 为什么不建议新手自学Python,一方面初学者本来对编程就一窍不通,自学很容易走弯路,浪费时间不说,还特别打击学习者的积极性。许多人的自学过程都是从入门到放弃,完全对编程学习失去学习兴趣了。另一方面,报班的好处确实多多。只需要付了学费,就有经验丰富的讲师对你进行指导,有什么学习上的问题也可以及时解决。更重要的是,比起自己东学一点西学一点,培训机构有自己的一套系统学习方案,可以帮助学员构建一个全面的知识框架。学习进度层层深入,有主有次,可以快速掌握Python编程语言。 博学谷作为知名IT培训品牌黑马程序员的线上培训机构,汇聚了黑马程序员十几年的教学精华,在课程研发上投入了大量的财力和物力,打造出了专门为零基础学员量身定制的Python +人工智能在线就业班课程。该以Python 语言为开发工具,内容覆盖了计算机原理、网络、Web前端、后端、架构、 数据库、项目部署、数据获取、数据提取、数据清洗

ECCV2020 | SNE-RoadSeg:一种基于表面法向量提取的道路可行驶区域分割方法

拜拜、爱过 提交于 2020-10-24 06:19:41
点击上方“3D视觉工坊”,选择“星标” 干货第一时间送达 这篇文章收录于ECCV2020,是一篇关于无碰撞空间区域分割的文章,整体效果很不错。最主要的核心思想是在表面发现估计器的设计,在得到表面法线后将其用于分割网络的编码器环节,并在特征融合部分,借鉴了DenseNet的思想,进行密集连接。网络的计算量和参数量文中并没有比较,应该做不到实时。 论文地址 :https://arxiv.org/abs/2008.11351 代码地址: https://github.com/hlwang1124/SNE-RoadSeg Freespace无碰撞空间检测是自动驾驶汽车视觉感知的重要组成部分。近年来,数据融合data-fusion卷积神经网络CNN架构大大改善了语义场景分割算法的性能。通常,可以将自由空间假设为一个地面平面,在这个平面上,各点具有相似的表面法线。因此,在本文中,首先介绍了一个名为 表面法线估计器( surface normal estimator ,SNE)的新型模块,该模块可以从密集的深度/视差图像中高精度和高效率地推断出表面法线信息 。此外,提出了一种称为RoadSeg的数据融合CNN架构, 该架构可以从RGB图像和推断出的表面法线信息中提取并融合特征,以进行准确的自由空间检测。 同时,出于研究目的,我们发布了在不同光照和天气条件下收集的大规模合成自由空间检测数据集

Serverless 的 AI 写诗,程序员浪漫起来谁能顶得住啊!

|▌冷眼眸甩不掉的悲伤 提交于 2020-10-24 04:11:03
古诗词是中国文化殿堂的瑰宝,记得曾经在韩国做 Exchange Student 的时候,看到他们学习我们的古诗词,有中文的还有翻译版的,自己发自内心的骄傲,甚至也会在某些时候背起一些耳熟能详的诗词。 本文将会通过深度学习为我们生成一些古诗词,并将模型部署到 Serverless 架构上,实现基于 Serverless 的古诗词生成 API。 项目构建 古诗词生成实际上是文本生成,或者说是生成式文本。关于基于深度学习的文本生成,最入门级的读物包括 Andrej Karpathy 的博客。他使用例子生动讲解了 Char-RNN (Character based Recurrent Neural Network) 如何用于从文本数据集里学习,然后自动生成像模像样的文本。 上图直观展示了 Char-RNN 的原理。以要让模型学习写出「hello」为例,Char-RNN 的输入输出层都是以字符为单位。输入「h」,应该输出「e」;输入「e」,则应该输出后续的「l」。 输入层我们可以用只有一个元素为1的向量来编码不同的字符,例如,「h」被编码为「1000」、「e」被编码为「0100」,而「l」被编码为「0010」。使用 RNN 的学习目标是,可以让生成的下一个字符尽量与训练样本里的目标输出一致。在图一的例子中,根据前两个字符产生的状态和第三个输入「l」预测出的下一个字符的向量为 <0.1, 0

《大数据产业发展规划》(2016-2020年)安全相关内容摘录

痞子三分冷 提交于 2020-10-24 01:42:39
【注】原文在 http://www.miit.gov.cn/n1146295/n1652858/n1652930/n3757016/c5464999/content.html 我认为,大数据安全分为两个层面的问题,缺一不可:1)大数据自身的安全,这个是大数据发展的基础;2)将大数据技术应用于信息网络安全领域,也就是大数据对网络安全的支撑能力,这个是大数据发展的动力和目标。 大数据产业发展规划 (2016-2020年) 数据是国家基础性战略资源,是21世纪的“钻石矿”。党中央、×××高度重视大数据在经济社会发展中的作用,党的十八届五中全会提出“实施国家大数据战略”,×××印发《促进大数据发展行动纲要》,全面推进大数据发展,加快建设数据强国。“十三五”时期是我国全面建成小康社会的决胜阶段,是新旧动能接续转换的关键时期,全球新一代信息产业处于加速变革期,大数据技术和应用处于创新突破期,国内市场需求处于爆发期,我国大数据产业面临重要的发展机遇。抢抓机遇,推动大数据产业发展,对提升政府治理能力、优化民生公共服务、促进经济转型和创新发展有重大意义。为推动我国大数据产业持续健康发展,深入贯彻十八届五中全会精神,实施国家大数据战略,落实×××《促进大数据发展行动纲要》,按照《国民经济和社会发展第十三个五年规划纲要》的总体部署,编制本规划。 一、我国发展大数据产业的基础 大数据产业指以数据生产、采集