深度学习

利用关系抽取构建知识图谱的一次尝试

|▌冷眼眸甩不掉的悲伤 提交于 2020-10-27 16:20:44
关系抽取   信息抽取(Information Extraction, IE)旨在从大规模非结构或半结构的自然语言文本中抽取结构化信息。关系抽取(Relation Extraction, RE)是其中的重要子任务之一,主要目的是从文本中识别实体并抽取实体之间的语义关系,是自然语言处理(NLP)中的一项基本任务。比如,我们可以从下面的一段话中, 鸿海集团董事长郭台铭25日表示,阿里巴巴集团董事局主席马云提的新零售、新制造中的「新制造」,是他给加上的。网易科技报导,郭台铭在2018深圳IT领袖峰会谈到工业互联网时表示,眼睛看的、脑筋想的、嘴巴吃的、耳朵听的,都在随着互联网的发展而蓬勃发展,当然互联网不是万能的,比如说刚才李小加要水喝,在手机上一按就能出一瓶水吗?当然做不到,还是得有实体经济。 可以抽取出如下三元组,用来表示实体之间的关系: ['鸿海集团', '董事长', '郭台铭'] ['阿里巴巴集团', '主席', '马云'] 并且能够形成如下的简单的知识图谱(Knowledge Graph)。   关于知识图谱,笔者已经在文章 SPARQL入门(一)SPARQL简介与简单使用 中给出了一些介绍,而利用关系抽取,我们可以从一些非结构化数据中,提取出实体之间的关系,形成知识图谱,这在很大程度上可以帮助我们减轻构建知识图谱的成本。非结构化数据越多,关系抽取效果越好

###haohaohao######专访 DLP-KDD 最佳论文作者,探讨图神经网络的特点、发展与应用

青春壹個敷衍的年華 提交于 2020-10-27 16:19:37
InfoQ 的读者大家好,我是 KDD Workshop DLP-KDD 2020 的联合主席王喆,在 DLP-KDD 2020 征稿之际,我们专访了上一届 Workshop Best Paper Award(An End-to-End Neighborhood-based Interaction Model for Knowledge-enhanced Recommendation)的获得者:曲彦儒,白婷,与这两位图神经网络领域的专家深入探讨当前的学术及工程热点“图神经网络”的发展和应用,希望对大家有所帮助和启发。 Q : 能否简要介绍一下图神经网络与传统的神经网络(比如经典的 Embedding+MLP 结构,以及 RNN 等序列模型)之间的联系和区别? A : 这些模型的共同点在于, 都是通过神经网络端到端地拟合输入数据和输出数据之间的函数关系。他们之间最主要的区别在于, 不同的模型结构能够适应不同的先验知识. 比如全连通神经网络,没有假设任何先验知识, RNN 能够适应线性和序列性先验, 图神经网络能够适应更加复杂的结构性先验, 比如定义多个概念之间的关系, 描述复杂的非线性结构等。 此外,相比于其他神经网络模型,图神经网络能够从结构和功能两个方面建模数据整体特性,结构是指已有数据本身的相互关联,是已观测到的;功能是指信息在图中传播、相互影响的过程,与已有结构有关

重磅发布!最新版《动手学深度学习》PDF 版今天终于可以下载

╄→尐↘猪︶ㄣ 提交于 2020-10-27 15:59:25
强烈推荐李沐等人的《动手学深度学习》最新版! 完整中文版 PDF 终于 在10月 5 日更新 可下载: 加我微信好友 马上获取链接 暗号:“书” 内容简介 此书的结构: 以下是主要目录: 01 资源获取方法 PDF资源获取 添加下面的二维码, 加入【AI算法学习社群】 ,即可获得百度网盘(附上PDF)云盘下载链接。 赶快加入【AI算法学习社群】 ,我们旨在打造真正有价值,能交流,一起学习成长的社群,并且每月专业直播公开课,导师指点答疑,职业方向规划,送书福利不断! 扫码添加好友后,立即进学习群。 加我微信好友 马上进学习群 暗号:“书” 觉得好看就点个在看吧 来源: oschina 链接: https://my.oschina.net/u/4301169/blog/4691347

建造自己的「天空之城」,密歇根大学博士后的这项研究可以虚空造物、偷天换日

落爺英雄遲暮 提交于 2020-10-27 12:59:06
看过宫崎骏动画电影《天空之城》的小伙伴,想必偶尔会向往那座神秘的空中岛屿拉普达吧。近日,密歇根大学安娜堡分校博士后研究员 Zhengxia Zou 进行了一项研究,不仅可以创建空中堡垒,更可以转变场景中的天气和光照,让你有身临其境的感觉。此外,这项研究完全基于视觉,能够很好地应用于在线或离线场景,且可以执行实时处理。 哈尔的移动城堡?天空之城?这幅图是否让你想起了这两部电影中的场景…… 上:《天空之城》剧照;下:《哈尔的移动城堡》剧照。 是电影场景变为现实了吗?真的有人建造了一座空中楼阁?答案是也不是。 这座空中城堡的确是人为「构建」的,但并非真实存在。它是密歇根大学博士后研究员 Zhengxia Zou 近期一项研究所呈现的效果。 荒野、公路、疾驰的汽车,还有天边的巨型神秘建筑物,有科幻 / 末世电影内味儿了。然而,这幅场景竟然是从晴空万里的画面转换而成的。公路片变身科幻片?! 别急,还有大招。(以下示例左图为原始画面,右图为处理后画面。) 右图场景是不是更像《天空之城》了? 这场景让人想起一句歌词「打开这深夜,抚摸寒星光,我只想走进圆月亮」。 除了改变天空(比如增加悬浮城堡、改变色彩和云朵等),这项技术还能变换场景中的天气和光照。 今日天气多云转晴。 雷暴预警!一瞬间天昏地暗,雷电交加。 看起来,这项技术似乎都可以用到电影业了。那它是如何做到的呢?

入门声纹技术(二):声纹分割聚类与其他应用

拥有回忆 提交于 2020-10-27 12:19:00
声纹识别技术是声纹技术中最为核心的一项,和指纹识别、人脸识别一样,声纹识别也是生物特征识别技术的一种,该技术利用算法和神经网络模型,让机器能够从音频信号中识别出不同人说话的声音。 在10月19日的分享中,谷歌声纹识别与语言识别团队负责人王泉老师着重介绍了声纹识别技术以及相关的音频基础知识,并详细阐述深度学习时代最前沿的声纹识别模型,包括各种推理逻辑和损失函数的设计思路,以及数据处理方面的相关话题。第一讲回顾: 【机器之心】入门声纹技术第一讲_哔哩哔哩 (゜-゜)つロ 干杯~-bilibili 但是许多人误以为声纹技术等价于声纹识别,却不知道声纹技术还有着许多十分重要且有趣的其他应用。所以在 「从算法到应用,入门声纹技术」系列分享的第二讲中 ,王泉老师将着重介绍声纹技术除声纹识别之外的其他应用,声纹分割聚类便是其中最具代表性的应用,也就是关于「谁在什么时间说了什么」这个问题的答案。 10月26日,第二期分享 声纹分割聚类与其他应用 https:// u.wechat.com/MJznHqiyMH RcPKzhMIwL1K0 (二维码自动识别) 分享主题: 声纹分割聚类与其他应用 分享嘉宾: 王泉,美国谷歌公司资深软件工程师、声纹识别与语言识别团队负责人,《声纹技术:从核心算法到工程实践》一书作者。在谷歌任职期间,作者带领其团队将先进的声纹技术部署到了大量产品中

原来最强赘婿在二次元长这样,秒穿次元壁的AI特效又双叒火了

被刻印的时光 ゝ 提交于 2020-10-27 05:52:26
Python实战社群 Java实战社群 长按识别下方二维码, 按需求添加 扫码关注添加客服 进Python社群▲ 扫码关注添加客服 进Java社群 ▲ 鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI “本文经AI新媒体量子位(公众号 ID: QbitAI)授权转载,转载请联系出处” 虽然每天早晨甚至无法从50平米的地铺上醒来,但偶尔刷刷知乎,还是会被这类问题吸引住眼球—— 穿越到霸道总裁小说的世界,是一种怎样的体验? 最近,一个能满足这种幻(xia)想的快手AI特效火了。 不仅老铁们纷纷穿越,许多明星大V也贡献了自己的「言情小说脸」。 你看这位李雪琴老师,就瞬间女主光环加持,慵懒的眼神里又多了几分灵动的忧郁。 硬糖少女刘些宁,更是引得网友直呼:这不就是霸道总裁小说封面女主本主吗? 还有歪嘴战神本神,到了二次元的世界,还是熟悉的配方,熟悉的味道。 看到这些,我不禁产生了一个大胆的想法,让老婆们也一起穿越,不也就是举起手机就能搞定的事? △ 新垣结衣 嗯,新垣结衣是二次元走出来的实锤了! 更妙的是,这样一个AI特效,不仅能实时捕捉每一个表情变化,模仿咆哮帝也能hold得住: △ 明道 细节处理也着实奥利给,描眉画眼线这样的动作也不会让面部出现奇怪的扭曲。 打破次元壁的技术 所以快手这一堪称「穿越神器」的AI特效,在技术上是如何实现的呢? 快手工程师介绍

聚焦5G+AIoT新蓝海 | Linux Foundation开源软件大学-开源技术日直播首秀

蹲街弑〆低调 提交于 2020-10-27 04:57:22
近年来,随着开源技术的热度持续攀升,越来越多的国内开发者开始了解开源、学习开源、使用开源、回馈开源。中国拥有众多开源技术爱好者和参与者,学习和利用开源技术已经成为互联网技术人才的必备技能。而对于企业来说,利用开源技术提升企业技术实力也已成为国内科技企业的共识。 Linux Foundation开源软件大学 (官网地址:training.linuxfoundation.cn)是Linux基金会中国区官方培训网站,拥有非常丰富的培训课程体系和培训认证品牌,致力于为爱好开源的中国开发者提供帮助,为广大企业培养优秀的软件人才。 Linux Foundation开源软件大学除了让开源技术培训更好地服务中国开发者外,更充分利用自身资源,联合国内外顶尖开源基金会、开源组织、开源项目开发者、开源社区,举办丰富开源技术线上活动,帮助更多开发者接触开源技术、深入了解开源技术。 在这样的初衷下,开源技术日系列活动应运而生。开源技术日是由Linux Foundation开源软件大学联合开源中国和GDG共同主办的开源技术大讲堂,每次都会选出不同的主题,邀请资深技术嘉宾与众多开源技术爱好者一起分享和探讨。 首次开源技术日将采取线上直播的方式,活动邀请了来自Linux Foundation开源软件大学、Google开发者社区、ARM和VMware的专家们一起探讨在开源5G+AIoT领域的机遇与挑战和应用与创新。

阿里云ECS云服务器通用型g6和g5的区别以及选择建议(图文教程)

China☆狼群 提交于 2020-10-27 00:03:29
阿里云ECS云服务器通用型g6和g5的区别以及选择建议 阿里云ECS云服务器通用型g6和通用型g5实例有什么区别?通用型g5和g6都是用于性能均衡场景,CPU内存比都是1:4,本文来说说通用型g6和通用型g5的区别以及选择方法:官方文档: 云服务器ECS共享标准型S6实例 ECS云服务器通用型g6和通用型g5有什么区别? 顾名思义,通用型g6是通用型g5的升级版,ECS云服务器通用型g6是第六代云服务器,性能全面提升的同时价格有所下调,如何选择?云E优站长博客建议选择通用型g6实例。 通用型g6云服务器是阿里云的第六代云服务器,第六代云服务器是基于第二代Intel至强可扩展处理器,睿频从上一代2.7Ghz提升到3.2Ghz,E2E计算性能有3-15%的提升;支持vnni指令集,对于深度学习的推理场景有2-4倍性能提升;虚拟化优化性能抖动,ping flood延时超过1ms的报文数<1/100万。 通用型g6和通用型g5区别对比表 综上,阿里云ECS云服务器通用型g6是通用型g5的升级版,性能有所提升,如何选择?新手站长网还是建议性价比放在第一位,虽然通用型g6是g5的升级版,但是通用型g5的性能也不差,如果通用型g5拥有更优惠的折扣,通用型g5也是可以选择的。 来源: oschina 链接: https://my.oschina.net/u/4264470/blog/4284297

SOTA论文也未必能被接收,谷歌科学家Eric Jang谈顶会审稿标准

拈花ヽ惹草 提交于 2020-10-26 23:55:15
数据集过于简单、只在一两项指标上达到 SOTA、没有充分说明之前的研究都可能成为你论文被拒的原因。 选自 http:// evjang.com ,作者:Eric Jang,机器之心编译,编辑:Panda。 会议论文评审已经成为了人工智能和机器学习领域的热门争议话题,既有 审稿人在线吐槽论文注水严重 ,半成品太多,也有 投稿人网上喊冤 ,质疑审稿人的资格和敬业程度。纷纷扰扰之中,也许一个重要的原因是论文评审缺乏明晰的标准,严重依赖审稿人的主观判断。近日,谷歌 Robotics 研究科学家 Eric Jang 基于他十多场会议和研讨会的审稿经验,罗列了审稿人在评审论文时可能会考虑的标准,然后他说明了自己个人的审稿标准。这虽然只是一位审稿人的个人看法,但如果审稿人都能公开说明自己的审稿标准,当前会议论文评审方面的争议之声大概也会小一些。 审稿人到底会考虑哪些标准? NeurIPS 2020 已经公布了论文的收拒情况:在收到的 9454 篇论文中,有 1900 篇被接收(接收率为 20%)。接收详情请参阅 《NeurIPS 2020 放榜,接收率史上最低!AC:低接收率带不来有趣的论文》 。不管接收结果如何,都要祝贺各位辛苦研究取得了成果。 机器学习研究者大概都知道,NeurIPS 和其它一些会议的接收决定就像是一种经过加权的掷骰子游戏。在这个被称为「学术出版」的剧场中,评议五花八门

BAT机器学习面试153题:SVM xgboost 特征工程你都会么

瘦欲@ 提交于 2020-10-26 22:43:52
前言 本博客曾经在10~13年连续4年整理过各大公司数据结构和算法层面的笔试题、面试题,很快,2014年之后,机器学习大伙,很多公司开始招AI方面的人才,很多同学也会从网上找各种各样的机器学习笔试题、面试题,但和数据结构方面的题不同,AI的题网上极少。 2017年起,我和团队开始整理BAT机器学习面试1000题系列,近百万人开始追踪,目前七月在线官网/APP的题库已聚集AI笔试面试题4000题,今日起,本blog会按照机器学习、深度学习、CV、NLP、推荐系统等各方向精选相关的面试题,供大家找工作中随时查阅、复习。毕竟一般而言,进大厂讲究以下三方面的能力 coding能力,这是最基本的能力,包括数据结构和算法,说白了,coding能力扎实,无论干IT还是干AI,都不会太差,但很多人会忽略这方面的能力,比如AI各模型学的滚瓜烂熟,但面试让十分钟写个快速排序 迟迟动不了手,基本进不了大厂了; 机器学习、深度学习方面的能力,16年起随着AlphaGo的横空出世,深度学习瞬间横扫各个领域(下一篇blog会精选深度学习79题),这里面的重点包括各个模型,比如:决策树、随机森林、xgboost、SVM、特征工程、CNN、RNN、LSTM等等; 根据不同业务场景的技术能力,比如对业务的理解、建模,当然不同方向会用到不同的技术,比如CV、NLP、推荐系统(后续的blog也会精选这几个方向的面试题)