知识图谱

直播预告:知识图谱推理问答综述 | AI TIME PhD 知识图谱专题-3

和自甴很熟 提交于 2020-11-02 07:12:53
AI TIME PhD 知识图谱专题-3 《知识图谱推理问答综述》 2020年6月19日 19:30-20:30 AI TIME PhD 知识图谱专题 主题 讲者 时间 大规模在线教育中的知识智能 于济凡 6月05日 事件检测 仝美涵 6月12日 知识图谱推理问答综述 史佳欣 6月19日 细粒度实体分类综述 金海龙 6月26日 第三期: 2020年6月19日 19:30-20:30 报告题目: 知识图谱推理问答综述 摘要: 近年来,知识图谱问答任务取得较大进展,但当问题变得复杂,涉及多个实体的比较和推理时,机器尚不能很好地解答。如何让机器像人类一样学会推理,从而处理复杂问题,是当前的一个研究热点和难点。在这次报告中,作者将对 知识图谱推理问答 的 主流方法 进行介绍, 分析各种方法的优缺点,并对未来发展方向做出展望 。 嘉宾简介: 史佳欣 ,清华大学计算机系,知识工程实验室,博士四年级研究生,导师为李涓子教授。主要研究方向为文档摘要、视觉推理、知识图谱问答等。 划重点 ! 直播通道: 哔哩哔哩直播通道 扫码 或 点击链接 关注AITIME哔哩哔哩官方账号 观看直播 链接: https://live.bilibili.com/21813994 直播结束后我们会邀请讲者在微信群中与大家答疑交流,请添加“AI TIME小助手(微信号:AITIME_HY)”,回复“图谱”,将拉您进

清华大学唐杰教授:人工智能的下个十年【附PPT下载】

半世苍凉 提交于 2020-11-01 22:01:49
来源:人工智能AI技术 作者:唐杰教授 编辑:AI数据派 本文 约 1850 字44图 ,建议阅读 9分钟 。 本文从人工智能发展的历史开始,深入分析人工智能近十年的发展,阐述了人工智能在感知方面取得的重要成果。 唐杰教授从人工智能发展的历史开始,深入分析 人工智能近十年的发展,阐述了人工智能在感知方面取得的重要成果 ,尤其提到 算法 是这个 感知时代 最重要、最具代表性的内容。 如需PPT下载,在订阅号后台回复 ai10 即可。 重点讲解了 BERT、ALBERT、MoCo2 等取得 快速进展的算法 。最后说到 下一波人工智能浪潮的兴起 ,就是实现 具有推理、可解释性、认知的人工智能。 人工智能对社会和经济影响的日益凸显,各国政府也先后出台了对人工智能发展的政策,并将其上升到国家战略的高度。截至目前,包括美国、中国和欧盟在内的多国和地区颁布了国家层面的人工智能发展政策。 在这个时代背景下, 我们需要考虑人工智能未来十年会怎样发展。 首先,我们需要从人工智能的发展历史中找到灵感。 我们再深入分析 AI 近十年的发展,会看到一个重要的标志: 人工智能在感知方面取得重要成果。人工智能在语音识别、文本识别、视频识别等方面已经超越了人类,我们可以说 AI 在感知方面已经逐渐接近人类的水平。 从未来的趋势来看,人工智能将会有一个从 感知到认知逐步发展 的基本趋势,如下图所示: 首先

[Python从零到壹] 四.网络爬虫之入门基础及正则表达式抓取博客案例

旧巷老猫 提交于 2020-10-31 10:00:41
欢迎大家来到“Python从零到壹”,在这里我将分享约200篇Python系列文章,带大家一起去学习和玩耍,看看Python这个有趣的世界。所有文章都将结合案例、代码和作者的经验讲解,真心想把自己近十年的编程经验分享给大家,希望对您有所帮助,文章中不足之处也请海涵。 Python系列整体框架包括基础语法10篇、网络爬虫30篇、可视化分析10篇、机器学习20篇、大数据分析20篇、图像识别30篇、人工智能40篇、Python安全20篇、其他技巧10篇。您的关注、点赞和转发就是对秀璋最大的支持,知识无价人有情,希望我们都能在人生路上开心快乐、共同成长。 本文参考了作者CSDN的文章,链接如下: https://blog.csdn.net/Eastmount https://github.com/eastmountyxz/Python-zero2one 同时,作者新开的“娜璋AI安全之家”将专注于Python和安全技术,主要分享Web渗透、系统安全、人工智能、大数据分析、图像识别、恶意代码检测、CVE复现、威胁情报分析等文章。虽然作者是一名技术小白,但会保证每一篇文章都会很用心地撰写,希望这些基础性文章对你有所帮助,在Python和安全路上与大家一起进步。 文章目录 一.什么是网络爬虫 二.正则表达式 1.re模块 2.complie方法 3.match方法 4.search方法 5

利用关系抽取构建知识图谱的一次尝试

|▌冷眼眸甩不掉的悲伤 提交于 2020-10-27 16:20:44
关系抽取   信息抽取(Information Extraction, IE)旨在从大规模非结构或半结构的自然语言文本中抽取结构化信息。关系抽取(Relation Extraction, RE)是其中的重要子任务之一,主要目的是从文本中识别实体并抽取实体之间的语义关系,是自然语言处理(NLP)中的一项基本任务。比如,我们可以从下面的一段话中, 鸿海集团董事长郭台铭25日表示,阿里巴巴集团董事局主席马云提的新零售、新制造中的「新制造」,是他给加上的。网易科技报导,郭台铭在2018深圳IT领袖峰会谈到工业互联网时表示,眼睛看的、脑筋想的、嘴巴吃的、耳朵听的,都在随着互联网的发展而蓬勃发展,当然互联网不是万能的,比如说刚才李小加要水喝,在手机上一按就能出一瓶水吗?当然做不到,还是得有实体经济。 可以抽取出如下三元组,用来表示实体之间的关系: ['鸿海集团', '董事长', '郭台铭'] ['阿里巴巴集团', '主席', '马云'] 并且能够形成如下的简单的知识图谱(Knowledge Graph)。   关于知识图谱,笔者已经在文章 SPARQL入门(一)SPARQL简介与简单使用 中给出了一些介绍,而利用关系抽取,我们可以从一些非结构化数据中,提取出实体之间的关系,形成知识图谱,这在很大程度上可以帮助我们减轻构建知识图谱的成本。非结构化数据越多,关系抽取效果越好

###haohaohao######专访 DLP-KDD 最佳论文作者,探讨图神经网络的特点、发展与应用

青春壹個敷衍的年華 提交于 2020-10-27 16:19:37
InfoQ 的读者大家好,我是 KDD Workshop DLP-KDD 2020 的联合主席王喆,在 DLP-KDD 2020 征稿之际,我们专访了上一届 Workshop Best Paper Award(An End-to-End Neighborhood-based Interaction Model for Knowledge-enhanced Recommendation)的获得者:曲彦儒,白婷,与这两位图神经网络领域的专家深入探讨当前的学术及工程热点“图神经网络”的发展和应用,希望对大家有所帮助和启发。 Q : 能否简要介绍一下图神经网络与传统的神经网络(比如经典的 Embedding+MLP 结构,以及 RNN 等序列模型)之间的联系和区别? A : 这些模型的共同点在于, 都是通过神经网络端到端地拟合输入数据和输出数据之间的函数关系。他们之间最主要的区别在于, 不同的模型结构能够适应不同的先验知识. 比如全连通神经网络,没有假设任何先验知识, RNN 能够适应线性和序列性先验, 图神经网络能够适应更加复杂的结构性先验, 比如定义多个概念之间的关系, 描述复杂的非线性结构等。 此外,相比于其他神经网络模型,图神经网络能够从结构和功能两个方面建模数据整体特性,结构是指已有数据本身的相互关联,是已观测到的;功能是指信息在图中传播、相互影响的过程,与已有结构有关

清华大学朱小燕教授新著作,《人工智能:知识图谱前沿技术》面世

瘦欲@ 提交于 2020-10-25 00:46:53
  机器之心报道    编辑:蛋酱   2020 年,人工智能技术进入更加广阔的落地期,你一定需要这本深入浅出的 “知识图谱” 书籍。      知识图谱( Knowledge Graph )以结构化的形式描述客观世界中概念、实体及其关系,将信息时代各式各样的信息表达成更接近人类认知世界的形式,提供了一种更好地组织、管理和理解的能力。知识图谱给互联网语义搜索带来了新的驱动力,同时也在自然语言处理的各种应用中显示了强大威力,已经成为互联网知识驱动的智能应用的基础设施。知识图谱、大数据、深度学习一起,成为信息时代人工智能发展的核心驱动力之一。   知识图谱技术是指知识图谱建立和应用的技术,是融合机器学习、认知计算、知识表示与推理、信息检索与抽取、自然语言处理、语义 Web 、数据挖掘等方向的交叉研究。知识图谱技术的核心内容包括知识抽取与构建,知识表示,知识推理,知识存储和查询,知识图谱应用等。   作为人工智能领域的重要方向之一,目前知识图谱技术已在医疗、教育、金融、证券投资、推荐等多个领域广泛应用,并发挥着重要价值。   在最新出版的《人工智能:知识图谱前沿技术》一书中,清华大学计算机系教授朱小燕等作者从知识和知识图谱的基本概念和模型出发,着重介绍了近代知识图谱相关技术的发展情况,特别是大规模数据、人工神经元网络,以及深度学习背景下有关知识表示、知识图谱构建

数据载入、存储及文件格式知识图谱-《利用Python进行数据分析》

心已入冬 提交于 2020-10-23 21:27:47
所有内容整理自《利用Python进行数据分析》,使用MindMaster Pro 7.3制作,emmx格式,源文件已经上传Github,需要的同学转左上角自行下载或者右击保存图片。 来源: oschina 链接: https://my.oschina.net/u/4361381/blog/4357498

金山AI团队:从理论突破到应用场景落地

百般思念 提交于 2020-10-23 18:45:19
     作者 | 陈彩娴   一提起雷军,绝大多数人首先会想到小米,对金山软件却知之甚少。雷军作为金山软件董事长,曾带领金山度过最艰难时期。   1996年,金山软件遭遇前有微软、后有盗版的双重打击跌入谷底:1995年,微软进入中国市场,Windows 95与OFFICE系列抢占了WPS大部分市场份额;与此同时,一张盗版光盘,640兆囊括了市面上几乎所有主流软件,包括金山软件的产品。面对困局,金山何去何从?   雷军苦苦思考六个月,最后决定做WPS的同时,在游戏、工具软件领域发力,开始游击战、以战养战。1997年,金山推出《剑侠情缘I》、《WPS97》、《金山词霸》等等功能强大的产品,在游戏、工具软件与字处理系统领域成功制造了3个市场热点,死里逃生。      (WPS97发布,雷军、求伯君演讲)   回忆这段往事,雷军曾归纳,自己最可贵的创业品质有两点: 一是目标远大,二是创业激情。   除此之外,雷军系的成功还归因于另一个重要的品质: 聚焦 。   这三个品质不仅续写着雷军本人的传奇创业故事,也在继续引领着他的各派团队创造辉煌的篇章,包括今年5月在纳斯达克上市的金山云,也包括一直低调行事的金山人工智能事业部。   雷军高度重视人工智能的发展,2017年亲自指导成立了金山人工智能事业部。这所实验室隐藏在海淀区小米科技园,集结一众顶尖技术人才,以认知AI为核心

阿里云峰会 | 来听听达摩院技术专家是怎么讲智能外呼机器人技术

心已入冬 提交于 2020-10-23 17:45:32
近日,在2020阿里云“全速重构”峰会上,阿里巴巴副总裁许诗军提到一个数字“11182”,在海口抗疫期间,利用AI技术在2小时内完成11182次外呼,极大提升防疫人员工作效率,而这背后正是智能外呼机器人技术的应用。 阿里云通信智能外呼机器人是通过呼叫控制,结合阿里达摩院语音转文本(ASR)、语音合成(TTS)、自然语言处理(NLP/NLU)等技术手段以及阿里云大数据能力,针对传统客户服务领域外呼难题,推出的智能呼叫产品。 企业通过阿里云智能外呼机器人可以实现企业服务流程打通,通过简单界面配置操作即可完成复杂的外呼场景。企业可根据实际业务场景编排外呼使用的文字内容,机器人通过外呼任务和预置的文字内容自动触达用户,通过外呼机器人来完成技术水平低、重复度高的工作,不仅节省成本,也提升了工作效率与收入。 用户在接通电话后,AI外呼语音会根据预设的对话策略选择相应文字内容,通过语音合成技术TTS转换为语音播放给用户,当用户回应后,通过智能语音识别技术ASR翻译成文字,机器人对文字进行语义分析理解后,根据知识图谱和对话策略再选择对应文字内容,再通过自然语言生成技术生成文本,最后通过语音合成生成语音响应客户,完成一轮通话交互。 智能外呼机器人可广泛应用于电商、汽车、教育、IT、餐饮、政务、旅游等各个行业领域,实现客户意向的确认、客户信息确认、活动通知、产品销售、满意度调查等业务

图数据库对比:Neo4j vs Nebula Graph vs HugeGraph

家住魔仙堡 提交于 2020-10-23 11:04:03
本文系腾讯云安全团队李航宇、邓昶博撰写 图数据库在挖掘黑灰团伙以及建立安全知识图谱等安全领域有着天然的优势。为了能更好的服务业务,选择一款高效并且贴合业务发展的图数据库就变得尤为关键。本文挑选了几款业界较为流行的开源图数据库与 Nebula Graph 进行了多角度的对比。 图数据库介绍 Neo4j Neo4j 是目前业界广泛使用的图数据库,包含社区版本和商用版本,本文中使用社区版本。 HugeGraph HugeGraph 是百度基于 JanusGraph 改进而来的分布式图数据库,主要应用场景是解决百度安全事业部所面对的反欺诈、威胁情报、黑产打击等业务的图数据存储和图建模分析需求。具有良好的读写性能。 Nebula Graph Nebula Graph 是一款开源的分布式图数据库,采用 shared-nothing 分布式架构,擅长处理千亿节点万亿条边的超大规模数据集,从而更好地服务企业级应用。 测试硬件环境 性能对比 我们使用不同量级的图从入库时间,一度好友查询,二度好友查询,共同好友查询几个方面进行了对比,结果如下: 可以看到在导入性能上,数据量小的时候 Nebula Graph 的导入效率稍慢于 Neo4j,但在大数据量的时候Nebula Graph 的导入明显优于其他两款图数据库;在 3 种查询场景下, Nebula Graph 的效率都明显高于 Neo4j,与