知识图谱

疑惑!AI中台到底为什么火了?道翰天琼认知智能机器人平台API接口为您揭秘。

风格不统一 提交于 2020-08-13 02:01:17
自从 2015 年阿里提出 “中台” 战略后,“中台”便成为一个行业热词,许多公司纷纷推出了自己的中台架构。一方面中台架构似乎代表了一种新兴趋势,另一方面中台似乎又面临着定义不清、概念混杂的问题。 中台是一种切实的业务、数据架构,还是一个混杂的概念?中台可以实际解决哪些问题、提升哪些业务效率?本篇就来着重梳理一下。 中台的架构是什么 中台一词,是由 “前台”、“后台” 产生而来。 传统架构中先有了 “前台” 与“后台”。后台负责管理企业的核心资源,如财务系统、产品系统、客户管理系统、基础设施和计算平台等,前台则是最终用户直接使用、与企业交互的前端系统,如网站、手机 App 等。但前台、后台间往往各司其职,无法形成有效衔接,带来业务配合效率、数据质量等问题。 中台的设置,就是为了有效连接前台和后台的一种平台化形态,以强调资源整合与共享、能力沉淀,为“前台” 提供业务模式、技术、数据、人才等支撑。具体来说,中台的架构主要可划分为业务中台、数据中台、技术中台等。 2015 年,阿里巴巴率先提出了中台战略概念,并提出 “小前台,大中台” 的管理模式,将搜索事业部、共享业务平台、数据技术及产品部提出来组成了“共享业务事业部”(Shared Services Platform),沟通前端的业务部门和后端的云平台。 主要 AI 中台厂商及其场景落地 近年来,腾讯

由微视春节集卡瓜分活动,看高可用秒杀系统的架构设计

穿精又带淫゛_ 提交于 2020-08-12 23:19:45
微视春节项目中的集卡瓜分活动,是一个典型流量洪峰下的秒杀场景,本文作者参与其中,对高可用秒杀系统的架构设计做了一些思考和总结。(流量洪峰所带来的一系列挑战,足以激发每位程序员的斗志。云加社区将推出 「高可用架构之流量洪峰」 系列内容,欢迎关注)。 一、背景简介 如今的互联网已经在海量服务领域有了很成熟的理论,有很多在流量洪峰下的实践。而微视春节项目中的集卡瓜分活动,主要环节包括发卡、集卡、瓜分等流程,涉及到高并发、降级预案等,是一个典型流量洪峰下的秒杀场景。我有幸参与其中,从0到1完整践行了海量服务。本文是对高可用秒杀系统的架构设计的一些思考,希望对读者有所帮助。 二、秒杀系统剖析 1. 秒杀系统面临的难点 (1)如何保证友好的用户体验? 用户不能接受破窗的体验,例如:系统超时、系统错误的提示,或者直接404页面。 (2)如何应对瞬时高并发流量的挑战? 木桶短板理论,整个系统的瓶颈往往都在DB,如何设计出高并发、高可用系统? 2. 如何设计秒杀系统? (1)典型的互联网业务结构 下图展示了一个典型的互联网业务结构抽象图,用户完成一个写操作,一般会通过接入层和逻辑层,这里的服务都是无状态,可以通过平行拓展去解决高并发的问题;到了DB层,必须要落到介质中,可以是磁盘/ssd/内存,如果出现key的冲突,会有一些并发控制技术,例如cas/加锁/串行排队等。 (2)直筒型架构设计

人工智能中小样本问题相关的系列模型演变及学习笔记(四):知识蒸馏、增量学习

隐身守侯 提交于 2020-08-12 21:04:33
【说在前面】本人博客新手一枚,象牙塔的老白,职业场的小白。以下内容仅为个人见解,欢迎批评指正,不喜勿喷![握手][握手] 【再啰嗦一下】本文衔接上两个随笔: 人工智能中小样本问题相关的系列模型演变及学习笔记(一):元学习、小样本学习 【再啰嗦一下】本文衔接上两个随笔: 人工智能中小样本问题相关的系列模型演变及学习笔记(二):生成对抗网络 GAN 【再啰嗦一下】本文衔接上两个随笔: 人工智能中小样本问题相关的系列模型演变及学习笔记(三):迁移学习 一、知识蒸馏综述 知识蒸馏被广泛的用于模型压缩和迁移学习当中。 本文主要参考:模型压缩中知识蒸馏技术原理及其发展现状和展望 1. 基本概念 知识蒸馏可以将一个网络的知识转移到另一个网络,两个网络可以是同构或者异构。做法是先训练一个teacher网络,然后使用这个teacher网络的输出和数据的真实标签去训练student网络。 可以用来将网络从大网络转化成一个小网络,并保留接近于大网络的性能。 可以将多个网络的学到的知识转移到一个网络中,使得单个网络的性能接近emsemble的结果。 2. 知识蒸馏的主要算法 知识蒸馏是对模型的能力进行迁移,根据迁移的方法不同可以简单分为基于目标驱动的算法、基于特征匹配的算法两个大的方向。 2.1 知识蒸馏基本框架 Hinton最早在文章“Distilling the knowledge in a

符号主义对深度学习的意义浅谈

南楼画角 提交于 2020-08-12 11:52:36
符号主义人工智能经历过古典时期的专家系统阶段, 中期的知识图谱阶段, 和近期深度学习和符号主义的再次联姻。 那么一个很重要的问题是符号主义为什么会复兴,它对当下的机器学习又有何意义? 参考阅读: Reconciling deep learning with symbolic artificial intelligence: representing objects and relations ​ www.sciencedirect.com 首先, 当下的深度学习有三个最主要的问题,很低的数据使用效率, 泛化能力, 可解释性,都可以从符号主义得到极大帮助。 这一点也不难理解, 所谓符号,多数指我们语言中那些经常被使用的抽象概念,这些概念再不同的任务和环境中被广泛使用组成新的概念,比如红色,圆形等,如果能够在不同任务中学习到这些最基本的元素, 那么无疑将极大的改善数据使用效率和泛化能力。同时, 从视频,声音等信息中提取出的这种符号,几乎一定是和我们的自然语言有所对应,和我们的认知概念有所对应,因此,提取这些符号将极大助力模型的可解释性。从这两个角度看, 符号的确可以解决深度学习的几个根本问题。 更加重要的是,符号的使用和我们的推理认知能力极为相关,这也是为什么在第一代的人工智能时代人们如此重视符号, 因为它是逻辑思维的载体,有了符号我们可以在符号基础上罗列各种运算,进行关系预测和推理等

BlockChain:2020年7月10日世界人工智能大会WAIC《链智未来 赋能产业区块链主题论坛》(四)

99封情书 提交于 2020-08-12 06:44:13
BlockChain:2020年7月10日世界人工智能大会WAIC《链智未来 赋能产业区块链主题论坛》(四) 导读 : 数据人生,还原人性底色,造就可信任 2020年3月30日将数据作为生产要素,数据作为生产要素参与分配意义重大! “We can only see a short distance ahead, but we can see plenty there that needs to be done.”——Alan Turing 吾等目力短浅,能见百事待践行 区块链+人工智能:人工智能技术可以提高区块链智能合约运行效率、促进现实世界的应用程序变得更加智能 区块链+物联网:通过物联网设备+数字身份建立数字孪生世界,物理世界与虚拟数字世界相互促进 人工智能技术特征:生物特征识别+ML+NLP+CV+知识图谱 理性认识区块链:基础设施+非万能+非替代者 目录 2020年7月10日世界人工智能大会WAIC《链智未来 赋能产业区块链主题论坛》 演讲嘉宾 演讲内容 邢波《区块链,新引擎》 新型智慧城市 构建区块链产学研生态系统 数据人生,造就可信任 陆杨《Last Mile to Mass Adoptions -VeChain ToolChain》 达鸿飞《区块链如何构建数字信用枢纽》 2020年3月30日将数据作为生产要素 “We can only see a short

沉思!知识图谱到底该何去何从?道翰天琼认知智能机器人API平台接口为您揭秘。

让人想犯罪 __ 提交于 2020-08-12 04:22:44
沉思!知识图谱到底该何去何从? 道翰天琼认知智能机器人API平台接口为您揭秘。 随着认知智能走进了人们的视野,知识图谱的重要性便日渐凸显。在今年的自然语言处理顶会 ACL 2020 上,自然语言知识图谱领域发生了巨大的革新。ACL 作为 NLP 领域的顶级学术会议,无疑能够很好地呈现该领域的研究风向。 本文作者Michael Galkin(计算机科学家,主要研究方向为知识图谱)从问答系统、知识图谱嵌入、自然语言生成、人工智能对话系统、信息提取等方面总结了 ACL 2020 上知识图谱最新工作。 AI 科技评论将这份总结编译如下: ACL 2020 完全采取了在线会议的模式。想要举办这么庞大的在线活动,让来自多个时区的参会者共同参与其中,并展示超过 700 篇论文是十分困难的。不过在所有讲者、参会者、组织者的努力下,这届大会得以圆满进行。那么与 ACL 2019 相比,知识图谱和自然语言处理领域发生了大的变化吗?答案是肯定的!我们将今年该领域的进展概括为: 知识图谱展现了更好地揭示其它非结构化数据中的高阶相关性的能力。 1 基于结构化数据的问答系统 在该任务中,研究者们面向 SPARQL 的知识图谱或 SQL 数据库这样的结构化数据源提出了问题。在今年的 ACL 大会上,我们可以看到越来越多考虑复杂(也被称为多跳)问题的工作。举例而言,Saxena 等人的论文「Improving

GAITC丨金兼斌:虚假科学信息治理依靠社会民智,AI是整合关键

我怕爱的太早我们不能终老 提交于 2020-08-12 00:54:43
  7月26日,由中国人工智能学会主办、新浪新闻联合浙江大学承办的2020全球人工智能技术大会(2020GAITC)“AI时代下的新媒体与社交娱乐”专题论坛拉开帷幕,新浪集团首席信息官、新浪AI媒体研究院院长王巍,浙江大学特聘教授、悉尼科技大学教授、百度研究院访问教授杨易共同担任论坛主席。   清华大学大学新闻与传播学院学术委员会主任、教授金兼斌在本次专题论坛上,与来自业界、学术界的嘉宾们分享了《人工智能助力虚假科学信息的监测》。      清华大学大学新闻与传播学院学术委员会主任、教授金兼斌作主题演讲。   金兼斌认为,社会化媒体时代,虚假科学信息的治理,必须充分依靠对分散在社会各个平台上的民智的整合,而人工智能则是实现这种有效整合的关键。   关于应对虚假科学信息,利用人工智能技术进行更好的监测,他提到,基于虚假科学信息的语言特征、内容特征和对象特征,“表示学习”、“知识图谱”、“信息挖掘”是三种有针对性的解决思路。    以下为金兼斌演讲实录,内容经编辑略有删减:   各位嘉宾好,首先非常荣幸受新浪新闻和浙江大学的邀请来参加这一论坛。刚才听前面几位专家分享的时候,颇感心有戚戚。诸多内容和观点,嘉宾之间并未事先沟通过,但却遥相呼应。   今天我将主要谈谈虚假科学信息的监测问题。借用刚才Amy Bruckman女士的话,知识本质上是一种共识的社会建构。尼采有类似的表述

长篇大论中抓取精华,语音实时生成知识图谱,这个系统可谓是首个

徘徊边缘 提交于 2020-08-11 23:35:23
基于文本生成知识图谱的研究很常见,但是基于语音生成知识图谱,这算是第一家。 机器之心报道,机器之心编辑部。 在这个信息飞速发展的时代,数据呈爆炸式增长。而互联网信息的多元性、异构性、结构松散等特点,给人们有效获取信息和知识带来了挑战。 知识图谱(Knowledge Graph) 凭借强大的语义处理能力,为互联网时代的知识化组织和智能应用奠定了基础,并被广泛应用于智能搜索、知识问答、舆情分析等领域。 然而在现有的技术中,大部分研究集中在从文本转化到图谱的过程,却忽略了从语音实时转换到图谱的研究。 本文将介绍一篇关于从语音到图谱构建的论文,可以说是该领域的首个相关研究。这篇来自明略科学院知识工程实验室的论文已被人工智能国际顶会 IJCAI 2020 Demonstrations Track 接收。 论文链接: https://www. ijcai.org/Proceedings/2 020/0777.pdf 论文简介 近年来语音接口受到极大欢迎。以智能音箱为例,截至 2019 年,估计有 35%的美国家庭至少配备了一个智能音箱。目前尽管存在成熟的语音识别工具包和商业语音转录系统,但面对长篇大论的交谈中,人们仍难以集中精力抓取其中的关键所在。而知识图谱可以追溯到早期的专家系统研究和语义网络,它提供了一种方法,这种方法可以可视化演讲者的关键思想。 对于知识图谱的概念有不同的定义

构建知识图谱-初学

佐手、 提交于 2020-08-11 20:45:18
本文内容源自 medium文章 A Knowledge Graph understanding and implementation tutorial for beginners[1] 目录 什么是知识图谱? 如何搭建一个简单的知识图谱? 什么是知识图谱? 知识图谱的内容通常以三元组形式存在, Subject-Predicate-Object (spo)。 举个栗子: Leonard Nimoy was an actor who played the character Spock in the science-fiction movie Star Trek 对上面的句子可以抽取到如下三元组: 以知识图谱形式可以表示为: 上述由节点和关系组成的图,就是一个简单的知识图谱。 如何搭建一个简单的知识图谱? 可以分为以下两大步骤: 知识提取 信息抽取,获取三元组 实体识别、实体链接、实体消歧(Disambiguation)、实体统一(Entity Resolution) 图构建 存储 查询 知识提取步骤是构建知识图谱的关键,三元组可以通过依存分析得到。 动手构建一个简单知识图谱 此处只显示代码执行过程与结果,完整代码请见 github . 1. 三元组提取 借助spacy inputText = 'Startup companies create jobs and innovation.

Hacker News 简讯 2020-07-10

别等时光非礼了梦想. 提交于 2020-08-11 14:57:08
更新时间: 2020-07-10 01:15 US Supreme Court deems half of Oklahoma a Native American Reservation - (reuters.com) 美国最高法院认为俄克拉荷马州的一半是印第安人保留地 得分:131 | 评论:70 Slate Star Codex and Silicon Valley’s War Against the Media - (newyorker.com) 石板星法典和硅谷对媒体的战争 得分:137 | 评论:78 How to track and display profile views on GitHub - (rushter.com) 如何在GitHub上跟踪和显示概要视图 得分:131 | 评论:79 XMEMS Announces World's First Monolithic MEMS Speaker - (anandtech.com) XMEMS宣布推出全球首款单片微机电扬声器 得分:60 | 评论:28 Dates and Times in JavaScript – A New API for Dates from TC39 - (igalia.com) JavaScript中的日期和时间——一个新的TC39日期应用编程接口 得分:21 | 评论:7 The rise