实体关系图

美团餐饮娱乐知识图谱——美团大脑揭秘

一笑奈何 提交于 2019-12-07 17:52:35
前言 “ I’m sorry. I can’t do that, Dave.” 这是经典科幻电影《2001: A Space Odyssey》里HAL 9000机器人说的一句话,浓缩了人类对终极人工智能的憧憬。让机器学会说这样简单一句话,需要机器具备情感认知、自我认识以及对世界的认识,来辅助机器处理接收到的各种信息,了解信息背后的意思,从而生成自己的决策。而这些认知模块的基础,都需要机器具备知识学习组织推理的能力,知识图谱就是为实现这些目标而生。 今年5月,美团NLP中心开始构建大规模的餐饮娱乐知识图谱——美团大脑,它将充分挖掘关联各个场景数据,用AI技术让机器“阅读”用户评论数据,理解用户在菜品、价格、服务、环境等方面的喜好,挖掘人、店、商品、标签之间的知识关联,从而构建出一个“知识大脑”。美团大脑已经在公司多个业务中初步落地,例如智能搜索推荐、智能金融、智能商户运营等。 此前,《 美团大脑:知识图谱的建模方法及其应用 》一文,介绍了知识图谱的分类及其具体应用,尤其是常识性知识图谱及百科全书式知识图谱分别是如何使用的。之后我们收到非常多的反馈,希望能进一步了解“美团大脑”的细节。为了让大家更系统地了解美团大脑,NLP中心会在接下来一段时间,陆续分享一系列技术文章,包括知识图谱相关的技术,美团大脑背后的算法能力,千亿级别图引擎建设以及不同应用场景的业务效果等等

Oracle------第七章Overview of Data Modeling and Database Design

感情迁移 提交于 2019-12-06 12:49:08
Oracle------第七章Overview of Data Modeling and Database Design 第七章:数据建模和数据库的设计 数据库的设计的步骤: 需求分析:从客户的商业描述中抽象出实体,属性和关系。 实体----->表 属性----->表中的字段 关系----->外键。 实体与实体的关系 需求分析由项目经理或者项目的架构师完成。 设计阶段:把需求分析中实体,属性和关系通过ER图表示出来。 建立文档:把需求分析和ER图通过文档的方式描述出来。 作用:和客户交流。 为了更方便维护数据库 建立表实例图:根据ER图建立表实例图 表实例图包含表中包含哪些字段,以及字段数据类型,字段约束类型。 产品(写建表语句):根据表实例图写建表语句。 Entity-Relationship实体关系模型图: 好处:更方便获取数据库表的信息。 获取实体,获取属性,获取关系。 1)实体:世界上任何一个东西都可以作为实体 如:学生,课程,老师等 2)属性:描述实体 学生(学号,姓名…) 关系:实体与实体之间的关系。加外键。 同时性 3)关系: 一对一的关系:丈夫和妻子(法律上) 外键加上任何一方。 如果出现mustbe关系,外键 放在mustbe一方。 一对多的关系:飞机和乘客 外键加上多的一方。 多对多的关系:学生和课程 建立一张桥表。外键放在桥表。 桥表的作用是把多对多的关系

CouchDB

拜拜、爱过 提交于 2019-12-06 08:58:12
由于关系数据库的流行,很多开发者对于实体 - 关系(Entity-Relation,ER)模型非常熟悉。而 CouchDB 使用的是面向文档(Document oriented)的模型。在使用 CouchDB 的时候,需要完成从 ER 模型到文档模型的思维方式的转变。下面通过几个具体的例子来说明如何在 CouchDB 中对于一些典型的场景进行建模,并与关系数据库中的建模方式进行比较。 描述实体 第一个场景是对实体的描述。关系数据库中使用表来表示实体。数据库表是有固定的模式的,该模式定义了表中每行数据应该满足的格式。表中每行数据都对应于实体的一个实例。比如应用中如果需要描述“注册用户”和“图书”两种实体的话,就需要两张不同的表。而在 CouchDB 中,所有的实体都是以文档来描述的。文档是没有模式的,可以用任意的 JSON 对象来表示。同一实体的实例在结构上也可能不同。这更能反映问题域中数据的真实状态。比如对“人”这一实体进行描述时,有一个字段是“传真号码”。因为不是所有人都拥有传真机,这一字段是可选的。如果用关系数据库来建模的话,则需要在表中添加一列表示传真号码。对于没有传真机的人来说,该列的值为 null 。而如果用 CouchDB 中的文档来描述的话,对于有传真机的人,其 JSON 对象中就有一个属性表示“传真号码”,否则的话就没有此属性。 CouchDB

知识挖掘

你说的曾经没有我的故事 提交于 2019-12-06 02:46:53
从已有的实体及实体关系中挖掘新的知识,包括内容挖掘和结构挖掘 1. 内容挖掘:实体链接 文本中的实体--链向--知识库中目标实体,建立文本与知识库的联系 流程: (1)实体指称识别 通用命名实体识别技术 词典匹配技术 (2)候选实体生成 表层名字扩展:实体是缩略词或者全称的一部分 搜索引擎:将实体提及和上下文文字提交到搜索引擎,根据返回结果生成候选实体 构建查询实体引用表 (3)候选实体消歧 基于图的方法:将实体指称,实体以及他们之间的关系通过图的形式表示出来,然后对关系进行协同推理 基于概率生成模型:对实体提及和实体的联合概率进行建模 基于主题模型建模:实体在文本中的相容度,实体与话题的一致性进行联合建模 基于深度学习:特征向量(实体E/拥有的关系R/实体类型ET/实体描述D)--词散列降维--多层非线性映射--语义层--语义相关度 2. 规则挖掘 (1)归纳逻辑程序设计 ILP(Inductive logic programming) (2)路径排序算法 PRA (Path ranking algorithm) 两个实体的一组关系路径--预测--实体可能存在的关系 步骤: 1. 特征选择:选择对预测目标潜在有用的关系路径,计算随机游走的准确度和覆盖度 2. 特征计算:对于实体对(h,t)和某一特征路径(r),计算从沿路径r到达t的概率 3. 关系分类

数据库设计

眉间皱痕 提交于 2019-12-06 00:26:28
目录 数据库设计 三范式 第一范式(1NF): 第二范式(2NF): 第三范式(3NF): E-R模型 数据库设计 关系型数据库建议在E-R模型的基础上,我们需要根据产品经理的设计策划,抽取出来模型与关系,制定出表结构,这是项目开始的第一步。 在开发中有很多设计数据库的软件,常用的如power designer,db designer等,这些软件可以直观的看到实体及实体间的关系。 设计数据库,可能是由专门的数据库设计人员完成,也可能是由开发组成员完成,一般是项目经理领组员完成。 三范式 经过研究和对使用中问题的总结,对于设计数据库提出了一些规范,这些规范被称为范式(Normal Form) 目前有迹可循的共有8种范式,一般需要遵循3范式即可: 第一范式(1NF): 第一范式是最基本的范式,强调的是列的原子性,即列不能再分成其他几列 上图不符合第一范式,买家地址可以拆分 这样修改就遵循了第一范式。修改后的订单表 在用户使用城市进行分类的时候会非常方便,提高了数据库性能 第二范式(2NF): 首先是基于第一范式,另外包含两部分内容,一是表必须有一个主键;二是没有包含在主键中的列必须完全依赖于主键,而不能只依赖主键的一部分。 也就是说在一个数据表中,只能保存一种数据,不能把多种数据保存在同一张表中。 上面的订单表可以继续拆分 第三范式(3NF): 首先是基于第二范式

知识图谱如何运用于RecomSys

不想你离开。 提交于 2019-12-05 12:07:13
将知识图谱作为辅助信息引入到推荐系统中可以有效地解决传统推荐系统存在的稀疏性和冷启动问题,近几年有很多研究人员在做相关的工作。目前, 将知识图谱特征学习应用到推荐系统中主要通过三种方式——依次学习、联合学习、以及交替学习 。 依次学习 ( one-by-one learning )。首先使用知识图谱特征学习得到实体向量和关系向量,然后将这些低维向量引入推荐系统,学习得到用户向量和物品向量; 联合学习 ( joint learning )。将知识图谱特征学习和推荐算法的目标函数结合,使用端到端( end-to-end )的方法进行联合学习; 交替学习 ( alternate learning )。将知识图谱特征学习和推荐算法视为两个分离但又相关的任务,使用多任务学习( multi-task learning )的框架进行交替学习。 依次学习 Deep Knowledge-Aware Network (DKN) 我们以新闻推荐[1]为例来介绍依次学习。如下图所示,新闻标题和正文中通常存在大量的实体,实体间的语义关系可以有效地扩展用户兴趣。然而这种语义关系难以被传统方法(话题模型、词向量)发掘。 为了将知识图谱引入特征学习,遵循依次学习的框架,我们 首先需要 提取知识图谱特征 。该步骤的方法如下: 实体连接 ( entity linking )。即从文本中发现相关词汇

金融文本挖掘的业务领域建模

倖福魔咒の 提交于 2019-12-05 11:18:16
金融文本挖掘的业务领域建模 领域模型是对领域内的概念类或现实世界中对象的可视化表示。又称概念模型、领域对象模型、分析对象模型。它专注于分析问题领域本身,发掘重要的业务领域概念,并建立业务领域概念之间的关系 领域模型设计是需求分析的关键步骤。它帮助用户及需求分析人员建立业务概念,确定用户业务的问题域,系统涉及的业务范围等等。 领域模型设计的步骤为: 从业务描述中提取名词; 从提取出来的名词中总结业务实体,区分名词中的属性、角色、实体、>实例,形成问题域中操作实体的集合; 从业务实体集合中抽象业务模型,建立问题域的概念(例如在前面的例子中,我们把容易变质的水果称之为“短期保持水果”,当然也可以是其它说法,只要能跟用户达成共识即可); 用UML提供的方法和图例进行领域模型设计、确定模型之间的关系 领域模型本质上应该是一个分析模型,帮助系统分析人员、用户认识现实业务的工具,描述的是业务中涉及到的实体及其相互之间的关系,它是需求分析的产物,与问题领域相关。领域模型是需求分析人员与用户交流的有力工具,是需求分析人员与用户共同理解的概念,是彼此之间交流的语言。而数据模型是系统设计、实现的一部分,描述的是对用户需求在数据结构上的实现,仅此而已。当然数据模型中的概念模型设计与领域模型类似,缺乏的是实体之间更广泛的关系描述。 通常大家会考虑数据怎么存放的问题

详述MySQL数据库介绍与安装

我的未来我决定 提交于 2019-12-04 09:30:59
数据库的基本概念 数据 描述事物的符号记录称为数据(Data) 包括数字、文字、图形、图像、声音、档案记录等 以“记录”形式按统一的格式进行存储 表 将不同的记录组织在一起,就形成了“表” 是用来存储具体数据的 数据库 数据库就是表的集合,是存储数据的仓库 以一定的组织方式存储的相互有关的数据 数据库系统发展史 第一代数据库 自20世纪60年代起,第一代数据库系统问世。它们是层次模型与网状模型的数据库系统,为统一管理和共享数据提供了有力的支撑 第二代数据库 20世纪70年代初,第二代数据库——关系数据库开始出现 20世纪80年代初,IBM公司的关系数据库系统DB2问世,作为第二代数据库系统的关系数据库,开始逐步取代层次与网状模型的数据库,成为占主导地位的数据库,成为行业主流。到目前为止,关系数据库系统仍占领数据库应用的主要地位 第三代数据库 自20世纪80年代起,各种适应不同领域的新型数据库系统不断涌现,如工程数据库、多媒体数据库、图形数据库、智能数据库、分布式数据库及面向对象数据库等,特别是面向对象数据库系统,由于其实用性强、适应面广而受到人们的青睐 20世纪90年代后期,形成了多种数据库系统共同支撑应用的局面。当然,在商务应用方面,依然还是关系数据库占主流,不过,已经有一些新的元素被添加进主流商务数据库系统中。例如,Oracle支持的"关系—对象”数据库模型 当今主流数据库介绍

B/S模式的学生信息管理系统的设计和实现(笔记5)

有些话、适合烂在心里 提交于 2019-12-04 01:26:52
一、基本信息 标题:B/S模式的学生信息管理系统的设计和实现 时间:2012 来源:南昌大学 关键字:学生信息管理;ASP.NET;B/S;管理系统; 二、研究内容 近年来,随着计算机科学的迅速发展,高校学生信息管理步入到信息化时代。学生信息管理系统的开发加强了对学生信息的管理,学生也能够对自身进行相关维护,大大提高了高校的工作效率,将高校从传统的手工劳动方式引领到计算机自动化管理方式,同时也节省了高校大量的人力、物力、财力的浪费。本文叙述了高校学生信息管理系统的整体开发过程。首先简要介绍了本系统的研究背景以及意义,研究现状,然后介绍了系统ASP.NET相关开发技术以及SQL Server2000数据库等开发工具,在此基础上,对系统进行需求分析获取,分析了相关业务流程、数据流以及功能需求,同时进行了系统功能模块设计以及数据库设计,并最终成功实现了系统功能。采用面向过程的方法设计开发出了基于B/S模式的学生信息管理系统具有操作简便、检索信息快速方便、功能全面、高安全性、高可靠性、成本低廉等优点,实现了高校对学生信息管理的正规化、科学化。使用基于B/S模式的学生信息管理系统大大的减少了高校人员每日的工作量,极大的提高了管理效率,具有较高的实用价值。 业务流程分析:根据高校学生信息管理系统的需求,通过分析高校工作人员(学工处、教务处等)、教师以及学生的日常工作内容和业务流程

图神经网络和传统图模型以及原来的深度学习之间的关系

落爺英雄遲暮 提交于 2019-12-03 23:49:26
机器之心: 您可以介绍一下图神经网络和传统图模型,以及原来的深度学习之间的关系吗? 刘知远: 对于这个问题,我们需要看是从什么角度来考虑。 从研究任务的角度来看,比如数据挖掘领域的 社会网络分析 问题 像 DeepWalk、LINE 这些 graph embedding 算法,聚焦在如何对网络节点进行低维向量表示,相似的节点在空间中更加接近。 图神经网络(GNN) ① GNN可以对一个节点进行语义表示。 GNN可以更好地考虑这个节点周围的丰富信息,对单个节点的表示也可以做的比过去方法更好。 ② GNN可以表示子图的语义信息。 GNN可以把网络中一小部分节点构成的社区(community)的语义表示出来,这是 graph embedding 不容易做到的。 ③ GNN可以把网络当成一个整体进行建模。 它可以在整个网络上进行信息传播、聚合等建模。 知识图谱 TransE 等 知识表示学习方法 ,一般是将知识图谱按照三元组来学习建模, 学到每个实体和关系的低维向量表示 ,这样就可以去进行一些链接预测和实体预测任务。 GNN 则有希望把整个知识图谱看成整体进行学习,并可以在知识图谱上开展注意力、卷积等操作,以 学习图谱中实体与实体之间的复杂关系 。即使实体间没有直接连接,GNN 也可以更好地对它们的关系建模。 关系 随机游走、最短路径等 图方法 利用知识图谱这种符号知识