在阅读此书之前,我曾简单的了解过图数据库的一些知识,并对其应用的几个场景有了简单的了解。我曾狭义的以为知识图谱的目的就是通过一些行业的标准,将知识标准化,然后通过机器学习对知识路径进行自动学习和训练,挖掘出一些尚未被挖掘的价值。直到我阅读了《知识图谱- 方法、实践与应用》之后,我才发现我对知识图谱的了解内容还是太少了。
其实,自从知识被人类应用之后,人类就一直在探索和挖掘知识图谱,期望通过知识图谱来帮助人们解决工作生活中的一些问题。比如最早的《本草纲目》,这应该是国内最早的医学知识图谱。然而知识图谱最早以一种抽象的知识语义被提出却是1960年才提出的概念,其真正的快速发展也是随着近些年计算机快速发展而解决了原来无法通过机器学习而处理知识的问题才得以速度发展。
知识图谱包含了知识建模、知识存储、知识抽取、知识挖掘、知识图谱融合、知识推理、知识检索、知识问答和知识应用等多方面的知识。在这其中,每个部分又拥有其独特的方法和技术,并且每个部分都可以在学术方面进入深入的研究探讨。知识图谱的目的不是建立图结构,而是通过图结构建立起知识之间的联系,从而为用户提供更好的服务。
在知识存储方面,并非只有通过图数据库进行知识存储才能构建知识图谱,知识图谱同样离不开传统的关系型数据库,只不过原生的图数据库可以加速多维数据的检索效率,当然也可以使用面向RDF的三元组存储数据库来存储,目前在三元组存储在旅游应用中已经有成熟案例。
关于知识抽取与知识挖掘方面,在结构化数据中,我们可以通过直接映射的方式直接抽取数据。这点在物联网应用中有很广泛的使用场景,因为业务建模的数据名称通常与传感器采集到的数据名称不一致,现在有很多的规则引擎可以直接处理映射数据。在对非结构化数据抽取过程中,则需要对知识进行拆解,分成实体、关系和事件分别进行抽取。我们可以实体链接和一定的规则去进行知识挖掘。
在知识图谱融合与知识推理方面,我们需要着重考虑本体和业务实体中的模型不匹配问题。虽然每个行业都有对应的国标和行业标准,由于企业的内部的特征往往导致了对应的应用系统的特殊性,要想通过行标来打通模型之间的壁垒还是存在很大的难度。目前可以通过规则匹配、分治匹配和学习匹配等方法来实现知识的融合并进行推理。
最后,知识图谱目前在很多行业都有成熟的应用案例,如电商、图情、生活娱乐、企业商业、创投、医学、金融证券等。随着机器学习和深度学习技术的发展,必将在更多的领域更多的行业有着更大的商业机会。
来源:oschina
链接:https://my.oschina.net/crosschen/blog/4479811