人物关系挖掘方案设计
背景 拓展知识图谱-人物关系模块,激发用户兴趣点击,提升流量。 要解决的问题 1、识别人名:ner 命名实体识别。 2、识别两个人是有关系的; 人名共现来说明两个人之间有关系; 词向量计算词与词之间的相似度来说明两个人之间关系。 3、人物关系挖掘。 两个人名满足某种依存模式,则将两个人名和关系抽取出来。 用到的相关nlp算子:分词、词性标注、命名实体识别(NER)、依存语法分析、语义角色标注 依存句法中我们所用到的主要关系有:主谓关系(SBV)、动宾关系(VOB)、定中关系(ATT)、并列关系(COO)、介宾关系(POB); 技术方案、基于依存句法的人物关系抽取 核心工程 模式_实例1 两人名实体同时位于主语,并列关系 例如:1914年,孔祥熙与宋霭龄于日本结婚。 利用哈工大语言云进行句法分析得到结果如下: 模式_实例2 两人名实体同时位于主语,修饰关系。特征词分别采用角色词或者人物词进行不同策略的挖掘。 例如:邓超的妻子孙俪也是著名演员。 使用句法分析得到结果如下: 模式_实例3 两人名实体位于宾语,修饰关系 例如:他的妻子以往被认为是洪秀全的妹妹洪宣娇。 模式_实例4 两人名实体分别为主语和宾语,这种情况时, 选取谓语动词作为特征词 。 例如“子路师从孔子” 模式_实例5 关系名为主语、人名2为宾语,这种情况时,选取谓语动词