《Effective Modeling of Encoder-Decoder Architecturefor Joint Entity and Relation Extraction》
- 阅读更多 关于 《Effective Modeling of Encoder-Decoder Architecturefor Joint Entity and Relation Extraction》
Abstract 关系元组由两个实体以及它们之间的关系组成,并且经常在非结构化文本中找到这样的元组。文本中可能存在多个关系元组,并且它们之间可能共享一个或两个实体。从句子中提取这样的关系元组是一项艰巨的任务,并且在元组之间 共享实体 或 重叠实体 会使其更具挑战性。本文中提出了两种使用 编码器-解码器体系结构 共同提取实体和关系的方法。 提出了一种用于关系元组的表示方案,该方案使解码器能够像机器翻译模型一样一次生成一个单词,并且仍然可以找到句子中存在的所有元组,它们具有不同长度的完整实体名称并且具有重叠的实体。提出一种基于指针网络的解码方法,其中在每个时间步生成一个完整的元组。 Introduction 传统使用流水线方法,使用命名实体识别来识别句子中的实体,然后使用分类器查找它们之间的关系(或没有关系)。但是由于实体检测和关系分类的完全分离,这些模型错过了句子中存在的多个关系元组之间的交互作用。 本文三个主要挑战:(i)该模型能够将实体和关系提取在一起。 (ii)能够提取具有重叠实体的多个元组。 (iii)能够准确地提取一个具有全名的元组实体。为了解决这些挑战,提出了两种使用编码器-解码器体系结构的新颖方法。首先提出一种用于关系元组的新表示方案(表1),以便它可以用简单的方式表示具有重叠实体和不同长度实体的多个元组。采用编码器-解码器模型