TPLinker: Single-stage Joint Extraction of Entities and Relations Through Token Pair Linking

目录

写作动机(Movitation):

相关工作(Related Work):

提出的方法(Methods):

使用的技术(Techniques):

遇到的困难(Difficulties):

实验结果(Results):

做出的贡献(Contributions):

未来展望(Future Work):


写作动机(Movitation):

为了解决联合抽取中的暴露偏差的问题,首次提出了one-stage的解决方法。

相关工作(Related Work):

1.pipeline

        a. 易发生级联错误(Li and Ji, 2014):

https://aclanthology.org/P14-1038.pdficon-default.png?t=M4ADhttps://aclanthology.org/P14-1038.pdf2. joint

        a. 统一标记方案将联合抽取问题转换为序列标注问题,但是无法解决重叠关系(Zheng et al. (2017))。

Joint extraction of entities and relations based on a novel tagging schemeicon-default.png?t=M4ADhttps://arxiv.org/pdf/1706.05075.pdfEPO和SEO问题的解决方案:

        a. decoder-based(Zeng et al., 2018; Nayak and Ng, 2020): 像机器翻译一样每次产生一个词或一个token。

Extracting relational facts by an end-to-end neural model with copy mechanismicon-default.png?t=M4ADhttps://aclanthology.org/P18-1047.pdf
Effective modeling of encoder-decoder architecture for joint entity and relation extractionicon-default.png?t=M4ADhttps://arxiv.org/abs/1911.09886v1        b. decomposition-based(Li et al., 2019; Yu et al., 2020; Wei et al., 2020):首先识别出句子中的主体,在识别出每个主体对应的客体和关系。

提出的方法(Methods):

将句子中的所有word进行组合,对词对之间的词头对应和词尾对应进行抽取的同时,对以上对应关系进行预测,并且抽取出实体内部的头尾映射,从而解决SEO和EPO以及暴露偏差的问题。如下图所示,我们需要做的任务分为一下三种:1.对于给定的关系R,判断词p1,p2是否使两个实体的第一个词;2.对于给定的关系R,判断词p1,p2是否使两个实体的最后一个词;3.对于同一个实体内的词,判断是否是同一个实体内的第一个词和最后一个词。

TPLinker: Single-stage Joint Extraction of Entities and Relations Through Token Pair Linking_第1张图片

token-pair表示

Handshaking Tagger

TPLinker: Single-stage Joint Extraction of Entities and Relations Through Token Pair Linking_第2张图片表示预测为关系 l 的概率。

损失函数:

TPLinker: Single-stage Joint Extraction of Entities and Relations Through Token Pair Linking_第3张图片

使用的技术(Techniques):

优化器:Adam

编码器:采用了两个编码器

                1.300维的Glove向量,2层堆叠的BiLSTM,2层分别为300和600的隐藏层。

                2.bert-base-uncased,

遇到的困难(Difficulties):

矩阵的稀疏性:

TPLinker: Single-stage Joint Extraction of Entities and Relations Through Token Pair Linking_第4张图片

将矩阵转换为上三角矩阵,之后将转换后的矩阵展平为序列,并记住在原始矩阵中的位置信息。

SEO问题和嵌入式NER问题:

图2左边已经表明本方法可以解决单实体关系重复问题和嵌入式命名实体识别问题。

EPO问题:

我们对每一种关系都进行判断这样就可以解决实体对之间多关系类型的问题了。

实验结果(Results):

语料:

实验结果:

TPLinker: Single-stage Joint Extraction of Entities and Relations Through Token Pair Linking_第5张图片

计算速度对比:

TPLinker: Single-stage Joint Extraction of Entities and Relations Through Token Pair Linking_第6张图片

做出的贡献(Contributions):

1.提出了one-stage的新范式来解决联合抽取在训练阶段和推理阶段标签不一致可能导致错误累积的问题;

2.提出了有效解决SEO(multiple relations)、EPO(overlapping relations)、nested NER问题的方法;

未来展望(Future Work):

将任务泛化到nestedNER和EE等信息抽取任务中。
 

你可能感兴趣的:(#,RE,TPLinker,关系抽取,自然语言处理,NLP)