【论文原文】:OneEE: A One-Stage Framework for Fast Overlapping and Nested Event Extraction
【作者信息】:Cao, Hu and Li, Jingye and Su, Fangfang and Li, Fei and Fei, Hao and Wu, Shengqiong and Li, Bobo and Zhao, Liang and Ji, Donghong
论文:https://arxiv.53yu.com/pdf/2209.02693.pdf
代码:https://github.com/Cao-Hu/OneEE (代码未上传)
博主关键词:事件抽取、重叠和嵌套事件、单阶段
推荐论文:TPLinker:http://t.csdn.cn/tW8n2,CasEE:http://t.csdn.cn/FQZuX
事件抽取(EE)是信息抽取的基本任务,旨在从非结构化文本中抽取结构化事件信息。大多数先前的工作集中于抽取平面事件,而忽略了重叠或嵌套的事件。一些用于重叠和嵌套EE的模型包括几个抽取事件触发词和论元的连续阶段,这些阶段会受到错误传播的影响。因此,我们设计了一个简单而有效的标注方案和模型来表述EE作为词-词关系识别,称为OneEE。通过并行网格标记,在一个阶段内同时识别触发词和论元词之间的关系,从而获得非常快的事件抽取速度。该模型采用自适应事件融合模块生成事件感知表示,采用距离感知预测器集成相对距离信息进行词-词关系识别,并通过实例验证了这两种机制的有效性。在3个重叠和嵌套的EE基准(即FewFC、Genia11和Genia13)上进行的实验表明,OneEE实现了最先进的(SoTA)结果。此外,在相同条件下,OneEE的推理速度比基线的推理速度快,由于支持并行推理,可以进一步大幅度提高推理速度。
图1展示了现有事件抽取的情况,大致可以分为Flat Event
,Overlapped Event
,Nested Event
三种。传统的方法常将EE看成序列标注任务,不能有效解决事件提及的重叠问题,如图1中的(b)所示,两个重叠的事件共享触发词acquired
。图1中的©展示了嵌套事件的例子,其中Gene Expression
事件是另一个Positive Regulation
事件的Theme
论元。
重叠和嵌套EE的前期研究(Yang et al, 2019;Li et al,2020)采用基于管道的方法,在几个连续的阶段抽取事件触发词和论元。最近,最先进的模型Sheng等人(2021)也使用了这样一种连续执行事件类型检测、触发词抽取和论元抽取的方法。这种方法的主要问题是后一阶段依赖于前一阶段,这固有地带来了误差传播问题。
为了解决上述问题,我们提出了一种新的标记方案,将重叠和嵌套的EE转换为词-词关系识别。如图2所示,我们设计了两种类型的关系,包括跨度关系(S-*)和角色关系(R-*)。S-*处理触发词和论元识别,表示两个单词是触发词(T)的头尾边界还是论元(a)的头尾边界。R-*处理论元角色分类,表示论元是否在事件中扮演“*”角色。
在此基础上,我们进一步提出了一个单阶段事件抽取模型,该模型主要包括三个部分。首先,它采用BERT (Devlin et al, 2019)作为编码器来获得上下文化的单词表示。然后,使用自适应事件融合层(由一个注意模块和两个门融合模块组成)获得每种事件类型的事件感知上下文表示。在预测层,我们通过计算距离感知分数,并行预测每对单词之间的跨度和角色关系。最后,可以在一个阶段中使用这些关系标签解码事件触发词、论元及其角色,而不会出现错误传播。
我们在3个重叠和嵌套的EE数据集上评估了OneEE (FewFC (Zhou et al, 2021), Genia11 (Kim et al, 2011)和Genia13),并进行了广泛的实验和分析。
我们的模型体系结构如图3所示,它主要由三个部分组成。首先,使用广泛使用的预训练语言模型BERT (Devlin et al, 2019)作为编码器,从输入句子中产生上下文化的单词表示。然后,采用自适应事件融合层(由一个注意力模块和两个门模块组成)将目标事件类型嵌入到上下文表示中;然后利用预测层联合抽取词对之间的跨度关系和角色关系。
数据集
实验结果
表2报告了所有方法在重叠EE数据集FewFC上的结果,而表3报告了嵌套EE数据集Genia11和Genia13上的结果。我们可以观察到:
1)我们的方法显著优于所有其他方法,并在所有三个数据集上都获得了最先进的F1分数。
2)与序列标注方法相比,我们的模型获得了更好的召回率和F1分数。具体而言,在FewFC数据集上,我们的模型在召回率和AC F1分数上比BERT-CRFjoint分别提高了11.7%和6.3%,在两个Genia数据集上,AC F1分数平均提高了4.4%。结果表明,序列标注方法只能解决Flat EE问题,OneEE模型在重叠和嵌套EE问题上是有效的。
3)与多阶段方法相比,我们的模型在F1分数上的表现也有了很大的提高。我们的模型在三个数据集上的TC F1得分平均比最先进的模型CasEE高出2.1%。我们认为这是因为我们的自适应事件融合模块很好地学习了事件特征。特别是,我们的模型在三个数据集上比CasEE平均提高了3.4%的AI和1.6%的AC。结果显示了我们的单阶段框架的优越性,它可以很好地实现重叠和嵌套的事件抽取,并且没有错误传播。
图五展示了OneEE效果好于其他模型,重点原因有两个:
消融实验