A Joint Named-Entity Recognizer for Heterogeneous Tag-sets Using a Tag Hierarchy 论文总结

本文章主要针对论文A Joint Named-Entity Recognizer for Heterogeneous Tag-sets Using a Tag Hierarchy 阅读后自我的总结,主要从论文介绍、论文内容、论文总结三个方面进行展开,具体论文的原文可以查看底部的链接

 

  1. 论文介绍和动机

    本论文是发表在ACL2019的一篇paper,主要针对的领域为命名实体识别,由于某些命名实体的数据集(文中交代特别是医药领域)的label可以是多样的,文中举了一个例子如Figure 1,从图中可以看出分别有Tag-set1Tag-set2Tag-set3三种不同的label。针对这样的问题,传统的做法可能是分别先建立起层次结构(tag hierarchy),训练是分别可以通过单独训练(每种label单独训练各自模型的参数)或者联合训练(共享提取特征层,一般为bilstm等序列模型), 最后在测试集上预测时通过tag hierarchy来推理得到最后的命名实体。

                                                A Joint Named-Entity Recognizer for Heterogeneous Tag-sets Using a Tag Hierarchy 论文总结_第1张图片

    为了解决上述的问题,论文提出Tag Hierarchy Model,通过构建统一的Tag Hierarchy。即将所有label统一为一种,这样训练时就不需要考虑单独或者联合训练,只需要训练一种命名实体模型就可以,构建内容如Figure 4 所示,在下一节的论文内容中会详细讲解

                                       A Joint Named-Entity Recognizer for Heterogeneous Tag-sets Using a Tag Hierarchy 论文总结_第2张图片

 

2. 论文内容

    本节主要讲解作者在证明其方法的时候所做各种实验的部分细节,其实为了证明其方法的优越性,本文分别介绍了单独训练(Indep Independent Model)和联合训练(MTL Multitasking for heterogeneous)的训练方式,并在最后对比了各种模型的指标,下面首先介绍一下IndepMTL模型

    2.1 Independent Model

    其实Independent Model就是将Figure 1中不同的训练集分别构建单独的NER模型,模型框架如Figure 2所示。最后在组合预测阶段,首先将不同模型预测的label映射到测试集的标签上,然后将不同模型的预测结果统一到一起,文中分别用了三种方式进行统一(这里就不过多介绍了)

                                                   A Joint Named-Entity Recognizer for Heterogeneous Tag-sets Using a Tag Hierarchy 论文总结_第3张图片

2.2 Multitasking for heterogeneous

    MTL的模型如Figure 3所示,可以看到不同的label共享了输入层和特征提取层(biRNN),但是没共享tagging layer(这也是本文创新点需要解决的事),预测阶段和Independent Model在最后统一时做的一样。

                                  A Joint Named-Entity Recognizer for Heterogeneous Tag-sets Using a Tag Hierarchy 论文总结_第4张图片​​​​​​​

2.3 Tag Hierarchy Model

    最后介绍下本文的创新点,本文创新点主要在与构建了一种(Tag Hierarchy)(1)将不同数据集的的label在预处理阶段统一了格式,而不需要像之前model一样需要在后处理阶段进行推理;(2)训练时只要训练一个如Figure 2一个单独的命名实体模型即可,即共享所有输入层、特征提取层和tag layer。其中Tag Hierarchy如下图所示: 

                                          A Joint Named-Entity Recognizer for Heterogeneous Tag-sets Using a Tag Hierarchy 论文总结_第5张图片

   其中在构建训练集label是分别从底往上寻找最外面的联合节点(这里联合是指几个数据集相同的根结点)作为label

3. 论文总结

    其实本文在模型上并没有什么创新的地方,主要在预处理阶段组合label时应用了(Tag Hierarchy),共享所有参数且不需要进行后处理,论文创新主要在构建label的巧妙(语义相关性)。

 

 

论文原文:https://www.aclweb.org/anthology/P19-1014.pdf

本文讲解的pdf可以在我的github上查看:https://github.com/GrinAndBear/NLP-Paper-Share/tree/master/NER

看完麻烦大家点个赞或者github上star一下多谢啦

你可能感兴趣的:(每天一篇自然语言顶会paper)