【论文】Emotion-Cause Pair Extraction: A New Task to Emotion Analysis in Texts 阅读笔记

Basic Information

  • Title: Emotion-Cause Pair Extraction: A New Task to Emotion Analysis in Texts List item
  • Authors: Rui Xia, Zixiang Ding
  • Institution: Nanjing University of Science and Technology
  • Conference/Journal: ACL 2019
  • Cite: Xia R, Ding Z. Emotion-Cause Pair Extraction: A New Task to Emotion Analysis in Texts[J]. arXiv preprint arXiv:1906.01267, 2019.
  • Github: https://github.com/NUSTM/ECPE

Background

这是一篇2019ACL的杰出论文,由南京理工大学的夏睿老师及其博士生丁子祥完成。其研究方向为自然语言处理与文本挖掘:文本分类;情感分析与观点挖掘等。

Task&Contributions

在Emotion Cause Extraction前,情感分析相关研究大多集中在情感分类和情感要素抽取的任务上,相关的技术也较为成熟。EMNLP 2017 论文《A Question Answering Approach forEmotion Cause Extraction》提出从情感原因的角度出发,对情感文本的情感原因进行抽取。任务通常是给定文本,并给出文本对应的情感,然后找到文本情感对应的cause子句。但这有两个问题:首先,这需要文本预先给定emotion的标注;另外,先标emotion再标cause,这样会把两个任务割裂开,但实际上它们内在有一定的关联性,可以互相促进。所以针对这两个问题,提出了一个Emotion-Cause Pair Extraction的任务。这篇论文的贡献如下:

  • We propose a new task: emotion-cause pair extraction (ECPE).(提出了新任务Emotion-Cause Pair Extraction的提取)
  • We propose a two-step framework to address the ECPE task(提出ECPE模型解决了以上问题)
  • Based on a benchmark ECE corpus, we construct a corpus suitable for the ECPE task.(构造了适合ECPE的新的语料库)

Problem Definition

对于之前的ECE任务,它是给定happy,在文章中抽取出子句2和3两个couse,CEPE任务中,给定一个文档,需要自己提取出emotion和cause来组成一个pair。比如emotion就是the old man is happy,couse有两个,就有两个pair。【论文】Emotion-Cause Pair Extraction: A New Task to Emotion Analysis in Texts 阅读笔记_第1张图片

method

本文的method主要有两个step。
step1:首先将情感原因对的提取任务转化为两个独立的任务(分别是emotion情感提取和couse原因提取)。对两个多任务学习网络在同一框架下进行建模,提取出情感子句 E={ c 1 e , . . . , c n e c1^e,...,cn^e c1e...cne},和原因子句 C={ c 1 c , . . . , c n c c1^c,...,cn^c c1c...cnc}。
step2:情感原因对的配对和过滤,将 E 和 C 通过笛卡儿积进行配对,通过训练 a filter 清除不包含情感和原因之间的因果关系对。

step 1

在此提出了Independent Multi-task Learning (独立多任务学习)和 Interactive Multi-task Learning(交互式多任务学习),后者是前者的强化版本,在前者的基础上进一步抓取了情感和原因之间的联系。
在任务中,在我们的任务中,文档包含多个子句:d=[c1,c2,…,cd],每个ci还包含多个单词ci=[ w i , 1 , w i , 2 , . . . , w i , 3 wi,1,wi,2,...,wi,3 wi,1wi,2...wi,3]。为了捕获这种[word-clause-document]的结构,用了两层Bi-LSTM网络。【论文】Emotion-Cause Pair Extraction: A New Task to Emotion Analysis in Texts 阅读笔记_第2张图片
最下层用的是word-level的Bi-LSTM,每个模块对应一个子句,用Bi-LSTM和attention获得句子的表示 s i si si,这个部分是共享的。第二层对应为两部分,一个是情感提取一个是原因提取,每个Bi-LSTM都是句子级别的,接收d个句子表示,然后d个子句特征再作为输入,输入到更高一级的BiLSTM中,得到表示作为该个子句的context-aware特征,并接一个softmax对该子句进行分类。这部分参数不同的task之间是不共享的。再通过【论文】Emotion-Cause Pair Extraction: A New Task to Emotion Analysis in Texts 阅读笔记_第3张图片
得到最终结果。下面是loss function:【论文】Emotion-Cause Pair Extraction: A New Task to Emotion Analysis in Texts 阅读笔记_第4张图片
到目前为止,上层两个Bi-LSTM相互独立,但是这两个任务是具有关联的。一方面,提供情感可以更好的提取原因,另一方面,了解原因可以更好的提取情感。在此基础上,提出了Multi-task Learning(交互式多任务学习),捕捉情感和关系之间的联系。
利用情感提取原因是Inter-EC,否则为Inter-CE。
【论文】Emotion-Cause Pair Extraction: A New Task to Emotion Analysis in Texts 阅读笔记_第5张图片
这个新model左右类似,只说左边。把上一步得到的 y i e yi^e yie预测标签再次嵌入得到 Y i e Yi^e Yie,以 y i e ⊕ s i yi^e⊕si yiesi作为输入,得到最后的原因提取。至于这个emotion label信息,论文中说的是是标签,实验中用的直接是softmax的结果。

step 2

第二部分是情感和原因的配对和过滤。把提取出来的emotion情感集合中的每个元素和couse原因集合中的每个元素用笛卡尔乘积两两组合,组合完得到集合:在这里插入图片描述
接着把Pall中的每个pair 转化成包含三个特征的向量,
在这里插入图片描述
s i e si^e sie s j c sj^c sjc是两个子句的表示, v d v^d vd是两者之间的距离。
再用logistic回归去检测每个候选对,判断 c i e ci^e cie c j c cj^c cjc是否存在因果关系。
在这里插入图片描述
y=1表示有关,y=0表示无关,删除无关关系对。

Experiments

【论文】Emotion-Cause Pair Extraction: A New Task to Emotion Analysis in Texts 阅读笔记_第6张图片

你可能感兴趣的:(自然语言处理)