Chuanqi Tany, FuruWei, Wenhui Wang, Weifeng Lv, Ming Zhou
IJCAI 2018
句子建模是自然语言处理中一个十分重要的任务,对句子建模后可以用以判断两个句子的关系,在文本蕴含识别、句子相似度计算、自动问答系统等任务中都经常用到。该文 [ ^[ [ 1 ^1 1 ] ^] ]是发表在IJCAI2018会议上的一篇论文,文章主要使用多种注意力机制来对句子建模,多个实验表明,该文所提出的方法在多个句子级别的任务上可以达到state-of-art的效果。
1.1 任务描述
\quad 大多数句子级别上的任务都可以描述成为三元组的形式: , 其中 Q = { q 1 , q 2 , . . . , q N } Q=\{q_1, q_2, ..., q_N\} Q={ q1,q2,...,qN}, P = { p 1 , p 2 , . . . , p M } P=\{p_1, p_2, ..., p_M\} P={ p1,p2,...,pM},N和M分别是句子Q和句子P的单词数, y y y ∈ \in ∈ γ \gamma γ指示为标签,该任务可以描述成自动识别句子 Q , P Q,P Q,P的关系 y y y。
\quad 特定地,
\quad \quad 针对“复述识别”(Paraphrase Identification)任务, γ = { 0 , 1 } \gamma=\{0,1\} γ={ 0,1},其中 y = 1 y=1 y=1表示句子Q和P是可复述的, y = 0 y=0 y=0则表示不可复述;
\quad \quad 针对“蕴含识别”(Natural Language Inference)任务, γ = { e n t a i l m e n t , c o n t r a d i c t i o n , n e u t r a l } \gamma=\{entailment, contradiction, neutral\} γ={ entailment,contradiction,neutral},其中entailment表示句子Q蕴含句子P,即句子P可以由Q推出,contradiction表示在句子Q出现的条件下句子P是不可能出现的,即矛盾关系,neutral表示句子Q和P是不相关的;
\quad \quad 针对自动问答领域中“答案句子选择”(Answer sentence selection)任务, γ = { 0 , 1 } \gamma=\{0,1\} γ={ 0,1},1表示答案P是问题Q的答案,0则不是。
1.2 两个方向
\quad \quad 在论文提出的方法中,主要使用了4中不同的注意力机制模型,在相关工作这一部分就简要介绍一下这4中注意力机制模型的出处,其他略过。
[1] Tan, C., Wei, F., Wang, W., Lv, W., & Zhou, M. (2018). Multiway Attention Networks for Modeling Sentence Pairs. In IJCAI (pp. 4411-4417).
Rocktäschel, T., Grefenstette, E., Hermann, K. M., Kočiský, T., & Blunsom, P. (2015). Reasoning about entailment with neural attention. arXiv preprint arXiv:1509.06664.
Chen, D., Bolton, J., & Manning, C. D. (2016). A thorough examination of the cnn/daily mail reading comprehension task. arXiv preprint arXiv:1606.02858.
Wang, S., & Jiang, J. (2016). A compare-aggregate model for matching text sequences. arXiv preprint arXiv:1611.01747.