在自然语言处理中,“选择偏好”这个概念非常容易理解。比如下面的例子:
a)我吃了一个苹果。
b)电脑吃了一串钥匙。
很明显a句子是非常合理的,但b句子就非主流了。对于“吃”这个谓语动词,它的主语通常是动植物,而宾语通常就是能被吃的东西了。所以说,在自然语言中,谓语(Predicate)对其论元(Argument)是有一定选择倾向性的,不是什么词语都可以通过简单排列组合进行搭配的。
选择偏好(Selectional Preference)有时也被称为选择限制(Selectional Restriction),语义优选等等,还有一大堆同义词:selectional rules, selectional restrictions,restrictions of cooccurrence,sortal (in)correctness,category mistake,selectionally incorrect,type crossing, semi-grammatical,semantically anomalous [1]。
中文研究有不少,如[2][3][4][5]。国际上的研究很多都是利用选择偏好这个技术来服务其它上层的自然语言处理任务,比如[6]用来服务语义角色标注(Semantic Role Classification),[7]用来服务关系抽取(Relation Extraction), [8]用来服务机器翻译(Machine Translation),[9]用来服务指代消解(Coreference Resolution)。当然也不缺乏对选择偏好这个问题本身的改进优化研究,如 Zhenhua Tian等人[10]提出了基于随机游走的方法来获取选择偏好知识,Ekaterina Shutova等人[11]提出了基于多模态学习的选择偏好知识获取,也就是说不单单通过文本,还包括图片和视频。
选择偏好在很多任务上有特殊的作用,比如在对话生成系统,如果系统可以生成一些不常搭配的动宾关系,往往会产生幽默效果,如“桌子哪去了?难道被你吃了?”。此外,选择偏好在隐喻识别(Metaphor Recognition)中也能起到一定作用。
References:
[1] 2011, Shared Components Topic Models with Application to Selectional Preference, Matthew Gormley, NIPS
[2] 2005, 动词对宾语的语义选择限制, 吴云芳, 语言文字应用
[3] 2012, 无指导学习语义优选, 李东明, 计算机应用与软件
[4] 2014, 汉语语义选择限制知识的自动获取研究, 贾玉祥, 中文信息学报
[5] 2015, 基于神经网络的语义选择限制知识自动获取, 贾玉祥, 中文信息学报
[6] 2013, Selectional Preferences for Semantic Role Classification, Beñat Zapirain, Computational Linguistics
[7] 2016, Incorporating Selectional Preferences in Multi-hop Relation Extraction, NAACL
[8] 2016, Improving Statistical Machine Translation with Selectional Preferences, Haiqing Tang, COLING
[9] 2017, Revisiting Selectional Preferences for Coreference Resolution, Benjamin Heinzerling, EMNLP
[10] 2013, A Random Walk Approach to Selectional Preferences Based on Preference Ranking and Propagation, Zhenhua Tian, ACL
[11] 2015, Perceptually Grounded Selectional Preferences, Ekaterina Shutova, ACL