面向多段落高考阅读理解的答案句抽取方法

摘要

高考阅读理解试题语言复杂度高、自动答题难度大,是机器阅读理解领域极具难度的研究对象。问答题是高考阅读理解试题一类重要题型,答案通常分布在阅读材料的不同段落,现有抽取式阅读理解方法并未考虑该情况。同时,材料中答案句的数量通常远小于非答案句,存在不平衡特性。基于此,采用“段落筛选器—答案句抽取”答题框架,计算段落与问题的相关性得分对段落进行排序,为每个问题选择与之最相关的前k个段落,采用数据增强方法扩充数据集中的答案句,解决答案句较少的问题。实验结果表明,所提出的方法召回率达到51.76%,相较于基线模型RoBERTa提升11.37%。

0 引言

机器阅读理解的主要目标是让机器阅读一段材料后回答问题。研究主要分为基于规则、基于机器学习、基于深度学习3个发展阶段。

20世纪

你可能感兴趣的:(大数据及数据管理(治理)专栏,机器学习,人工智能,深度学习)