论文笔记(1)

《问答系统研究综述》毛先领+ , 李晓明
北京大学 信息科学技术学院, 北京 100871
2012年的论文

一、问答系统的分类

问答系统包括三个主要部分:问题分析,信息检索和答案抽取。
- 从问题来划分:限定领域的问答系统、开放领域的问答系统
- 从数据来来划分:处理结构数据(半结构数据)的问答系统、处理无结构数据的问答系统
- 从答案纬度来划分:抽取式问答系统、产生式问答系统

二、基于结构化的问答系统

其主要思想就是把问题转化为一个查询,然后在结构化数据中进行查询,返回查询结构即为问题的答案
数据处理流程

1.根据问题特点来分析问题,产生一个结构数据的查询语言格式的查询
2.将产生的查询提交给管理结构数据的系统(数据库等),系统根据查询的限制条件筛选数据
3.把匹配的数据作为答案返回给用户

三、基于自由文本的问答系统

image.png

关于答案抽取部分:
1. 基于表层特征的答案提取。常用的表层特征是答案周围段落的一些特征,如段落和查询的相关程度、查询词之间的距离、查询词和候选答案之间的距离。另一个常用特征是候选答案出现的次数。
2. 通过关系抽取答案。表层特征没有考虑语法,语义的因素,容易出错,特别是词相同,但词序不同的情况。其中一种方法是把问句和文本中的句子转换成
三元组, 三元组的基本构成是〈主语,谓语,宾语〉,
删除句子中的修饰成分, 就可以从文本三元组中获
得答案而不产生混淆
3. 通过模式匹配抽取答案。主流方法是在训练数据上自动学习得到模式。
4. 通过统计模型抽取答案。

四、基于问题答案对的问答系统

分为基于常见问题(FAQ)列表的问答系统,基于社区问答(CQA)的问答系统


image.png

你可能感兴趣的:(论文笔记(1))