关于信息检索的几个根本问题

Q:信息需求和查询词的关系?

A:查询词是用户自身用来描述自己信息需求的词。

比如,我想知道中国新说唱的冠军是谁。那么我的查询词可以设置为中国新说唱冠军。这个查询就是我自己概括的能反映我信息需求的词。

Q:常用的Test Collection到底指的是啥?

A:常规的方法评估信息检索系统就需要一个测试集。这个测试集包括以下三部分

1.一个文档集

2.一组用于测试的信息需求集合,信息需求可以表示成查询。(就我个人而言,用到的信息需求集合,好像都是以主题的形式展示,50个,具体的构成可以参加国外的比赛,有数据集分享)

3.一组相关性判定结果,对每一个查询-文档对而言,通常会赋值0或1,代表相关不相关。

你可能感兴趣的:(关于信息检索的几个根本问题)