PW07信息时代的两把武器—信息过滤与检索

《Information filtering and information retrieval: Two sides of the same coin?》是Nicholas J. Belkin和W. Bruce Croft于1992年共同编纂的论文,其主要分析了信息过滤与信息检索这两个系统以及它们各自的特点与联系。

目前,在信息领域,信息技术已经得到了很好的发展,这我们在互联网中可以浏览到各种在线的电子文档,信息浩如瀚海。然而,当我们尝试着利用这些信息的时候,却又很难找到自己感兴趣的信息,即使找到一些有用的信息,也经常混杂着很多的垃圾。

因此,为了能够根据用户个人需求提供给用户真正感兴趣的信息,出现了信息检索信息过滤两种信息搜索方法,论文中巧妙地将它们比作硬币的正反面,两者有着紧密的联系:过滤实质上是建立在检索的基础之上的,它借鉴了许多检索的表示方法和技术。

然而,两者也有着各自不同的特点,文中所提到的观点是:

一:当检索涉及对文本信息进行收集和组织的时候,过滤则涉及将此信息分发给群体或个人;

二:当信息检索从静态数据库中选择文本时,过滤则是在动态数据库里选择或删除文本;

三:信息检索其实是典型地关注单一的系统使用,即用户对自己一个目标进行一次查询而信息过滤则是系统的重复使用,为了解一个用户或多个用户的目标或兴趣;

四:信息检索在足够多的检索之后可以意识到继承的问题并将其做为其信息需求的代表,信息过滤假定概述能够成为信息权益的正确说明;

五:信息检索大体上研究了定义明确的用户组,主要是在科学和技术领域,这些用户几乎总是在他们的信息寻求行为中受到高度的激励。不过,过滤常常涉及非常不明确的用户社区,比如在家中寻找娱乐的人,以及具有高度多样性的领域。

众所周知,网上的内容和信息都是设计给人阅读的,而不是让计算机“阅读”的。而现在,为了让机器也能读懂我们的语言,出现了“语义网”。作为网络时代的高级产物,语义网的兴起是对未来网络的一个设想,是3.0网络时代的特征之一,是能够供给计算机阅读的文档。语义网的出现,使信息过滤提高到了语义的层次,它使用户获取到更加高效、准确的信息。

然而,现有的网站采用的搜索技术大多数以关键字技术为主, 主要方式是关键字匹配查询,这样使得信息资源不能做到语义共享, 信息检索不到真正需要的数据, 究其原因是信息资源没有统一的语义描述,。

因此,目前信息检索领域所面临的主要问题应该是通过语义检索来提高检索的准确率。

你可能感兴趣的:(PW07信息时代的两把武器—信息过滤与检索)