Infomation retrieval & information filtering

最近选修一门“基于web的信息检索和知识发现”课程,同时也跟听一门Recommender systems的开放课,这里记录和整理一些关于课程的基本内容。

  • 1.信息检索

    信息检索(Infomation Retrieval)是从庞大的信息集合中获取所与需信息相关的内容的过程。Web上的信息可以看作为内容海量,非结构化的数据库,在其中高效、准确地检索到所需的信息被看作一项重要的发展要求,现在也是互联网发展的热点技术之一。
    信息检索的过程一般由用户发起检索请求(请求可以是字符串或者其他形式,但必须是计算机能够识别的与搜索内容有关的描述),检索系统通过一系列的操作将信息返回给用户,这些信息是按与其搜索内容相关程度排列的。下面有一张示意图。
    Infomation retrieval & information filtering_第1张图片
    信息检索的特点是:大部分的索引数据是静态的,而用户的需求则不断在变化,这点与下面的信息过滤是最大的不同。

  • 2.信息过滤

    与信息检索不同,信息过滤需要用自动化方法将来自信息源的内容根据用户的偏好做筛选,显示给用户最想看到的信息。这里就可一看出来,过滤的信息源是动态改变的,而用户的需求则段时间内不会变。这点在邮件过滤和新闻定制上可见一斑,通过对类别的一系列逻辑操作,得到过滤后的信息,执行特定的指令。

你可能感兴趣的:(信息检索,信息过滤)