《自然语言处理实战入门》 文本检索---- 初探

文章大纲

  • 信息检索
  • 文本检索原理
    • 倒排索引
  • 搜索引擎的选择
    • Elastic Search
    • Solr
    • ES VS Solr
  • Elastic Search
    • 索引
    • 安装
  • kibana 可视化


信息检索

信息检索定义为对用户做出的查询进行响应并检索出最合适的信息的过程。在信息检索中,根据元数据或基于上下文的索引,进行搜索。搜索引擎 是信息检索的一个示例,对于每个用户的查询,它基于所使用的信息检索算法进行响应。信息检索算法中使用了倒排索引的索引机制。

信息检索任务的正确性由精准率和召回率来衡量。

假设 当用户发出查询时:

  • 给定IR系统(Information Retrieval)返回X 文档
  • 需要返回的实际或目标文档集是Y。

将召回率R 定义为系

你可能感兴趣的:(自然语言处理实战入门)