Annotated Lucene (源码剖析)

Annotated Lucene (源码剖析)

  Apache Lucene是一个高性能(high-performance)的全能的全文检索(full-featured text search engine)的搜索引擎框架库,完全(entirely)使用Java开发。它是一种技术(technology),适合于(suitable for)几乎(nearly)任何一种需要全文检索(full-text search)的应用,特别是跨平台(cross-platform)的应用。

  • Annotated Lucene:第一节 Lucene是什么
  • Annotated Lucene:第二节 索引文件概述
  • Annotated Lucene:第三节 索引文件结构(1) - 每个Index包含的文件
  • Annotated Lucene:第三节 索引文件结构(2) - 每个Segment包含的文件
  • Annotated Lucene:第三节 索引文件结构(3) - Field数据(.fdx和.fdt)
  • Annotated Lucene:第三节 索引文件结构(4) - Term字典(.tii和.tis)
  • Annotated Lucene:第三节 索引文件结构(5) - Term频率数据(.frq)
  • Annotated Lucene:第三节 索引文件结构(6) - Positions位置信息数据(.prx)
  • Annotated Lucene:第三节 索引文件结构(7) - Term向量文件
  • Annotated Lucene:第三节 索引文件结构(8) - 删除的文档 (.del)
  • Annotated Lucene:第四节 索引是如何创建的
  • Annotated Lucene:第四节 索引创建过程(1)
  • Annotated Lucene:第四节 索引创建过程(2)
  • Annotated Lucene:第五节 索引是如何存储的
  • Annotated Lucene:第六节 文档内容是如何分析的
  • Annotated Lucene:第七节 如何给文档评分
 

备注:未完待续,部分内容和插图译自Lucene网站及代码,个别图片来自网上
Annotated Hadoop 作者:naven 日期:
2008-10-20

你可能感兴趣的:(Annotated Lucene (源码剖析))