Lucene(8):Lucene底层储存结构

1 详细理解lucene存储结构

存储结构 :

Lucene(8):Lucene底层储存结构_第1张图片

索引(Index) :

  • 一个目录一个索引,在Lucene中一个索引是放在一个文件夹中的。

段(Segment) :

  • 一个索引(逻辑索引)由多个段组成, 多个段可以合并, 以减少读取内容时候的磁盘IO。
  • Lucene中的数据写入会先写内存的一个Buffer,当Buffer内数据到一定量后会被flush成一个Segment,每个Segment有自己独立的索引,可独立被查询,但数据永远不能被更改。这种模式避免了随机写,数据写入都是批量追加,能达到很高的吞吐量。Segment中写入的文档不可被修改,但可被删除,删除的方式也不是在文件内部原地更改,而是会由另外一个文件保存需要被删除的文档的DocID,保证数据文件不可被修改。Index的查询需要对多个Segment进行查询并对

你可能感兴趣的:(Lucene,lucene,搜索引擎,全文检索)