Lucene 中 .fdx 和 .fdt 和.tis和.tii 还有.cfs含义

1、
.fdx 和 .fdt是使用综合的两个文件,其中.fdt用于存储具有Store.YES属性的Field的数据
而.fdt则是一个索引,用于存储Document在.fdt中的位置。
2、
.tis文件用于存储分词后的词条(Term), 而.tii就是它的索引文件,它标明了每个.tis文件中的词条位置。
3、
.cfs(复合索引格式):
在IndexWriter总有一个属性:useCompoundFile, 它的默认值为true, 这个属性的含义为
是否使用复合索引格式来保存索引。索引的内容可能会非常大文件数目非常大将极消耗系统资源。
因此Lucene提供了一种单文本索引格式,也就是所谓的复合索引格式。
使用复合索引格式存储Document内容时,只需要在初始化完一个IndexWriter对象后,使用setUseCompoundFile(boolean)
方法。将useCompoundFile的属性值设置为true就可以了。







你可能感兴趣的:(Lucene 中 .fdx 和 .fdt 和.tis和.tii 还有.cfs含义)