从lucene看世界(三) 域选项

存储域选项:Store.YES或者NO 文档是否保存

索引域选项:

Index.ANALYZED进行分词和索引,适用于标题和内容

Index.NOT_ANALYZED进行索引,但是不进行分词,如身份证号,ID等,适用于精确搜索

Index.ANALYZED_NOT_NORMS,进行分词但是不存储norms信息,norms包括创建索引的时间和权重等信息。

Index.NOT_ANALYZED_NOT_NORMS不分词,不加权

Index.NO不索引

 

索引过后生成的文件信息如下:

_0.fdt 保存需要存储的数据

_0.fdx 保存需要存储的数据

_0.fnm 保存域选项的信息

_0.frq  保存词条出现多少次,倒排索引信息

_0.nrm 用来评分和排序信息

_0.prx 保存偏移量

_0.tii   保存所有索引里面的所有内容信息

_0.tis   保存所有索引里面的所有内容信息

segments.gen

segments_1  段文件

文档相当于表中的每一条记录,域相当于表中的每一个字段。先创建文档,之后为文档添加域。

 

 

你可能感兴趣的:(日积月累)