lucene4.0版本做了较大的改变,其中在索引域和norms方面我们发现3.x中我们常用的属性和构造方法都被废弃了,怎么办呢?用已经废弃的方法和属性?答案当然是no,所以我在查阅了许多国外的资料(因为国内关于这个问题的资料没有)和论坛之后整理了3.x版本和4.x版本的对比如下,也算是做个记录备忘了。
lucene 3.x版本创建Field并控制域索引及域存储代码示例:new Field("id",ids[i],Field.Store.YES,Field.Index.NOT_ANALYZED_NO_NORMS)。
lucene 4.x要对其控制有两种方法:
1、创建Field的子类,使用Field的子类的默认特性控制,下面是Field的子类及对应特性
StringField:不分词、被索引。即对应Field.Index.NOT_ANALYZED。适用于原子型内容,如id、url等。
TextField:分词、被索引。即对应Filed.Index.ANALYZED。
StoredField:不被索引,当然也不被分词。即对应Field.Index.NO。
所以我们可以用新的构造方法new StringField("id",ids[i],Field.Store.YES)来完成功能。但是这种方式明显不够灵活,所以个人更喜欢第二种。
2、使用构造方法new Field("id", string, fieldtype)。这里需要先创建fieldtype对象,并使用其本身方法控制索引域和存储域。示例代码如下
FieldType fieldtype = new FieldType();
fieldtype.setStored(true);
fieldtype.setOmitNorms(true);
fieldtype.setIndexed(true);
fieldtype.setTokenized(true);
具体方法说明请自行查阅api。其实根据方法名也是一目了然了。