初学lucene之lucene4.x与lucene3.x控制索引域和存储域的方式对比

  lucene4.0版本做了较大的改变,其中在索引域和norms方面我们发现3.x中我们常用的属性和构造方法都被废弃了,怎么办呢?用已经废弃的方法和属性?答案当然是no,所以我在查阅了许多国外的资料(因为国内关于这个问题的资料没有)和论坛之后整理了3.x版本和4.x版本的对比如下,也算是做个记录备忘了。

        lucene 3.x版本创建Field并控制域索引及域存储代码示例:new Field("id",ids[i],Field.Store.YES,Field.Index.NOT_ANALYZED_NO_NORMS)。

        lucene 4.x要对其控制有两种方法:

       1、创建Field的子类,使用Field的子类的默认特性控制,下面是Field的子类及对应特性

              StringField:不分词、被索引。即对应Field.Index.NOT_ANALYZED。适用于原子型内容,如id、url等。

              TextField:分词、被索引。即对应Filed.Index.ANALYZED。

              StoredField:不被索引,当然也不被分词。即对应Field.Index.NO。

              所以我们可以用新的构造方法new StringField("id",ids[i],Field.Store.YES)来完成功能。但是这种方式明显不够灵活,所以个人更喜欢第二种。

       2、使用构造方法new Field("id", string, fieldtype)。这里需要先创建fieldtype对象,并使用其本身方法控制索引域和存储域。示例代码如下

                FieldType fieldtype = new FieldType();

                fieldtype.setStored(true);

                fieldtype.setOmitNorms(true);

                fieldtype.setIndexed(true);

               fieldtype.setTokenized(true);

         具体方法说明请自行查阅api。其实根据方法名也是一目了然了。

你可能感兴趣的:(初学lucene)