lucene核心api

1.    Lucene的核心API介绍 

1.1            建立索引的API

5.1.1IndexWriter

 

1) 利用这个类可以对索引库进行增、删、改操作。

2) 利用构造方法IndexWriter indexWriter = newIndexWriter(directory,LuceneConfig.analyzer,MaxFieldLength.LIMITED)可以构造一个IndexWriter的对象。

3) addDocument    向索引库中添加一个Document

4) updateDocument           更新一个Document

5) deleteDocuments           删除一个Document

5.1.2 Directory

 

           指向索引库的位置,有两种Directory

5.1.2.1FSDirectory

1)    通过FSDirectory.open(newFile("./indexDir"))建立一个indexDir的文件夹,而这个文件夹就是索引库存放的位置。

2)    通过这种方法建立索引库时如果indexDire文件夹不存在,程序将自动创建一个,如果存在就用原来的这个。

3)    通过这个类可以知道所建立的索引库在磁盘上,能永久性的保存数据。这是优点

4)    缺点为因为程序要访问磁盘上的数据,这个操作可能引发大量的IO操作,会降低性能。

5.1.2.2RAMDirectory

1)    通过构造函数的形式Directoryramdirectory = new RAMDirectory(fsdirectory)可以建立RAMDirectory。

2)    这种方法建立的索引库会在内存中开辟一定的空间,通过构造函数的形式把fsdirectory移动到内存中。

3)    这种方法索引库中的数据是暂时的,只要内存的数据消失,这个索引库就跟着消失了。

4)    因为程序是在内存中跟索引库交互,所以利用这种方法创建的索引的好处就在效率比较高,访问速度比较快。

5.1.3 Document

 

1) 通过无参的构造函数可以创建一个Document对象。Document doc = new Document();

2) 一个Directory是由很多Document组成的。用户从客户端输入的要搜索的关键内容被服务器端包装成JavaBean,然后再转化为Document。这个转化过程的代码如下:

5.1.4 Field

 

1) Field相当于JavaBean的属性。

2) Field的用法为:

new Field("title",article.getTitle(),Store.YES,Index.ANALYZED)

a)    第一个参数为属性

b)    第二个参数为属性值

c)     第三个参数为是否往索引库里存储

d)    第四个参数为是否更新引索

1)      NO   不进行引索

2)      ANALYZED  进行分词引索

3)      NOT_ANALYZED 进行引索,把整个输入作为一个词对待。

5.1.5 MaxFieldLength

 

a) 能存储的最大长度

b) 在IndexWriter的构造方法里使用

c)  值为:

1)    LIMITED    限制的最大长度   值为10000

2)    UNLIMITED 没有限制的最大长度(一般不使用)

 

你可能感兴趣的:(lucene核心api)