Lucene學習筆記(三)

基于Lucene的应用开发

首先,我们需要的是按照目标语言的词法结构来构建相应的词法分析逻辑,实现Luceneorg.apache.lucene.analysis中定义的接口。Lucene默认的已经实现了英文和德文的简单词法分析逻辑(按照空格分词,并去除常用的语法词,如英语中的isamare等等)。

在这里,主要需要参考实现的接口在org.apache.lucene.analysis中的Analyzer.javaTokenizer.java中定义.

Lucene采用其内部的相关性方法来处理评分和排序,我们可以根据需要改变它。遗憾的是,这部分Lucene并没有做到如同扩充词法解析和文档类型那样的条理清晰,没有留下很好的接口

你可能感兴趣的:(java,apache,Lucene)