Lucene包括很多种不同的搜索方式,首先生成一个检索器IndexSearcher searcher = new IndexSearcher("Index_Path", new StandardAnalyzer(), true),然后再调用searcher.search(query),其中典型的query查询方式有以下几种:
1)按词条搜索:TermQuery,即搜索某一词条。
方法如下:Query query = new TermQuery(new Term("field", "keyword"));
其中参数field指欲查找的字段,keyword指欲检索的关键字。
2)在某一范围类搜索:RangeQuery
方法如下:RangeQuery query = new RangeQuery(begin, end, include);
其中参数begin和end均是一个Term对象,分别指在索引中相应Term的起始位置和结束位置。include是一个boolean值,true表是包含起始和结束位置,false表示不包含边界值。
3)多关键字的搜索:PhraseQuery
方法如下:
PhraseQuery query = new PhraseQuery();
query.add(new Term("content","keyword1"));
query.add(new Term("content","keyword2"));
要 注意的是PhraseQuery类中有一个setSlop方法,该方法用于设定一个称之为"坡度"的变量,来确定关键字之间是否允许、允许多少个无关词汇 存在。默认值为0,即两个关键字之间无任何词汇存在,才能被搜索到。设置该值以后,只有当两个关键字之间无关词的数目小于等于坡度值是,才能被搜索 到。(文章末尾给出了具体例子)
4)使用通配符搜索:WildcardQuery
使用方法类似于1),只不过字段的关键字允许使用?(代表一个字符)、*(代表多个字符)
另外,还有以下不同的搜索方法:
“与或”搜索BooleanQuery、使用前缀搜索PerfixQuery、使用短语缀搜索PhrasePrefixQuery、模糊查询搜索FuzzyQuery等。
* 多关键字搜索的例子 */
package testlucene;
import org.apache.lucene.analysis.standard. * ;
import org.apache.lucene.document. * ;
import org.apache.lucene.index. * ;
import org.apache.lucene.search. * ;
public class PhraseQueryTest {
public static void main(String[] args) throws Exception{
Document doc1 = new Document();
doc1.add( new Field( " content " , " david mary smith robert " ,Field.Store.YES,Field.Index.TOKENIZED));
doc1.add( new Field( " title " , " doc1 " ,Field.Store.YES,Field.Index.TOKENIZED));
Document doc2 = new Document();
doc2.add( new Field( " content " , " david smith mary robert " ,Field.Store.YES,Field.Index.TOKENIZED));
doc2.add( new Field( " title " , " doc2 " ,Field.Store.YES,Field.Index.TOKENIZED));
Document doc3 = new Document();
doc3.add( new Field( " content " , " david smith robert mary " ,Field.Store.YES,Field.Index.TOKENIZED));
doc3.add( new Field( " title " , " doc3 " ,Field.Store.YES,Field.Index.TOKENIZED));
IndexWriter writer = new IndexWriter( " c:\\index " , new StandardAnalyzer(), true );
// writer.setUseCompoundFile(true); // 设置为混合索引格式
writer.addDocument(doc1);
writer.addDocument(doc2);
writer.addDocument(doc3);
writer.close();
IndexSearcher searcher = new IndexSearcher( " c:\\index " );
Term word1 = new Term( " content " , " david " );
Term word2 = new Term( " content " , " mary " );
Term word3 = new Term( " content " , " smith " );
Term word4 = new Term( " content " , " robert " );
PhraseQuery query = new PhraseQuery();
query.add(word1);
query.add(word2);
query.add(word3);
query.setSlop(Integer.MAX_VALUE);
Hits hits = searcher.search(query);
Print.printResult(hits, " david and mary " );
}
}
ExtJS教程- Hibernate教程- Struts2 教程- Lucene教程