如题。
对于文章正文,希望使用中文分词器。
而用户在提交文件时让其输入的文章关键字,多个用空格分开,则希望使用WhitespaceAnalyzer进行分词并保存。
Java代码
doc.add(new Field("TXT",text, Field.Store.YES, Field.Index.ANALYZED));
doc.add(new Field("KEYWORD", keyWord, Field.Store.YES, Field.Index.ANALYZED));
doc.add(new Field("TXT",text, Field.Store.YES, Field.Index.ANALYZED));
doc.add(new Field("KEYWORD", keyWord, Field.Store.YES, Field.Index.ANALYZED));
引用 收藏
自己实现分词器! 研究下lucene相关的代码,还是蛮简单的! 引用 收藏
可以使用PerFieldAnalyzerWrapper
//默认为庖丁分词
PerFieldAnalyzerWrapper wrapper =
new PerFieldAnalyzerWrapper(new PaodingAnalyzer());
//fieldName 为field名称
//analyzer field对应分词器
wrapper.addAnalyzer(fieldName, analyzer); 引用 收藏
illu 写道
可以使用PerFieldAnalyzerWrapper
//默认为庖丁分词
PerFieldAnalyzerWrapper wrapper =
new PerFieldAnalyzerWrapper(new PaodingAnalyzer());
//fieldName 为field名称
//analyzer field对应分词器
wrapper.addAnalyzer(fieldName, analyzer);
大开眼界呀!去研究一下~