做lucence时遇到的一些问题

1.分词
英文不分词:在把字段设置问text ,用(“XXXX”)

2.lucence自定义排序
继承Similarty 修改返回值都为1.0f  重建索引


3.paoding 分词
副词,介词

庖丁建立分词索引会忽略副词介词量词,如:的,往,业。。。。
解决方法  在庖丁字典目录下有个隐藏文件.compiled\most-words-mode\x-noise-charactor.dic.compiled  编译完后 删除

你可能感兴趣的:(职场,分词,休闲,lucence,paoding)