Lucene 2.3 中文分词

在作词时发现JE不是很好用,象美白,祛斑,这些词根本搜索不出来,找不到更好的分词库,一元法又很耗CPU所以决定用二分法。

在lucene 2.0+heritrix一书中提到 ChineseAnalyzer中用的是二分切词法,- -试验半天才发现根本不是那么回事,真正的二分切词法是CJKAnalyzer。尽信书不如无书,是句真理啊。 

你可能感兴趣的:(Lucene)