十四、中文分词器

中文分词器

 

Paoding:庖丁解牛分词器。已经没有更新了
mmseg:使用搜狗的词库()


1、导入包(有两个包:1、带dic,2、不带dic)
如果使用不带dic的,得自己指定词库位置


十四、中文分词器

2、创建的时候使用MMSegAnalyzer分词器

Analyzer a = new MMSegAnalyzer(new File("D:\\tools\\javaTools\\lucene\\mmseg4j-1.8.5\\data"));

你可能感兴趣的:(中文分词器)