IK分词器使用自定义词库

1、拷贝IKAnalyzer.cfg.xml到WEB-INF/classes下,拷贝IKAnalyzer2012FF_u1.jar到lib目录下,IKAnalyzer.cfg.xml内容如下:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">  
<properties>  
    <comment>IK Analyzer 扩展配置</comment>
    <!--用户可以在这里配置自己的扩展字典 -->
    <entry key="ext_dict">myExt.dic;</entry>
    
    <!--用户可以在这里配置自己的扩展停止词字典-->
    <entry key="ext_stopwords">stopword.dic;</entry>
    
</properties>

2、修改加入自定义词库:
<entry key="ext_dict">myExt.dic;myExt2.dic</entry>

3、myExt.dic格式如下,注意myExt.dic需要是UTF-8 无BOM格式编码
深南
东路
深南东路
地王大厦
红村社区
桂园街道
桂园

4、设置UTF-8 无BOM格式编码:
下载notepad++编辑器,打开文件,选择格式 - 以UTF-8 无BOM格式编码



你可能感兴趣的:(Lucene,Solr,词库,IK,ik分词器)