安装 elasticsearch-analysis-ik-5.1.1

elasticsearch-analysis-ik 是一个比较常用的中文分词器

cjk也支持中文,相当于是bigram, elasticsearch对中文默认分析器是unigram 的分析器(即默认的 Standard Analyzer),即每个字是一个词,效果不太好
比较常用的两个效果较好的中文分词器是ik和jieba,但是jieba只支持<=2.35版的elasticsearch

安装ik:
  • 下载 elasticsearch-analysis-ik-5.1.1.zip (注意:和elasticsearch版本对应),直接下载其release的版本(第一个zip文件,避免maven打包)
    https://github.com/medcl/elasticsearch-analysis-ik/releases/tag/v5.1.1
  • 在/Users/duhuifang/Downloads/elasticsearch-5.1.1/plugins下建立ik目录
    mkdir ik
  • 移动 elasticsearch-analysis-ik-5.1.1.zip至elasticsearch的plugins文件夹的ik文件夹下:
cp Downloads/ elasticsearch-analysis-ik-5.1.1.zip /Users/duhuifang/Downloads/elasticsearch-5.1.1/plugins/ik
  • 解压文件
    unzip elasticsearch-analysis-ik-5.1.1.zip
  • 启动elasticsearch,即可看到加载了analysis-ik插件
安装 elasticsearch-analysis-ik-5.1.1_第1张图片
可以自定义分词词表
  • 在/Users/duhuifang/Downloads/elasticsearch-5.1.1/plugins/ik/config/custom文件夹下可放进自己的词典,然后在/Users/duhuifang/Downloads/elasticsearch-5.1.1/plugins/ik/config/IKAnalyzer.cfg.xml配置文件中写入自定义词库的路径即可,如图:
安装 elasticsearch-analysis-ik-5.1.1_第2张图片

配置IKAnalyzer.cfg.xml文件:




    IK Analyzer 扩展配置
    
    custom/mydict.dic;custom/single_word_low_freq.dic;custom/memect.dic;
     
    custom/ext_stopword.dic
    
    
    
    


你可能感兴趣的:(安装 elasticsearch-analysis-ik-5.1.1)