elasticsearch-2.4.1 安装中文分词器 ik-v1.10.1

这篇文档是根据以前的记录整理出来的。当时elasticsearch的最新版本还是2.4.1,所以安装的中文分词器ik是匹配这个版本的v1.10.1。

github地址:https://github.com/medcl/elasticsearch-analysis-ik

最新版本v5.00,我安装的是v1.10.1(v5.00之前的最新正式版本)

安装maven:http://blog.csdn.net/zl18310999566/article/details/52958653

1.自定义词典为什么没有生效?

请确保你的扩展词典的文本格式为 UTF8 编码

2.如何手动安装?

git clone https://github.com/medcl/elasticsearch-analysis-ik
cd elasticsearch-analysis-ik
# git checkout tags/{version}
git checkout tags/v1.10.1
mvn clean
mvn compile
mvn package

拷贝和解压release下的文件:
{project_path}/elasticsearch-analysis-ik/target/releases/elasticsearch-analysis-ik-*.zip 到你的 elasticsearch 插件目录, 如: plugins/ik,重启elasticsearch

3.分词测试失败,请在某个索引下调用analyze接口测试,而不是直接调用analyze接口 如:http://localhost:9200/your_index/_analyze?text=中华人民共和国MN&tokenizer=ik

默认使用ik分词器:(一般不需要,在创建索引映射时可以指定分词器)

修改elasticsearch的配置文件(elasticsearch.yml):

index.analysis.analyzer.ik.type: "ik"

扩展词库,在config\ik\custom下在mydict.dic中增加需要的词组,然后重启Elasticsearch,需要注意的是文件编码是UTF-8 无BOM格式编码。

可能需要安装mvn:

wget http://apache.fayea.com/maven/maven-3/3.3.9/binaries/apache-maven-3.3.9-bin.tar.gz 
tar -zxvf apache-maven-3.3.9-bin.tar.gz 
mv apache-maven-3.3.9 /usr/local/maven-3.3.9

修改环境变量:

vi /etc/profile 
export MAVEN_HOME=/usr/local/maven-3.3.9 
export PATH=$PATH:$MAVEN_HOME/bin 
source /etc/profile

你可能感兴趣的:(elasticsearch-2.4.1 安装中文分词器 ik-v1.10.1)