基于Linux系统的Elasticsearch-6.2.4 IK分词器安装(三)

※ 简介
  由于Elasticsearch是外国人开发的工具,对英文支持比较好。相对于中文来说,就不是那么友好。那么我们就需要安装一个分词器来解析我们中文。
  IKAnalyzer也叫IK分词器,是一个开源的,基于java语言开发的轻量级的中文分词工具包,从2006年12推出1.0版开始,IKAnalyzer已经推出了3个大版本。最初,它是以开源项目Lucene为应用主体的,结合词典和文法分析算法的中文分词组件。新版本的IKAnalyzer3.0则发展为面向java的公共分词组件,独立于Lucene项目,同时提供了Lucene的默认优化实现;
  特性如下:
    1.采用了特有的“正向迭代最细粒度切分算法”,具有60万字/秒的高速处理能力;
    2.采用了多子处理分析模式,支持:英文字母,数字,中文词汇等分词处理;
    3.对中英联合支持不是很好,在这方面的处理比较麻烦,需在做一次查询,同时是支持个人词汇的优化的词典存储,更小的内存占用;
    4.支持用户词典扩展定义;
    5.针对Lucene全文检索优化的查询分析器IKQueryParser,采用了歧义分析算法优化查询关键字的搜索排列组合,能极大提高Lucene检索的命中率;

※下载地址
  https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.2.4/elasticsearch-analysis-ik-6.2.4.zip
  注:Elasticsearch与IKAnalyzer版本要一致,不然会报错

※ 安装

[root@node129 BigData]# unzip elasticsearch-analysis-ik-6.2.4.zip -d elasticsearch-6.2.4/plugins/analysis-ik
[root@node129 BigData]# ll
total 646416
drwxr-xr-x.  9 xdh  xdh        4096 Apr 18 18:20 elasticsearch-6.2.4
-rw-r--r--.  1 xdh  xdh    29056810 Apr 18 18:12 elasticsearch-6.2.4.tar.gz
-rw-r--r--.  1 root root    4501202 Sep  2 03:16 elasticsearch-analysis-ik-6.3.0.zip
drwxr-xr-x. 36 xdh  users      4096 Aug 10 05:11 gcc-10.2.0
-rw-r--r--.  1 root root  129184377 Aug 10 05:03 gcc-10.2.0.tar.gz
drwxr-xr-x.  8 root root         89 Aug 15 02:26 jdk-11.0.1
drwxr-xr-x.  8   10   143      4096 Dec 19  2017 jdk1.8.0_161
-rw-r--r--.  1 root root  189756259 Aug 15 01:52 jdk-8u161-linux-x64.tar.gz
drwxr-xr-x. 12  111 input      4096 Aug 15 06:29 neo4j-community-4.1.1
-rw-r--r--.  1 root root  119568545 Aug 15 01:21 neo4j-community-4.1.1-unix.tar.gz
-rw-r--r--.  1 root root  187599951 Aug 15 02:25 openjdk-11.0.1_linux-x64_bin.tar.gz
drwxrwxr-x.  9 root root       4096 Aug 10 06:10 redis-6.0.6
-rw-r--r--.  1 root root    2228781 Aug 10 05:03 redis-6.0.6.tar.gz

###解压完成后,重启es即可

※ 效果图
  IK提供了两个分词算法:ik_smart和ik_max_word
  其中ik_smart为最少切分,ik_max_word为最细粒度划分

基于Linux系统的Elasticsearch-6.2.4 IK分词器安装(三)_第1张图片
基于Linux系统的Elasticsearch-6.2.4 IK分词器安装(三)_第2张图片

你可能感兴趣的:(Elasticsearch,elasticsearch,.net,linux,大数据)