添加IK分词器

  • git clone https://github.com/medcl/elasticsearch-analysis-ik

  • mvn clean package

  • 打包完成后在target下有releases\elasticsearch-analysis-ik-1.8.1.zip

  • 将elasticsearch-analysis-ik-1.8.1.zip解压内容放在ES_HOME/plugins/analysis-ik

  • 测试文字片段
    http://localhost:9200/ik-test/_analyze?analyzer=ik&text=中国共产党&pretty

{
  "tokens": [
    {
      "token": "中国共产党",
      "start_offset": 0,
      "end_offset": 5,
      "type": "CN_WORD",
      "position": 0
    },
    {
      "token": "中国",
      "start_offset": 0,
      "end_offset": 2,
      "type": "CN_WORD",
      "position": 1
    },
    {
      "token": "国共",
      "start_offset": 1,
      "end_offset": 3,
      "type": "CN_WORD",
      "position": 2
    },
    {
      "token": "共产党",
      "start_offset": 2,
      "end_offset": 5,
      "type": "CN_WORD",
      "position": 3
    },
    {
      "token": "共产",
      "start_offset": 2,
      "end_offset": 4,
      "type": "CN_WORD",
      "position": 4
    },
    {
      "token": "党",
      "start_offset": 4,
      "end_offset": 5,
      "type": "CN_CHAR",
      "position": 5
    }
  ]
}
  • 为索引设置分词器
    [POST] http://localhost:9200/ik-test/_mapping/weibo/
{
    "properties":{
        "content":{
            "type":"string",
            "analyzer":"ik",
            "store":false
        }
    }
}

参考
https://www.elastic.co/guide/en/elasticsearch/reference/current/string.html

  • 添加数据
    [POST] http://localhost:9200/ik-test/weibo/1
{
    "title":"中国共产党",
    "note":"东北大学是教育部直属的国家重点大学,坐落在东北中心城市沈阳。学校占地总面积261万平方米,建筑面积123万平方米。"
}
  • 查询数据
    [POST] http://localhost:9200/ik-test/weibo/_search
{
    "query":{
        "term":{"note":"东北大学"}
    },
    "highlight":{
        "pre_tags":["",""],
        "post_tags":["",""],
        "fields":{
            "note":{}
        }
    }
}

查询结果例如

{
  "took": 3,
  "timed_out": false,
  "_shards": {
    "total": 5,
    "successful": 5,
    "failed": 0
  },
  "hits": {
    "total": 4,
    "max_score": 0.26516503,
    "hits": [
      {
        "_index": "ik-test",
        "_type": "weibo",
        "_id": "2",
        "_score": 0.26516503,
        "_source": {
          "title": "台湾",
          "note": "东北大学在秦皇岛设立的分校。 东北大学秦皇岛分校是经教育部正式批准成立."
        },
        "highlight": {
          "note": [
            "东北大学在秦皇岛设立的分校。 东北大学秦皇岛分校是经教育部正式批准成立."
          ]
        }
      },
      {
        "_index": "ik-test",
        "_type": "weibo",
        "_id": "4",
        "_score": 0.21650635,
        "_source": {
          "title": "你好",
          "note": "东北大学秦皇岛分校是经教育部正式批准成立,在东北大学统一规划下,面向全国招生,相对独立办学的普通高等学校。学校始建于1987年,是东北大学的有机组成部分."
        },
        "highlight": {
          "note": [
            "东北大学秦皇岛分校是经教育部正式批准成立,在东北大学统一规划下,面向全国招生,相对独立办学的普通高等学校。学校始建于1987年,是东北大学的有机组成部分."
          ]
        }
      },
      {
        "_index": "ik-test",
        "_type": "weibo",
        "_id": "1",
        "_score": 0.125,
        "_source": {
          "title": "你好啊",
          "note": "东软 英文名称Neusoft,东软是中国领先的IT解决方案与服务供应商。1991年,东软创立于中国东北大学。公司主营业务包括:行业解决方案、产品工程解决方案及相关软件产品、平台及服务等。"
        },
        "highlight": {
          "note": [
            "东软 英文名称Neusoft,东软是中国领先的IT解决方案与服务供应商。1991年,东软创立于中国东北大学。公司主营业务包括:行业解决方案、产品工程解决方案及相关软件产品、平台及服务等。"
          ]
        }
      },
      {
        "_index": "ik-test",
        "_type": "weibo",
        "_id": "3",
        "_score": 0.125,
        "_source": {
          "title": "中国共产党",
          "note": "东北大学是教育部直属的国家重点大学,坐落在东北中心城市沈阳。学校占地总面积261万平方米,建筑面积123万平方米。"
        },
        "highlight": {
          "note": [
            "东北大学是教育部直属的国家重点大学,坐落在东北中心城市沈阳。学校占地总面积261万平方米,建筑面积123万平方米。"
          ]
        }
      }
    ]
  }
}

你可能感兴趣的:(添加IK分词器)