自定义分词器真题1

题目

  • wayne's和waynes有相同的命中和评分
  • king's和kings有相同的评分
  • oa,oA,OA,onse同时能收到,且评分相同

定义索引settings和mappings

PUT /test_1
{
  "settings": {
    "analysis": {
      "filter": {
        "synonym": {
          "type": "synonym",
          "lenient": true,
          "synonyms": [
            "oa,oA,OA,onse"
          ]
        },
        "english_stop": {
          "type": "stop",
          "stopwords": "_english_"
        },
        "english_keywords": {
          "type": "keyword_marker",
          "keywords": [
            "example"
          ]
        },
        "english_stemmer": {
          "type": "stemmer",
          "language": "english"
        },
        "english_possessive_stemmer": {
          "type": "stemmer",
          "language": "possessive_english"
        }
      },
      "analyzer": {
        "rebuilt_english": {
          "tokenizer": "standard",
          "filter": [
            "synonym",
            "english_possessive_stemmer",
            "lowercase",
            "english_stop",
            "english_keywords",
            "english_stemmer"
          ]
        }
      }
    }
  },
  "mappings": {
    "properties": {
      "foo": {
        "type": "text",
        "analyzer": "rebuilt_english"
      }
    }
  }
}

测试索引级别的分词器

POST test_1/_analyze
{
  "analyzer": "rebuilt_english",
  "text": "kings"
}

分析器配置

  • 主要是同义词和english分析器结合
  • 主要看文档的内置部分

你可能感兴趣的:(自定义分词器真题1)