使用 dynamic_templates自定义动态索引

如果你想在运行时的增加新的字段,你可能会开启动态索引。虽然有时动态映射的 规则 显得不那么智能,幸运的是我们可以通过设置来自定义这些规则。

当 Elasticsearch 遇到一个新的字符串字段时,它会检测这个字段是否包含一个可识别的日期,比如 2014-01-01。如果它看起来像一个日期,这个字段会被作为 date 类型添加,否则,它会被作为 string 类型添加。
有些时候这个规则可能导致一些问题。想象你有一个文档长这样:
{ "note": "2014-01-01" }
假设这是第一次见到 note 字段,它会被添加为 date 字段,但是如果下一个文档像这样:
{ "note": "Logged out" }
这显然不是一个日期,但为时已晚。这个字段已经被添加为日期类型,这个 不合法的日期 将引发异常。
日期检测可以通过在根对象上设置 date_detection 为 false 来关闭:
PUT /my_index
{
    "mappings": {
        "my_type": {
            "date_detection": false
        }
    }
}
使用这个映射,字符串将始终是 string 类型。假如你需要一个 date 字段,你得手动添加它。
提示:


Elasticsearch 判断字符串为日期的规则可以通过 dynamic_date_formats 配置 来修改。比如在default mapping中配置:

 "mappings": {
    "_default_": {
      "_all": {"enabled": false},
      "dynamic_date_formats": ["yyyy-MM-dd HH:mm:ss"]
    }
  }

此时只有当字符串格式为"yyyy-MM-dd HH:mm:ss"才会被自动识别为日期类型,并且format就是被识别的格式.


使用 dynamic_templates,你可以完全控制新字段的映射,你设置可以通过字段名或数据类型应用一个完全不同的映射。
每个模板都有一个名字用于描述这个模板的用途,一个 mapping 字段用于指明这个映射怎么使用,和至少一个参数(例如 match)来定义这个模板适用于哪个字段。
模板按照顺序来检测,第一个匹配的模板会被启用。例如,我们给 string 类型字段定义两个模板:
es: 字段名以 _es 结尾需要使用 spanish 分析器。
en: 所有其他字段使用 english 分析器。
我们将 es 模板放在第一位,因为它比匹配所有字符串的 en 模板更特殊一点
PUT /my_index
{
    "mappings": {
        "my_type": {
            "dynamic_templates": [
                { "es": {
                      "match":              "*_es", <1>
                      "match_mapping_type": "string",
                      "mapping": {
                          "type":           "string",
                          "analyzer":       "spanish"
                      }
                }},
                { "en": {
                      "match":              "*", <2>
                      "match_mapping_type": "string",
                      "mapping": {
                          "type":           "string",
                          "analyzer":       "english"
                      }
                }}
            ]
}}}
<1> 匹配字段名以 _es 结尾的字段.
<2> 匹配所有字符串类型字段。
match_mapping_type 允许你限制模板只能使用在特定的类型上,就像由标准动态映射规则检测的一样,(例如 strong 和 long)
match 参数只匹配字段名,path_match 参数则匹配字段在一个对象中的完整路径,所以 address.*.name 规则将匹配一个这样的字段:
{
    "address": {
        "city": {
            "name": "New York"
        }
    }
}
unmatch 和 path_unmatch 规则将用于排除未被匹配的字段。

另一个例子:

  "mappings": {
    "_default_": {
      "_all": {"enabled": false},
      "dynamic_date_formats": ["yyyy-MM-dd HH:mm:ss"],
      "dynamic_templates" : [
            {
                "strings" : {
                    "match" : "*",
                    "match_mapping_type": "string",
                    "mapping" : {
                        "type" : "string",
                        "index" : "no"
                    }
                }
            }
      ]
    }
  }

指定所有自动mapping的string类型的字段的index都为no,即不索引字段。

你可能感兴趣的:(elasticsearch)