ElasticSearch复杂数据类型

ElasticSearch入门到实战教程:点击查看

1. 对象类型(object)

一个字段下需要多种类型的属性字段,属性 attr 有身高、体重,添加映射语句如下:

POST indexname/_mapping
{
  "properties": {
    "attr": {
      "properties": {
        "height": {
          "type": "double"
        },
        "weight": {
          "type": "double"
        }
      }
    }
  }
}

对象类型新增数据语法

PUT indexname/_doc/1
{
  "attr": {
    "height": 176.3,
    "weight": 64
  }
}

筛选查询新增的数据

GET indexname/_search
{
  "query":{
    "term":{
      "attr.weight": "64"
    }
  }
}

2. 数组类型

ELasticsearch没有专用的数组类型,默认情况下任何字段都可以包含一个或者多个值,但是一个数组中的值要是同一种类型。

  • 字符数组: [ “one”, “two” ]
  • 整型数组:[1,3]
  • 对象数组:[ { “name”: “长度”, “value”: “10” }, { “name”: “内存”, “value”: “16” }]

keyword数组,创建keyword字段

POST indexname/_mapping
{
  "properties": {
    "skills": {
      "type": "keyword"
    }
  }
}

新增数据

PUT indexname/_doc/2
{
  "skills": ["java", "c++"]
}

对象数组,创建对象字段

POST indexname/_mapping
{
  "properties": {
    "attrs": {
      "properties": {
        "name": {
          "type": "keyword"
        },
        "value": {
          "type": "keyword"
        }
      }
    }
  }
}

新增数据

PUT indexname/_doc/3
{
  "attrs": [
    {
      "name": "长度",
      "value": "10"
    },
    {
      "name": "内存",
      "value": "16"
    }
  ]
}

3. 嵌套文档(nested)

nested嵌套类型是object中的一个特例,可以让对象数组类型独立索引和查询。

项目场景中弥补对象数组的一些查询问题

接着前面创建的对象数组 attrs 先添加几条数据

POST _bulk
{"create":{"_index":"indexname","_id":20}}
{"attrs":[{"name":"长度","value":"64"},{"name":"内存","value":"32"}]}
{"create":{"_index":"indexname","_id":21}}
{"attrs":[{"name":"长度","value":"64"},{"name":"内存","value":"64"}]}
{"create":{"_index":"indexname","_id":22}}
{"attrs":[{"name":"长度","value":"64"}]}

现在业务需求:需要 属性=长度 且 值=32 的数据(目前数据里没有),我们来写查询语法。

GET indexname/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "term": {
            "attrs.name": "长度"
          }
        },
        {
          "term": {
            "attrs.value": "32"
          }
        }
      ]
    }
  }
}

运行后发现居然有数据,为什么呢?我们后面原理篇会讲。

怎么解决这种问题呢?使用 nested 类型即可解决。

添加映射字段

POST indexname/_mapping
{
  "properties": {
    "attrsNested": {
      "type": "nested",
      "properties": {
        "name": {
          "type": "keyword"
        },
        "value": {
          "type": "keyword"
        }
      }
    }
  }
}

添加几条数据

POST _bulk
{"create":{"_index":"indexname","_id":20}}
{"attrsNested":[{"name":"长度","value":"64"},{"name":"内存","value":"32"}]}
{"create":{"_index":"indexname","_id":21}}
{"attrsNested":[{"name":"长度","value":"64"},{"name":"内存","value":"64"}]}
{"create":{"_index":"indexname","_id":22}}
{"attrsNested":[{"name":"长度","value":"64"}]}

查询数据

GET indexname/_search
{
  "query": {
    "nested": {
      "path": "attrsNested",
      "query": {
        "bool": {
          "must": [
            {
              "term": {
                "attrsNested.name": "长度"
              }
            },
            {
              "term": {
                "attrsNested.value": "32"
              }
            }
          ]
        }
      }
    }
  }
}

已经查不到数据了,问题完美解决

4. 子字段

text类型不能用于排序、聚合。为什么呢?因为它的属性 fielddata 默认是false,设置为true就可以了,但是不建议使用,会增加内存的压力。

添加字段映射(不建议设置true):

POST indexname/_mapping
{
  "properties": {
    "address": {
      "type": "text",
      "fielddata":true
    }
  }
}

直接使用 keyword 类型可以进行排序、聚合。

想必会有同学有疑问:

同样是字符串类型,干脆直接都用keyword类型不就行了。

如果你不需要 分词 那么你用keyword完全可以,如果你需要对字段值分词,那你还是需要用text。

那么有没有不增加压力,而且不用两个字段的方法呢? 当然有,就是做子字段!

POST indexname/_mapping
{
  "properties": {
    "address": {
      "type": "text",
      "fields": {
        "keyword": {
          "type": "keyword",
          "ignore_above": 256
        }
      }
    }
  }
}

address 字段下增加了 keyword 名字的字段,类型是 keyword,设置256长度

对应查询子字段keyword的语句

GET indexname/_search
{
  "query": {
    "term":{
      "address.keyword": ""
    }
  }
}

5. 地理类型

geo_point 是地理类型。移动互联网的时代,移动设备越来越多,要根据地理位置搜索地址,可以把地址的经纬度数据设置地理数据类型。

POST indexname/_mapping
{
  "properties": {
    "location": {
      "type": "geo_point"
    }
  }
}

添加一条地理位置数据

PUT indexname/_doc/6
{
  "location": {
    "lat": 41.07,
    "lon": 116.64
  }
}
  • lat(经度)
  • lon(纬度)

根据(41.07,116.14)坐标,查询100km内的位置信息

GET indexname/_search
{
  "query": {
    "geo_distance": {
      "distance": "100km",
      "location": {
        "lat": 41.07,
        "lon": 116.14
      }
    }
  }
}

根据(23.6,32.2)位置,对查询结果进行远近排序

GET indexname/_search
{
  "query": {
    "match_all": {}
  },
  "sort": [
    {
      "_geo_distance": {
        "location": "23.6,32.2",
        "unit": "km"
      }
    }
  ]
}

更多资料请看《ElasticSearch入门到实战教程》:点击查看

你可能感兴趣的:(elasticsearch,大数据)