ElasticSearch全文搜索引擎-文档操作2020-02-23

1. ES中的文档

概述：ES中的文档使用来存储数据的，也是用来检索数据的，ES使用json格式基于文档进行操作！

文档的元数据：

_index：索引库，类似于数据库，存储索引关联数据的地方
_type：文档代表对象的类，例如一种动物，一种水果，一种蔬菜
_id：文档的唯一标识
_source：文档原始数据
_all：所有字段的连接字符串

2.文档的简单增删改查

添加：PUT 索引库/文档类型/文档id

使用指定文档id的方式创建
put hrm/employee/1
{
  "name":"zs"
}

添加：POST 索引库/文档类型

不指定文档id，会自动生成id
post hrm/user
{
  "age":23
}

查询文档数据：GET 索引库/文档类型/文档id

GET hrm/employee/1

查询文档数据，不要元数据：GET 索引库/文档类型/文档id/_source

GET hrm/employee/1/_source

只查询某个字段的数据：GET 索引库/文档类型/文档id/_source?__source=字段名

GET hrm/employee/1/_source?_source=name

全局修改，同一类型，如果文档id已经存在，会将原始文档删除，再添加新的文档，达到修改的效果！

POST hrm/employee/1
{
  "name":"ww",
  "age":23  
}

局部修改，只修改某一个字段：POST 索引库/文档类型/文档id/_update { "doc":{要修改的字段名：值}}

必须使用doc包裹

POST hrm/employee/1/_update
{
  "doc":{
  "age":18
  }
}

删除文档：DELETE 索引库/文档类型/文档id

DELETE hrm/employee/1

3. bulk批量操作

使用单一请求来实现多个文档的create、index、update 或 delete。

Bulk请求体格式：

{ action: { metadata }}\n

{ request body }\n

{ action: { metadata }}\n

{ request body }\n

每行必须以 "\n" 符号结尾，包括最后一行。这些都是作为每行有效的分离而做的标记。

create当文档不存在时创建之。
index创建新文档或替换已有文档。
update局部更新文档。
delete删除一个文档。

POST _bulk
{"delete":{"_index":"hrm","_type":"fruit","_id":1}}
{"create":{"_index":"hrm","_type":"fruit","_id":1}}
{"id":1,"name":"apple"}
{"update":{"_index":"hrm","_type":"fruit","_id":"1"}}
{"doc":{"name":"banana"}}
{"index":{"_index":"hrm","_type":"vegetables","_id":"1"}}
{"name":"Potato"}

4. 文档的简单查询

①：通过文档id来获取

GET 索引库/文档类型/文档id

②：批量获取mget

GET _mget{"docs":[{索引库/文档类型/文档id},{索引库/文档类型/文档id}...]}

必须使用docs[]包裹

GET _mget
{
  "docs":[
    {"_index":"hrm","_type":"vegetables","_id":"1"},
    {"_index":"hrm","_type":"employee","_id":"1"}
    ]
}

同理，如果不需要元数据，只需要获得字段数据，只需要添加_source属性

GET _mget{"docs":[{索引库/文档类型/文档id,"__source":需要获得字段名},{索引库/文档类型/文档id}...]}

GET _mget
{
  "docs":[
    {"_index":"hrm","_type":"vegetables","_id":"1"},
    {"_index":"hrm","_type":"employee","_id":"1","_source":"name"}
    ]
}

同一个索引库的同一个类型下不同文档id的获取,使用ids:[]的方式

GET 索引库/文档类型/文档id{"ids":[文档id，文档id]}

GET hrm/employee/_mget
{
  "ids":["1","2"]
}

没有指定任何的查询条件，只返回集群索引中的所有文档： GET _search

GET _search

③：分页搜索：和SQL使用 LIMIT 关键字返回只有一页的结果一样，Elasticsearch接受 from 和 size 参数：

size : 每页条数，默认 10

from : 跳过开始的结果数，默认 0

从0到1两条数据：

GET _search?size=2

每页两条数据，从第二页开始

GET _search?size=2&from=2

④：查询字符串，使用？拼接条件

GET 索引库/文档类型/_search?q=字段名：值

查询名字为ls的信息

GET hrm/employee/_search?q=name:ls

5. DSL查询与过滤

由ES提供丰富且灵活的查询语言叫做DSL查询(Query DSL),它允许你构建更加复杂、强大的查询。

DSL(Domain Specific Language特定领域语言以请求体的形式出现！

DSL查询："query":查询条件

①：“match”：匹配,match查询是一个标准查询，不管你需要全文本查询还是精确查询基本上都要用到它。

如果你使用match查询一个全文本字段，它会在真正查询之前用分析器先分析查询字符！意思就是，如果你做了分词处理，也可以被检索到！

GET hrm/employee/_search
{
  "query":{
    "match": {
      "name": "ls"
    }
  }
}

如果用 match 下指定了一个确切值，在遇到数字，日期，布尔值或者 not_analyzed的字符串时，它将为你搜索你给定的值，如：匹配年龄为23的数据

GET hrm/user/_search
{
  "query":{
    "match": {
      "age":23
    }
  },
  "size": 2,
  "from": 0
}

②：multi_match 查询允许你做 match查询的基础上同时搜索多个字段：如查询name字段包含ls的数据

GET /hrm/employee/_search
{
  "query": {
    "multi_match": {
      "query": "ls",
      "fields": ["name"]
    }
  }
}

多个条件用，分割，sort是一个数组，可以放多个排序规则！

GET hrm/user/_search
{
  "query":{
    "match": {
      "name": "ww"
    }
  },
  "size": 2,
  "from": 0,
  "sort": [
    {
      "age": {
        "order": "desc"
      }
    }
  ]
}

③："match_all" : {} 匹配所有文档

GET hrm/user/_search
{
  "query":{
    "match_all": {}
  },
  "size": 2,
  "from": 0
}

多个查询条件使用bool,must必须满足, 或(should) 非(must not) 。filter过滤，term单词搜索过滤

在user文档下，查询所有年龄为18的用户

GET hrm/user/_search
{
  "query":{
    "bool": {
      "must": [
        {
          "match_all": {}
        }
      ],
      "filter": {
        "term": {
          "age": 18
        }
      }
    }
  }
}

④：单词搜索与过滤（Term和Terms）查询name中包含ls的用户

GET /hrm/employee/_search
{
"query": {
  "term": {
    "name": "ls"
  }
}
}

如果要检索多个字段，则可以使用terms,如查询name中包含ls或者ww的数据

GET /hrm/employee/_search
{
  "query": {
    "terms": {
      "name": [
        "ls",
        "ww"
      ]
    }
  }
}

如果要检索多个字段，指定必须满足一个或者多个的情况下，要使用多条件查询bool如下：

查询名字包含ls或者包含ww的用户，满足一种包含情况即可！

GET /hrm/employee/_search
{
  "query": {
    "bool": {
      "should": [
        {"term":{"name":"ls"}},
        {"term":{"name":"ww"}}
      ],
      "minimum_should_match": 1
   }
  }
}

⑤：范围查询与过滤（range）查询年龄大于等于10小于等于30的数据

GET /hrm/employee/_search
{
  "query": {
    "range": {
      "age": {
        "gte": 10,
        "lte": 30
      }
    }
  }
}

⑥：组合搜索bool可以组合多个查询条件为一个查询对象，查询条件包括must、should和must_not。