ElasticSearch全文搜索引擎-文档操作2020-02-23

1. ES中的文档

概述:ES中的文档使用来存储数据的,也是用来检索数据的,ES使用json格式基于文档进行操作!

文档的元数据:

  • _index:索引库,类似于数据库,存储索引关联数据的地方
  • _type:文档代表对象的类,例如一种动物,一种水果,一种蔬菜
  • _id:文档的唯一标识
  • _source:文档原始数据
  • _all:所有字段的连接字符串

2.文档的简单增删改查

添加:PUT 索引库/文档类型/文档id

使用指定文档id的方式创建
put hrm/employee/1
{
  "name":"zs"
}

添加:POST 索引库/文档类型

不指定文档id,会自动生成id
post hrm/user
{
  "age":23
}

查询文档数据:GET 索引库/文档类型/文档id

GET hrm/employee/1

查询文档数据,不要元数据:GET 索引库/文档类型/文档id/_source

GET hrm/employee/1/_source

只查询某个字段的数据:GET 索引库/文档类型/文档id/_source?__source=字段名

GET hrm/employee/1/_source?_source=name

全局修改,同一类型,如果文档id已经存在,会将原始文档删除,再添加新的文档,达到修改的效果!

POST hrm/employee/1
{
  "name":"ww",
  "age":23  
}

局部修改,只修改某一个字段:POST 索引库/文档类型/文档id/_update { "doc":{要修改的字段名:值}}

必须使用doc包裹

POST hrm/employee/1/_update
{
  "doc":{
  "age":18
  }
}

删除文档:DELETE 索引库/文档类型/文档id

DELETE hrm/employee/1

3. bulk批量操作

使用单一请求来实现多个文档的create、index、update 或 delete。

Bulk请求体格式:

{ action: { metadata }}\n

{ request body }\n

{ action: { metadata }}\n

{ request body }\n

每行必须以 "\n" 符号结尾,包括最后一行。这些都是作为每行有效的分离而做的标记。

  • create当文档不存在时创建之。

  • index创建新文档或替换已有文档。

  • update局部更新文档。

  • delete删除一个文档。

POST _bulk
{"delete":{"_index":"hrm","_type":"fruit","_id":1}}
{"create":{"_index":"hrm","_type":"fruit","_id":1}}
{"id":1,"name":"apple"}
{"update":{"_index":"hrm","_type":"fruit","_id":"1"}}
{"doc":{"name":"banana"}}
{"index":{"_index":"hrm","_type":"vegetables","_id":"1"}}
{"name":"Potato"}

4. 文档的简单查询

①:通过文档id来获取

GET 索引库/文档类型/文档id

②:批量获取mget

GET _mget{"docs":[{索引库/文档类型/文档id},{索引库/文档类型/文档id}...]}

必须使用docs[]包裹

GET _mget
{
  "docs":[
    {"_index":"hrm","_type":"vegetables","_id":"1"},
    {"_index":"hrm","_type":"employee","_id":"1"}
    ]
}

同理,如果不需要元数据,只需要获得字段数据,只需要添加_source属性

GET _mget{"docs":[{索引库/文档类型/文档id,"__source":需要获得字段名},{索引库/文档类型/文档id}...]}

GET _mget
{
  "docs":[
    {"_index":"hrm","_type":"vegetables","_id":"1"},
    {"_index":"hrm","_type":"employee","_id":"1","_source":"name"}
    ]
}

同一个索引库的同一个类型下不同文档id的获取,使用ids:[]的方式

GET 索引库/文档类型/文档id{"ids":[文档id,文档id]}

GET hrm/employee/_mget
{
  "ids":["1","2"]
}

没有指定任何的查询条件,只返回集群索引中的所有文档: GET _search

GET _search

③:分页搜索:和SQL使用 LIMIT 关键字返回只有一页的结果一样,Elasticsearch接受 from 和 size 参数:

size : 每页条数,默认 10

from : 跳过开始的结果数,默认 0

从0到1两条数据:

GET _search?size=2

每页两条数据,从第二页开始

GET _search?size=2&from=2

④:查询字符串,使用?拼接条件

GET 索引库/文档类型/_search?q=字段名:值

查询名字为ls的信息

GET hrm/employee/_search?q=name:ls

5. DSL查询与过滤

由ES提供丰富且灵活的查询语言叫做DSL查询(Query DSL),它允许你构建更加复杂、强大的查询。

DSL(Domain Specific Language特定领域语言以请求体的形式出现!

DSL查询:"query":查询条件

①:“match”:匹配,match查询是一个标准查询,不管你需要全文本查询还是精确查询基本上都要用到它。

如果你使用match查询一个全文本字段,它会在真正查询之前用分析器先分析查询字符 !意思就是,如果你做了分词处理,也可以被检索到!

GET hrm/employee/_search
{
  "query":{
    "match": {
      "name": "ls"
    }
  }
}

如果用 match 下指定了一个确切值,在遇到数字,日期,布尔值或者 not_analyzed的字符串时,它将为你搜索你给定的值,如:匹配年龄为23的数据

GET hrm/user/_search
{
  "query":{
    "match": {
      "age":23
    }
  },
  "size": 2,
  "from": 0
}  

②:multi_match 查询允许你做 match查询的基础上同时搜索多个字段: 如查询name字段包含ls的数据

GET /hrm/employee/_search
{
  "query": {
    "multi_match": {
      "query": "ls",
      "fields": ["name"]
    }
  }
}

多个条件用,分割,sort是一个数组,可以放多个排序规则!

GET hrm/user/_search
{
  "query":{
    "match": {
      "name": "ww"
    }
  },
  "size": 2,
  "from": 0,
  "sort": [
    {
      "age": {
        "order": "desc"
      }
    }
  ]
}

③:"match_all" : {} 匹配所有文档

GET hrm/user/_search
{
  "query":{
    "match_all": {}
  },
  "size": 2,
  "from": 0
}

多个查询条件使用bool,must必须满足, 或(should) 非(must not) 。filter过滤,term单词搜索过滤

在user文档下,查询所有年龄为18的用户

GET hrm/user/_search
{
  "query":{
    "bool": {
      "must": [
        {
          "match_all": {}
        }
      ],
      "filter": {
        "term": {
          "age": 18
        }
      }
    }
  }
}

④:单词搜索与过滤(Term和Terms)查询name中包含ls的用户

GET /hrm/employee/_search
{
"query": {
  "term": {
    "name": "ls"
  }
}
}

如果要检索多个字段,则可以使用terms,如查询name中包含ls或者ww的数据

GET /hrm/employee/_search
{
  "query": {
    "terms": {
      "name": [
        "ls",
        "ww"
      ]
    }
  }
}

如果要检索多个字段,指定必须满足一个或者多个的情况下,要使用多条件查询bool如下:

查询名字包含ls或者包含ww的用户,满足一种包含情况即可!

GET /hrm/employee/_search
{
  "query": {
    "bool": {
      "should": [
        {"term":{"name":"ls"}},
        {"term":{"name":"ww"}}
      ],
      "minimum_should_match": 1
   }
  }
}

⑤:范围查询与过滤(range)查询年龄大于等于10小于等于30的数据

GET /hrm/employee/_search
{
  "query": {
    "range": {
      "age": {
        "gte": 10,
        "lte": 30
      }
    }
  }
}

⑥:组合搜索bool可以组合多个查询条件为一个查询对象,查询条件包括must、should和must_not。

你可能感兴趣的:(ElasticSearch全文搜索引擎-文档操作2020-02-23)