1. ES中的文档
概述:ES中的文档使用来存储数据的,也是用来检索数据的,ES使用json格式基于文档进行操作!
文档的元数据:
- _index:索引库,类似于数据库,存储索引关联数据的地方
- _type:文档代表对象的类,例如一种动物,一种水果,一种蔬菜
- _id:文档的唯一标识
- _source:文档原始数据
- _all:所有字段的连接字符串
2.文档的简单增删改查
添加:PUT 索引库/文档类型/文档id
使用指定文档id的方式创建
put hrm/employee/1
{
"name":"zs"
}
添加:POST 索引库/文档类型
不指定文档id,会自动生成id
post hrm/user
{
"age":23
}
查询文档数据:GET 索引库/文档类型/文档id
GET hrm/employee/1
查询文档数据,不要元数据:GET 索引库/文档类型/文档id/_source
GET hrm/employee/1/_source
只查询某个字段的数据:GET 索引库/文档类型/文档id/_source?__source=字段名
GET hrm/employee/1/_source?_source=name
全局修改,同一类型,如果文档id已经存在,会将原始文档删除,再添加新的文档,达到修改的效果!
POST hrm/employee/1
{
"name":"ww",
"age":23
}
局部修改,只修改某一个字段:POST 索引库/文档类型/文档id/_update { "doc":{要修改的字段名:值}}
必须使用doc包裹
POST hrm/employee/1/_update
{
"doc":{
"age":18
}
}
删除文档:DELETE 索引库/文档类型/文档id
DELETE hrm/employee/1
3. bulk批量操作
使用单一请求来实现多个文档的create、index、update 或 delete。
Bulk请求体格式:
{ action: { metadata }}\n
{ request body }\n
{ action: { metadata }}\n
{ request body }\n
每行必须以 "\n" 符号结尾,包括最后一行。这些都是作为每行有效的分离而做的标记。
create当文档不存在时创建之。
index创建新文档或替换已有文档。
update局部更新文档。
delete删除一个文档。
POST _bulk
{"delete":{"_index":"hrm","_type":"fruit","_id":1}}
{"create":{"_index":"hrm","_type":"fruit","_id":1}}
{"id":1,"name":"apple"}
{"update":{"_index":"hrm","_type":"fruit","_id":"1"}}
{"doc":{"name":"banana"}}
{"index":{"_index":"hrm","_type":"vegetables","_id":"1"}}
{"name":"Potato"}
4. 文档的简单查询
①:通过文档id来获取
GET 索引库/文档类型/文档id
②:批量获取mget
GET _mget{"docs":[{索引库/文档类型/文档id},{索引库/文档类型/文档id}...]}
必须使用docs[]包裹
GET _mget
{
"docs":[
{"_index":"hrm","_type":"vegetables","_id":"1"},
{"_index":"hrm","_type":"employee","_id":"1"}
]
}
同理,如果不需要元数据,只需要获得字段数据,只需要添加_source属性
GET _mget{"docs":[{索引库/文档类型/文档id,"__source":需要获得字段名},{索引库/文档类型/文档id}...]}
GET _mget
{
"docs":[
{"_index":"hrm","_type":"vegetables","_id":"1"},
{"_index":"hrm","_type":"employee","_id":"1","_source":"name"}
]
}
同一个索引库的同一个类型下不同文档id的获取,使用ids:[]的方式
GET 索引库/文档类型/文档id{"ids":[文档id,文档id]}
GET hrm/employee/_mget
{
"ids":["1","2"]
}
没有指定任何的查询条件,只返回集群索引中的所有文档: GET _search
GET _search
③:分页搜索:和SQL使用 LIMIT 关键字返回只有一页的结果一样,Elasticsearch接受 from 和 size 参数:
size : 每页条数,默认 10
from : 跳过开始的结果数,默认 0
从0到1两条数据:
GET _search?size=2
每页两条数据,从第二页开始
GET _search?size=2&from=2
④:查询字符串,使用?拼接条件
GET 索引库/文档类型/_search?q=字段名:值
查询名字为ls的信息
GET hrm/employee/_search?q=name:ls
5. DSL查询与过滤
由ES提供丰富且灵活的查询语言叫做DSL查询(Query DSL),它允许你构建更加复杂、强大的查询。
DSL(Domain Specific Language特定领域语言以请求体的形式出现!
DSL查询:"query":查询条件
①:“match”:匹配,match查询是一个标准查询,不管你需要全文本查询还是精确查询基本上都要用到它。
如果你使用match查询一个全文本字段,它会在真正查询之前用分析器先分析查询字符 !意思就是,如果你做了分词处理,也可以被检索到!
GET hrm/employee/_search
{
"query":{
"match": {
"name": "ls"
}
}
}
如果用 match 下指定了一个确切值,在遇到数字,日期,布尔值或者 not_analyzed的字符串时,它将为你搜索你给定的值,如:匹配年龄为23的数据
GET hrm/user/_search
{
"query":{
"match": {
"age":23
}
},
"size": 2,
"from": 0
}
②:multi_match 查询允许你做 match查询的基础上同时搜索多个字段: 如查询name字段包含ls的数据
GET /hrm/employee/_search
{
"query": {
"multi_match": {
"query": "ls",
"fields": ["name"]
}
}
}
多个条件用,分割,sort是一个数组,可以放多个排序规则!
GET hrm/user/_search
{
"query":{
"match": {
"name": "ww"
}
},
"size": 2,
"from": 0,
"sort": [
{
"age": {
"order": "desc"
}
}
]
}
③:"match_all" : {} 匹配所有文档
GET hrm/user/_search
{
"query":{
"match_all": {}
},
"size": 2,
"from": 0
}
多个查询条件使用bool,must必须满足, 或(should) 非(must not) 。filter过滤,term单词搜索过滤
在user文档下,查询所有年龄为18的用户
GET hrm/user/_search
{
"query":{
"bool": {
"must": [
{
"match_all": {}
}
],
"filter": {
"term": {
"age": 18
}
}
}
}
}
④:单词搜索与过滤(Term和Terms)查询name中包含ls的用户
GET /hrm/employee/_search
{
"query": {
"term": {
"name": "ls"
}
}
}
如果要检索多个字段,则可以使用terms,如查询name中包含ls或者ww的数据
GET /hrm/employee/_search
{
"query": {
"terms": {
"name": [
"ls",
"ww"
]
}
}
}
如果要检索多个字段,指定必须满足一个或者多个的情况下,要使用多条件查询bool如下:
查询名字包含ls或者包含ww的用户,满足一种包含情况即可!
GET /hrm/employee/_search
{
"query": {
"bool": {
"should": [
{"term":{"name":"ls"}},
{"term":{"name":"ww"}}
],
"minimum_should_match": 1
}
}
}
⑤:范围查询与过滤(range)查询年龄大于等于10小于等于30的数据
GET /hrm/employee/_search
{
"query": {
"range": {
"age": {
"gte": 10,
"lte": 30
}
}
}
}
⑥:组合搜索bool可以组合多个查询条件为一个查询对象,查询条件包括must、should和must_not。