在此大家的前置知识是了解restful风格的接口以及会使用postman工具
Restful接口详解
在 Postman 中, 向 ES 服务器发 PUT 请求 :http://127.0.0.1:9200/索引名
{
“acknowledged” 【响应结果】 : true, # true 操作成功
“shards_acknowledged” 【分片结果】 : true, # 分片操作成功
“index” 【索引名称】 : “myindex”
}
注意:创建索引库的分片数默认 1 片,在 7.0.0 之前的 Elasticsearch 版本中,默认 5 片
如果重复添加索引, 会返回错误信息
在 Postman 中, 向 ES 服务器发 GET 请求 :http://127.0.0.1:9200/_cat/indices?v
这里请求路径中的_cat 表示查看的意思, indices 表示索引,所以整体含义就是查看当前 ES
服务器中的所有索引,就好像 MySQL 中的 show tables 的感觉,服务器响应结果如下
在 Postman 中, 向 ES 服务器发 GET 请求 :http://127.0.0.1:9200/myindex
{
"shopping"【索引名】: {
"aliases"【别名】: {
},
"mappings"【映射】: {
},
"settings"【设置】: {
"index"【设置-索引】: {
"creation_date"【设置-索引-创建时间】: "1614265373911",
"number_of_shards"【设置-索引-主分片数量】: "1",
"number_of_replicas"【设置-索引-副分片数量】: "1",
"uuid"【设置-索引-唯一标识】: "eI5wemRERTumxGCc1bAk2A",
"version"【设置-索引-版本】: {
"created": "7080099"
},
"provided_name"【设置-索引-名称】: "shopping"
}
}
}
}
在 Postman 中, 向 ES 服务器发 DELETE 请求 :http://127.0.0.1:9200/shopping
有了索引库,相当于数据库中的database;
接下来就需要建索引库(index)中的映射了, 类似于数据库(database)中的表结构(table)。
创建数据库表需要设置字段名称,类型, 长度, 约束等; 索引库也一样,需要知道这个类型 下
有哪些字段, 每个字段有哪些约束信息,这就叫做映射(mapping)。
在 Postman 中, 向 ES 服务器发 PUT 请求 :http://127.0.0.1:9200/索引名/_mapping
注:前提是先创建索引,才可以创建映射
{
"properties": {
"test_keyword_File": {
"type": "text",
"fields": {
"keyword": {
"type": "keyword",
"ignore_above": 256
}
}
},
"text": {
"type": "text"
},
"keywordFile": {
"type": "keyword"
},
"longFile": {
"type": "long"
},
"date": {
"type": "date",
"format": "yyy-MM-dd HH:mm:ss||yyyy-MM-dd||epoch_millis"
},
"booleanFile": {
"type": "boolean"
}
}
}
映射数据说明:
在 Postman 中, 向 ES 服务器发 GET 请求 :http://127.0.0.1:9200/student/_mapping
在 Postman 中, 向 ES 服务器发 PUT 请求 :http://127.0.0.1:9200/student1
这种可以直接创建索引以及对映的映射,不需要提前创建index
在 Postman 中, 向 ES 服务器发 PUT 请求 :http://127.0.0.1:9200/student1/_mapping
不可以使用/student1然后mapping的方式,那样会提示索引已存在
如果有时候我们我们对于一个text类型的字段即希望他能够分词,又希望他精确索引,那么我们就可以给这个字段设置为text,并加上keyword类型操作,当然,如果我们创建索引时不指定映射,es的自动动态映射也可以设置成这样:
首先说明es中索引的字段类型是不可修改的,只能是重新创建一个索引并设置好mapping,然后再将老索引的数据复制过去。
解决思路:
新建临时索引,执行字段类型,复制数据
删除旧索引,重建同名索引,从临时索引复制数据
#获取旧索引的字段映射
GET /users/_mapping
#创建临时索引带映射
PUT /users_temp
{
"mappings": {
"user": {
"properties": {
"age": {
"type": "long"
},
}
}
}
}
#复制数据
POST /_reindex
{
"source": {
"index": "users"
},
"dest": {
"index": "users_temp"
}
}
#删除旧索引
DELETE /users
#创建新索引带映射
PUT /users
{
"mappings": {
"user": {
"properties": {
"age": {
"type": "long"
},
}
}
}
}
#复制数据
POST /_reindex
{
"source": {
"index": "users_temp",
"query": {
"match_all": {}
}
},
"dest": {
"index": "users"
}
}
#删除临时索引
DELETE /users_temp
{
"properties":{
"dateFormatDate":{
"type": "date",
"format": "yyyy-MM-dd HH:mm:ss||yyyy-MM-dd||yyyy-MM||epoch_millis"
}
}
}
在 Postman 中, 向 ES 服务器发 POST 请求 :http://127.0.0.1:9200/myindex/_doc
上面的数据创建后, 由于没有指定数据唯一性标识(ID), 默认情况下, ES 服务器会随机
生成一个。
如果想要自定义唯一性标识,需要在创建时指定:http://127.0.0. 1:9200/myindex/_doc/1
在 Postman 中, 向 ES 服务器发 GET 请求 :http://127.0.0.1:9200/shoppin/_doc/1
和新增文档一样,输入相同的 URL 地址请求,如果请求体变化,会将原有的数据内容覆盖
在 Postman 中, 向 ES 服务器发 POST 请求 :http://127.0.0.1:9200/shopping/_doc/1
向 ES 服务器发 POST 请求 :http://127.0.0.1:9200/shopping/_doc/1,请求体发生改变
删除一个文档不会立即从磁盘上移除,它只是被标记成已删除(逻辑删除) 。
在 Postman 中, 向 ES 服务器发 DELETE 请求 :http://127.0.0.1:9200/shopping/_doc/1
一般删除数据都是根据文档的唯一性标识进行删除,实际操作时,也可以根据条件对多条数据进行删除
向 ES 服务器发 POST 请求 :http://127.0.0.1:9200/shopping/_delete_by_query
在 Postman 中, 向 ES 服务器发 GET 请求 :http://127.0.0.1:9200/student1/_search
{
"query": {
"match_all": {}
}
}
# "query":这里的 query 代表一个查询对象,里面可以有不同的查询属性
# "match_all":查询类型,例如: match_all(代表查询所有), match,term , range 等等
# {查询条件}:查询条件会根据类型的不同,写法也有差异
match 匹配类型查询,会把查询条件进行分词, 然后进行查询, 多个词条之间是 or 的关系
在 Postman 中, 向 ES 服务器发 GET 请求 :http://127.0.0.1:9200/student1/_search
{
"query":{
"match":{
"name":"张三"
}
}
}
multi_match 与 match 类似,不同的是它可以在多个字段中查询。
在 Postman 中, 向 ES 服务器发 GET 请求 :http://127.0.0.1:9200/student/_search
term 查询,精确的关键词匹配查询, 不对查询条件进行分词。
在 Postman 中, 向 ES 服务器发 GET 请求 :http://127.0.0.1:9200/student/_search
前提:这个name2必须是keyword类型的字段
terms 查询和 term 查询一样,但它允许你指定多值进行匹配。
如果这个字段包含了指定值中的任何一个值, 那么这个文档满足条件, 类似于 mysql 的 in
在 Postman 中, 向 ES 服务器发 GET 请求 :http://127.0.0.1:9200/student/_search
默认情况下,Elasticsearch 在搜索的结果中,会把文档中保存在_source 的所有字段都返回
。 如果我们只想获取其中的部分字段, 我们可以添加_source 的过滤
在 Postman 中, 向 ES 服务器发 GET 请求 :http://127.0.0.1:9200/student/_search
我们也可以通过:
bool
把各种其它查询通过must
(必须 )、 must_not
(必须不)、 should
(应该)
的方 式进行组合
在 Postman 中, 向 ES 服务器发 GET 请求 :http://127.0.0.1:9200/student/_search
range 查询找出那些落在指定区间内的数字或者时间。 range 查询允许以下字符
在 Postman 中, 向 ES 服务器发 GET 请求 :http://127.0.0.1:9200/student/_search
返回包含与搜索字词相似的字词的文档。
编辑距离是将一个术语转换为另一个术语所需的一个字符更改的次数。这些更改可以包括:
为了找到相似的术语,fuzzy 查询会在指定的编辑距离内创建一组搜索词的所有可能的变
体 或扩展。然后查询返回每个扩展的完全匹配。
通过 fuzziness 修改编辑距离。一般使用默认值 AUTO ,根据术语的长度生成编辑距离。
在 Postman 中, 向 ES 服务器发 GET 请求 :http://127.0.0.1:9200/student/_search
sort 可以让我们按照不同的字段进行排序, 并且通过 order 指定排序的方式。 desc 降序, asc
升序。
在 Postman 中, 向 ES 服务器发 GET 请求 :http://127.0.0.1:9200/student/_search
假定我们想要结合使用 age 和 _score 进行查询, 并且匹配的结果首先按照年龄排序,然
后 按照相关性得分排序
在 Postman 中, 向 ES 服务器发 GET 请求 :http://127.0.0.1:9200/student/_search
from:当前页的起始索引,默认从 0 开始。 from = (pageNum - 1) * size
size:每页显示多少条
在 Postman 中, 向 ES 服务器发 GET 请求 :http://127.0.0.1:9200/student/_search
聚合允许使用者对 es 文档进行统计分析, 类似与关系型数据库中的 group by,当然还有很
多其他的聚合, 例如取最大值、平均值等等。
对某个字段取最大值 max
在 Postman 中, 向 ES 服务器发 GET 请求 :http://127.0.0.1:9200/student/_search
对某个字段取最小值 min
在 Postman 中, 向 ES 服务器发 GET 请求 :http://127.0.0.1:9200/student/_search
对某个字段在查出的结果集中取和 sum
在 Postman 中, 向 ES 服务器发 GET 请求 :http://127.0.0.1:9200/student/_search
对某个字段在查出的结果集中取平均值 avg
在 Postman 中, 向 ES 服务器发 GET 请求 :http://127.0.0.1:9200/student/_search
对某个字段的值进行去重之后再取总数
在 Postman 中, 向 ES 服务器发 GET 请求 :http://127.0.0.1:9200/student/_search
State 聚合
stats 聚合, 对某个字段一次性返回 count ,max ,min ,avg 和 sum 五个指标
在 Postman 中, 向 ES 服务器发 GET 请求 :http://127.0.0.1:9200/student/_search
桶聚和相当于 sql 中的 group by 语句
terms 聚合,分组统计
在 Postman 中, 向 ES 服务器发 GET 请求 :http://127.0.0.1:9200/student/_search
在桶聚合分组查询后再进行聚合查询