term & terms 查询
term 查询
term 的查询是代表完全的匹配,搜索之前不会对你搜索的关键字进行分词。
post /index/type/_search
{
“from”:0,
"size":5,
"query":{"term":{ "field":{ "value":"field_vlue" }} }
}
terms
terms 和 term 的查询 机制是一样,都不会将制定的查询关键字进行分词,直接去分词库中匹配,找到相应的文档内容。
terms 是在针对一个字段包含多个值的时候用。
eg:
term where field=value;
terms : where field=value or field=value1 or field=value2 类似于 mysql in
post /index/type/_search
{ "query":{"terms":{ "field":[value1,value2,values3] }}}
match 查询
| match 查询属于高级查询,他会根据你查询的字段类型不一样 ,采用不用的查询方式
1. 查询的是日期或者是数值的话,他会将你的字符串查询内容换为 日期或者数值对待
2. 如果查询的内容时一个不能被分词内容(keyword),match 查询不会对你指定的查询关键词进行分词。
3. 如果查询的内容时一个可以被粉刺的内容(text),match 会将你指定的查询内容根据一定方式去分词,去分词库中匹配指定的内容。
match 查询,实际底层就是多个term 查询,将多个term 查询的结果给你封装到了一起。
语法
post /index/type/_search
{
"query":{
"match_all":{}
}
}
post /index/type/_search
{
"query":{
"match":{
"field":"value"
}
}
}
multi_match
| match 针对一个field 做检索 ,multi_match 针对多个field 进行检索,多个field 对应一个vlue
post /index/type/_search
{
"query":{
"multi_match":{
"query":"value",
"fields":[field1,field2]
}
}
}
match_phrase
短语查询
post /index/type/_search
{
"query":{
"match_phrase":{
"query":"value"
}
}
}
simple_query_string
"+"并且 等价于 "dafault_operator":"AND" ,-不包含
post /index/type/_search
{
"query":{
"simple_query_string":{
"query":"beautiful + -mind"
“fields”:["title"]
"dafault_operator":"OR"
}
}
}
id 查询
GET /index/type/id
ids 查询
| 根据多个id 查询,类似MySQL中的 where id in (id1,id2)
post /index/type/_search
{
"query":{
"ids":{
"values":[value1,vlaue2]
}
}
}
prefix 查询
| 前缀查询,可以通过一个关键词去指定已field 的前缀,从而查询到指定
post /index/type/_search
{
"query":{
"prefix":{
"FIELD":{
"VALUE":value
}
}
}
}
fuzzy
| 模糊查询,我们输入字符的大概,ES就可以去根据输入的内容大概匹配 一下结果 (eg:盒马先生->盒马生鲜。如果错误太多,查询不到。不稳定)
post /index/type/_search
{
"query":{
"fuzzy":{
"FIELD":{
"VALUE":value
"prefix_length":2//指定 前两个字符不允许出错
}
}
}
}
wildcard 查询
|通配查询,heMySQL中的like 是一个套路,可以在查询时,在字符串中指定通配符*和占位符?
post /index/type/_search
{
"query":{
"wildcard":{
"FIELD":{
"VALUE":"中国*"
}
}
}
}
range查询
| 范围查询,只针对数值类型,对某一个Field 进行大于或者小于的范围指定
post /index/type/_search
{
"query":{
"range":{
"FIELD":{
"gte":10,
"lte":20,
}
}
}
}
regexp 查询
post /index/type/_search
{
"query":{
"regexp":{
"mobile":"180[0-9]{8}"
}
}
}
深分页 Scroll
ES对from+size 是有限制的,from和size 之和 不超过1w
原理:
- 将指定的关键词进行分词
- 将词汇去分词库中检索,得到多个文档的id
- 去各个分片中拉取指定的数据
耗时较长
- 将数据根据score 进行排序
耗时较长
- 根据from的值,将查询到的数据舍弃一部分
- 返回结果
Scroll 原理:
- 将指定的关键词进行分词
- 将词汇去分词库中检索,得到多个文档的id
- 将文档的id 放在ES的上下文中
- 根据你指定的size拉取指定数据,拿完数据的id会从上下文中删除
- 如果需要下一页数据,直接去ES的上下文,找后续内容
- 将数据根据score 进行排序
耗时较长
- 根据from的值,将查询到的数据舍弃一部分
scroll 查询 不适合做实时查询 (从内存中获取数据)
post /index/type/_search?scroll=1m '缓存一分钟’
{
"query":{"match_all":{}}
"size":2,
"sort":[{"fee":{"order":"desc"}}]
}
post /_search/scroll
{
"scroll_id":"根据第一步得到的scorll_id去指定"
"scroll":"1m" 缓存一分钟
}
delete-by-query
|根据term,match 等查询方式去删除大量的文档
post /index/type/_delete_by_query
{"query":{"range":{ "fee":lt:4}}}
复合查询
bool查询
| 复合过滤器,将你的多个查询条件以一定的逻辑组合在一起。
- must:所有的条件,用must组合在一起,标识And 的意思
- must_not :将 must_not 中的条件,全部不能匹配,标识Not 的意思。
- shuld: 将所有的条件,用shoud组合在一起 ,表示Or 的意思。
{"query":{
"bool":{
"should":[{"term":{"provice":{"value":""武汉}}}, {"term":{"provice":{"value":""北京}}}],
"must_not":[{"term":{"id"{"value":"2"}}}],
"must":[{"match":{}}]}}
}
filter 查询
- query ,根据你的查询条件,去计算文档的匹配度得到一个分数,并根据分数进行排序,不会做缓存。
- filter 根据你的查询条件去查询文档,不去计算分数,而且filter 会对经常被过滤对的数据进行缓存。
POST /index/type/_search
{"query":{"bool":{ "filter":[
{"term":{"field":"value"}},
{"range":{"fee":{"lte":4}}
}]}}}
高亮查询
|高亮查询就是用户输入的关键字,以一定的特殊样式展示给用户,让用户知道为什么这个结果被检索出来。
高亮展示的数据,本身就是文档中的一个Field,单独将Field 以hightlight 的形式返回给你。
ES 提供了一个Highlight 属性,和query 同级别。
- fragment_size:指定高亮数据展示多少个字符
- pre_tags:指定前缀标签
- post_tags: 指定后缀标签
POST /index/type/_search
{
"query":{"match":{"field":"盒马"}},
"highlight":{"fields":{"smsContent":{}}},
"pre_tags":"",
"fragment_size":10
}
聚合查询
|ES 的聚合查询和MyQL的聚合查询类型,ES 的聚合查询相比MySQL 要强大的多,ES提供的统计数据方式多种多样。
POST /index/type/_search
{"aggs":{ "名字(agg)":{ "agg_type":{ "属性":"值" }}}}
常见参数
- index
可以给属性 添加一个布尔类型的index属性,标识该属性是否能被倒排索引,也就是说是否能通过该字段进行搜索
- null value
在数据索引进ES的时候,当某些数据为null 的时候,该数据是不能被搜索的,可以使用null_value 属性指定一个值,当属性的值为null的时候,转换为一个通过null_value 指定的值。null_vlaue属性只能用于keyword类型的属性