DSL语句查询
查询字符串搜索便于通过命令行完成特定(ad hoc)的搜索,但是它也有局限性(参阅简单搜索章节)。Elasticsearch提供丰富且灵活的查询语言叫做DSL查询(Query DSL),它允许你构建更加复杂、强大的查询。
DSL(Domain Specific Language特定领域语言)以JSON请求体的形式出现
一、query context
主要特点:
- 是否包含
确定文档是否应该成为结果的一部分
- 相关度得分多少
除了确定文档是否匹配外,查询子句还计算了表示文档与其他文档相比匹配程度的_score
- 得分越高,相关度越高
更相关的文件,在搜索排名更高
应用场景:
- 全文检索——这种相关性的概念非常适合全文搜索,因为很少有完全“正确”的答案
文本查询语法:
match-模糊匹配:如 搜索"四大名著" 会查出包含 "四大" OR "名著" OR "四大名著"的记录
GET /megacorp/employee/_search
{
"query" : {
"match" : {
"last_name" : "四大名著"
}
}
}
match_phrase-短语匹配:如 搜索"四大名著" 不会查出包含 "四大" OR "名著" 只会查出包含 "四大名著"的记录
GET /megacorp/employee/_search
{
"query" : {
"match_phrase" : {
"last_name" : "四大名著"
}
}
}
multi_match-多字段匹配:如 搜索"孙悟空" 只要first_name或者about字段中包含 "孙悟空" OR "孙"等分词都会被查找出来;
GET /megacorp/employee/_search
{
"query": {
"multi_match": {
"query": "孙悟空",
"fields":["first_name","about"]
}
}
}
query_string-lucene查询语法查询(kibana查询语法)
GET /megacorp/employee/_search
{
"query": {
"query_string": {
"query": "孙悟空 OR 张三"
}
}
}
query_string-多字段
GET /megacorp/employee/_search
{
"query": {
"query_string": {
"fields":["about","last_name"],
"query": "孙悟空 OR 张三"
}
}
}
高亮搜索
GET /megacorp/employee/_search
{
"query" : {
"match_phrase" : {
"about" : "西游记"
}
},
"highlight": {
"fields" : {
"about" : {}
}
}
}
结构查询语法:
term-将按照存储在倒排索引中的确切字词进行操作,这些查询通常用于数字,日期和枚举等结构化数据,而不是全文本字段。 或者,它们允许您制作低级查询,并在分析过程之前进行
GET /megacorp/employee/_search
{
"query": {
"term": {
"age":"33"
}
}
}
range范围查询-如查询age大于等于20小于等于30的记录
GET /megacorp/employee/_search
{
"query": {
"range": {
"age":{
"gte":20,
"lte":30
}
}
}
}
二、fiter context
主要特点:
- 是否包含
确定是否包含在检索结果中,回答只有“是”或“否”,精确搜索
- 不涉及评分
在搜索中没有额外的相关度排名
- 针对结构化数据
适用于完全精确匹配,范围检索
- 更快
只确定是否包括结果中,不需要考虑得分。
为什么会更快?——经常使用的过滤器将被Elasticsearch自动缓存,以提高性能。
查询语法:
bool关键字
GET /megacorp/employee/_search
{
"query": {
"bool": {
"filter":{
"term":{
"age":33
}
}
}
}
}
复合查询
constant_score-将查询内部的结果文档得分都设定为1或者boost的值,多用于结合bool查询实现自定义得分
GET /megacorp/employee/_search
{
"query": {
"constant_score": {
"filter":{
"match":{
"about":"张三"
}
}
}
}
}
自定义分数
GET /megacorp/employee/_search
{
"query": {
"constant_score": {
"filter":{
"match":{
"about":"张三"
}
}
},
"boots":2
}
}
should-至少满足一个条件
GET /megacorp/employee/_search
{
"query": {
"bool": {
"should": [
{
"match": {
"first_name": "孙悟空"
}
},
{
"match": {
"last_name": "张三"
}
}
]
}
}
}
must-必须同时满足所有条件
GET /megacorp/employee/_search
{
"query": {
"bool": {
"must": [
{
"match": {
"first_name": "孙悟空"
}
},
{
"match": {
"about": "四大名著"
}
}
]
}
}
}
must_not-必须不满足条件 如:查不等于33岁的记录
GET /megacorp/employee/_search
{
"query": {
"bool": {
"must_not":
{
"term": {
"age": "33"
}
}
}
}
}
组合查询
GET /megacorp/employee/_search
{
"query": {
"bool": {
"must": [
{
"match": {
"first_name": "孙悟空"
}
},
{
"match": {
"about": "四大名著"
}
}
],
"filter":{
"term":{
"age":35
}
}
}
}
}
聚合查询GROUP BY
//根据年龄字段分组
GET /megacorp/employee/_search
{
"aggs": {
"group_by_age": {
"terms": { "field": "age" }
}
}
}
//根据条件分组
GET /megacorp/employee/_search
{
"query": {
"match": {
"last_name": "孙悟空"
}
},
"aggs": {
"group_by_age": {
"terms": { "field": "age" }
}
}
}
//分组并求平均值
GET /megacorp/employee/_search
{
"aggs": {
"group_by_age": {
"terms": { "field": "age" },
"aggs" : {
"avg_age" : {
"avg" : { "field" : "age" }
}
}
}
}
}