本文翻译自:https://www.elastic.co/guide/en/elasticsearch/reference/current/_introducing_the_query_language.html
本文是Elasticsearch的入门文档,将会介绍ElasticSearch中的查询语言。
查询语言
Elasticsearch提供了一种可用于执行查询的特定于域的JSON风格的的语言。这被称为查询DSL。查询语言相当全面,第一次接触可能会让人恐慌,但实际学习的最佳方式是从几个基本的例子开始。
回到我们的最后一个例子,我们执行了这个查询:
GET /bank/_search
{
"query": { "match_all": {} }
}
解析上面的内容,查询部分告诉我们什么是查询定义,而match_all部分就是我们要运行的查询类型。 match_all查询只是搜索指定索引中的所有文档。
除了query参数外,我们还可以传递其他参数来影响搜索结果。在上面的例子中,我们通过sort,这里我们传递size:
GET /bank/_search
{
"query": { "match_all": {} },
"size": 1
}
请注意,如果未指定size,则默认为10。
此示例执行match_all并返回文档11至20:
GET /bank/_search
{
"query": { "match_all": {} },
"from": 10,
"size": 10
}
from参数(基于0)指定要从哪个文档索引开始,size参数指定从from参数开始返回多少文档。实现分页搜索结果时,此功能非常有用。请注意,如果未指定from,则默认为0。
此示例执行match_all,并按结果按降序按帐户余额排序,并返回前10名(默认大小)文档。
GET /bank/_search
{
"query": { "match_all": {} },
"sort": { "balance": { "order": "desc" } }
}
执行搜索
现在我们已经看到了一些基本的搜索参数,我们再来看一下查询DSL。我们先来看看返回的文档字段。默认情况下,完整的JSON文档作为所有搜索的一部分返回。这被称为源(搜索匹配中的_source字段)。如果我们不希望返回整个源文档,我们有能力仅从源代码中请求几个字段被返回。
此示例显示如何从搜索中返回两个字段account_number和balance(_source内部):
GET /bank/_search
{
"query": { "match_all": {} },
"_source": ["account_number", "balance"]
}
请注意,上述示例简单地减少_source字段。它仍然只返回一个名为_source的字段,但在其中只包含字段account_number和balance。
如果你有SQL技术背景,上述内容在概念上与SQL SELECT FROM字段列表有些相似。
现在我们来看看查询部分。前面,我们已经看到了如何使用match_all查询来匹配所有文档。现在我们来介绍一个称为match query的新查询,可以将其视为基本的字段搜索查询(即针对特定字段或一组字段进行搜索)。此示例返回的帐号为20:
GET /bank/_search
{
"query": { "match": { "account_number": 20 } }
}
此示例返回在地址中包含术语“mill”的所有帐户:
GET /bank/_search
{
"query": { "match": { "address": "mill" } }
}
此示例返回在地址中包含术语“mill”或“lane”的所有帐户:
GET /bank/_search
{
"query": { "match": { "address": "mill lane" } }
}
此示例是match(match_phrase)的变体,它返回所有包含地址中的“mill lane”短语的帐户:
GET /bank/_search
{
"query": { "match_phrase": { "address": "mill lane" } }
}
现在介绍一下bool query。 bool query
允许我们使用布尔逻辑将较小的查询组合成较大的查询。
此示例组成两个match查询,并返回包含“mill”和“lane”的所有帐户在地址中:
GET /bank/_search
{
"query": {
"bool": {
"must": [
{ "match": { "address": "mill" } },
{ "match": { "address": "lane" } }
]
}
}
}
在上面的例子中,bool must子句指定文档被认为是匹配的所有查询必须为true。
相比之下,此示例组成两个match查询,并返回地址中包含“mill”或“lane”的所有帐户:
GET /bank/_search
{
"query": {
"bool": {
"should": [
{ "match": { "address": "mill" } },
{ "match": { "address": "lane" } }
]
}
}
}
在上面的例子中,bool should子句指定一个查询列表,匹配文档中的任意一个为true。
此示例组成两个匹配查询,并返回在地址中既不包含“mill”也不包含“lane”的所有帐户:
GET /bank/_search
{
"query": {
"bool": {
"must_not": [
{ "match": { "address": "mill" } },
{ "match": { "address": "lane" } }
]
}
}
}
在上面的示例中,bool must_not子句指定了一个查询列表,对于一个被认为是匹配的文档,它们都不是true。
我们可以在一个bool查询中同时结合使用must,should和must_not子句。此外,我们可以在任何这些bool子句中组合bool查询,以模拟任何复杂的多级布尔逻辑。
此示例返回所有40岁,但state不是ID的人的所有帐户:
GET /bank/_search
{
"query": {
"bool": {
"must": [
{ "match": { "age": "40" } }
],
"must_not": [
{ "match": { "state": "ID" } }
]
}
}
}