全端工程师

掌握 ElasticSearch 聚合查询：Aggregations 入门与实战

- 一、引言 (Introduction)
- 二、数据准备 (Data Preparation)
- - 2.1 创建索引 (Create Index)
  - 2.2 批量导入数据 (Bulk Import Data)
- 三、聚合查询基础 (Aggregation Basics)
- - 3.1 什么是聚合查询？(What are Aggregations?)
  - 3.2 聚合查询的基本结构 (Basic Aggregation Structure)
  - 3.3 聚合类型 (Aggregation Types)
- 四、指标聚合 (Metrics Aggregations)
- - 4.1 `avg` (平均值)
  - 4.2 `min` (最小值)
  - 4.3 `max` (最大值)
  - 4.4 `sum` (总和)
  - 4.5 `stats` (统计信息)
  - 4.6 `value_count` (值计数)
  - 4.7 `cardinality` (基数/去重计数)
- 五、桶聚合 (Bucket Aggregations)
- - 5.1 `terms` (词条聚合)
  - 5.2 嵌套桶聚合
- 六、管道聚合 (Pipeline Aggregations)
- - 6.1 什么是管道聚合？
  - 6.2 `min_bucket` (最小桶)
  - 6.3 其他管道聚合
- 七、实战案例 (Practical Examples)
- - 案例 1：统计每个产品类别中，价格最高的产品的价格，并按最高价格降序排列
  - 案例 2：找出每个月销售额最高的日期
- 八、总结 (Conclusion)

一、引言 (Introduction)

在信息检索和数据分析的世界中，我们常常需要做的不仅仅是找到匹配特定关键词的文档。很多时候，我们需要从海量数据中提取出更深层次的、有价值的洞察。例如：

我想知道我的电商网站上所有商品的平均价格是多少？
哪个产品类别下的商品数量最多？
我的网站上有多少种不同的商品品牌？
在过去的一年中，每个月的销售总额是多少？
哪一天的销售额是最高的？

这些问题都涉及对数据的统计和分析，而不仅仅是简单的搜索。为了满足这些需求，Elasticsearch 提供了强大的聚合查询（Aggregations） 功能。聚合查询就像一个多功能的瑞士军刀，或者说是一个强大的数据分析工具箱，它允许你对数据进行各种分组、统计和计算，从而提取出隐藏在数据背后的关键信息。

你可以把聚合查询想象成 SQL 中的 GROUP BY 子句和各种聚合函数（COUNT, SUM, AVG, MIN, MAX）的组合，但 Elasticsearch 的聚合功能远比 SQL 更加灵活和强大。

本文将带你深入了解 Elasticsearch 7.10 版本中聚合查询的基础知识。通过本文，你将学习到：

聚合查询的基本概念和工作原理。
三种核心的聚合类型：指标聚合（Metrics Aggregations）、桶聚合（Bucket Aggregations）和管道聚合（Pipeline Aggregations）。
如何使用各种指标聚合函数（avg, min, max, sum, stats, value_count, cardinality）。
如何使用 terms 聚合进行分组。
如何使用管道聚合对聚合结果进行二次聚合。
通过实战案例学习如何在实际应用中运用聚合查询，解决真实的数据分析问题。

二、数据准备 (Data Preparation)

在开始学习聚合查询之前，我们需要先准备一些示例数据。我们将创建一个名为 product 的索引，并批量导入一些商品数据。

2.1 创建索引 (Create Index)

首先，我们创建一个名为 product 的索引，并定义其 mappings（映射）。Mappings 定义了索引中每个字段的数据类型以及如何进行索引和搜索。

PUT product
{
  "mappings": {
    "properties": {
      "createtime": {
        "type": "date"
      },
      "date": {
        "type": "date"
      },
      "desc": {
        "type": "text",
        "fields": {
          "keyword": {
            "type": "keyword",
            "ignore_above": 256
          }
        }
      },
      "lv": {
        "type": "text",
        "fields": {
          "keyword": {
            "type": "keyword",
            "ignore_above": 256
          }
        }
      },
      "name": {
        "type": "text",
        "analyzer": "ik_max_word",
        "fields": {
          "keyword": {
            "type": "keyword",
            "ignore_above": 256
          }
        }
      },
      "price": {
        "type": "long"
      },
      "tags": {
        "type": "text",
        "fields": {
          "keyword": {
            "type": "keyword",
            "ignore_above": 256
          }
        }
      },
      "type": {
        "type": "text",
        "fields": {
          "keyword": {
            "type": "keyword",
            "ignore_above": 256
          }
        }
      }
    }
  }
}

2.2 批量导入数据 (Bulk Import Data)

接下来，我们使用 Elasticsearch 的 _bulk API 来批量导入一些商品数据。_bulk API 可以一次性执行多个索引、更新或删除操作，效率更高。

POST /product/_bulk
{"index":{"_index": "product"}}
{"name": "小米手机", "desc": "手机中的战斗机", "price": 3999, "lv": "旗舰机", "type": "手机", "createtime": "2020-10-01T08:00:00Z", "tags": [ "性价比", "发烧", "不卡顿" ]}
{"index":{"_index": "product"}}
{"name": "小米NFC手机", "desc": "支持全功能NFC，手机中的滑翔机", "price": 4999, "lv": "旗舰机", "type": "手机", "createtime": "2020-05-21T08:00:00Z", "tags": [ "性价比", "发烧", "公交卡" ]}
{"index":{"_index": "product"}}
{"name": "NFC手机", "desc": "手机中的轰炸机", "price": 2999, "lv": "高端机", "type": "手机", "createtime": "2020-06-20T08:00:00Z", "tags": [ "性价比", "快充", "门禁卡" ]}
{"index":{"_index": "product"}}
{"name": "小米耳机", "desc": "耳机中的黄焖鸡", "price": 999, "lv": "百元机", "type": "耳机", "createtime": "2020-06-23T08:00:00Z", "tags": [ "降噪", "防水", "蓝牙" ]}
{"index":{"_index": "product"}}
{"name": "红米耳机", "desc": "耳机中的肯德基", "price": 399, "type": "耳机", "lv": "百元机", "createtime": "2020-07-20T08:00:00Z", "tags": [ "防火", "低音炮", "听声辨位" ]}
{"index":{"_index": "product"}}
{"name": "小米手机10", "desc": "充电贼快掉电更快，超级无敌望远镜，高刷电竞屏", "price": null, "lv": "旗舰机", "type": "手机", "createtime": "2020-07-27T08:00:00Z", "tags": [ "120HZ刷新率", "120W快充", "120倍变焦" ]}
{"index":{"_index": "product"}}
{"name": "挨炮 SE2", "desc": "除了CPU，一无是处", "price": 3299, "lv": "旗舰机", "type": "手机", "createtime": "2020-07-21T08:00:00Z", "tags": [ "割韭菜", "割韭菜", "割新韭菜" ]}
{"index":{"_index": "product"}}
{"name": "XS Max", "desc": "听说要出新款12手机了，终于可以换掉手中的4S了", "price": 4399, "lv": "旗舰机", "type": "手机", "createtime": "2020-08-19T08:00:00Z", "tags": [ "5V1A", "4G全网通", "大" ]}
{"index":{"_index": "product"}}
{"name": "小米电视", "desc": "70寸性价比只选，不要一万八，要不要八千八，只要两千九百九十八", "price": 2998, "lv": "高端机", "type": "电视", "createtime": "2020-08-16T08:00:00Z", "tags": [ "巨馍", "家庭影院", "游戏" ]}
{"index":{"_index": "product"}}
{"name": "红米电视", "desc": "我比上边那个更划算，我也2998，我也70寸，但是我更好看", "price": 2999, "type": "电视", "lv": "高端机", "createtime": "2020-08-28T08:00:00Z", "tags": [ "大片", "蓝光8K", "超薄" ]}
{"index":{"_index": "product"}}
{"name": "红米电视", "desc": "我比上边那个更划算，我也2998，我也70寸，但是我更好看", "price": 2998, "type": "电视", "lv": "高端机", "createtime": "2020-08-28T08:00:00Z", "tags": [ "大片", "蓝光8K", "超薄" ]}

代码解释:

POST /product/_bulk: 使用 _bulk API 向 product 索引发送批量请求。
每一行是一个 JSON 对象，表示一个操作。

现在，我们已经准备好了数据，可以开始学习 Elasticsearch 的聚合查询了！

三、聚合查询基础 (Aggregation Basics)

3.1 什么是聚合查询？(What are Aggregations?)

聚合查询（Aggregations）是 Elasticsearch 中一种强大的数据分析功能，它允许你对文档数据进行各种统计分析。与搜索查询（返回匹配的文档）不同，聚合查询返回的是聚合后的统计结果。

你可以将聚合查询类比为 SQL 中的 GROUP BY 子句和聚合函数（如 COUNT, SUM, AVG, MIN, MAX）。例如，你可以使用 SQL 来计算每个部门的平均工资：

SELECT department, AVG(salary) AS avg_salary
FROM employees
GROUP BY department;

Elasticsearch 的聚合查询提供了类似的功能，但更加灵活和强大。它可以处理更复杂的数据结构和分析场景，并且可以进行多层嵌套的聚合。

3.2 聚合查询的基本结构 (Basic Aggregation Structure)

聚合查询的基本语法结构如下：

GET /<index>/_search
{
  "size": 0,
  "aggs": {
    "": {
      "": {
        ""
      },
      "aggs": {
        "": {
          "": {
            ""
          }
        }
      }
    }
  }
}

解释：

GET //_search: 这是 Elasticsearch 的搜索 API，我们在这里使用它来执行聚合查询。
"size": 0: 这是一个可选参数。通常，在执行聚合查询时，我们只关心聚合结果，而不关心具体的文档内容。"size": 0 表示不返回任何文档，只返回聚合结果。
"aggs" (或 "aggregations"): 这是聚合查询的顶层关键字。所有聚合操作都定义在 aggs 对象中。
"": 这是你为聚合操作指定的名称。这个名称可以是任意的，它将作为聚合结果的一部分返回，方便你识别和引用。例如，你可以将计算平均价格的聚合命名为 "avg_price"。
"": 这是聚合的类型。Elasticsearch 提供了多种聚合类型，每种类型都有不同的功能。常见的聚合类型包括：
- avg (平均值)
- min (最小值)
- max (最大值)
- sum (总和)
- terms (词条聚合)
- stats (统计信息)
- 等等…
"": 这是特定于聚合类型的参数。不同的聚合类型有不同的参数。例如，avg 聚合需要指定要计算平均值的字段，terms 聚合需要指定要分组的字段。
"aggs": { ... } (在内部): 这是可选的嵌套聚合。你可以在一个聚合操作中嵌套另一个聚合操作，以实现更复杂的分析。例如，你可以先按产品类别分组，然后在每个类别中计算平均价格。

3.3 聚合类型 (Aggregation Types)

Elasticsearch 提供了三种主要的聚合类型：

Metrics Aggregations (指标聚合): 这类聚合主要用于计算单个数值指标。例如：
- avg: 计算平均值。
- min: 计算最小值。
- max: 计算最大值。
- sum: 计算总和。
- stats: 一次性计算多个统计值（avg, min, max, sum, count）。
- value_count: 计算非空字段的文档数量。
- cardinality: 计算字段的不同值的数量（去重）。
Bucket Aggregations (桶聚合): 这类聚合主要用于将文档分组到不同的“桶”中。每个桶代表一个分组。例如：
- terms: 按字段值对文档进行分组。
- date_histogram: 按日期范围对文档进行分组。
- range: 按自定义数值范围对文档进行分组。
- filter: 根据指定的过滤条件将文档分到一个桶
- filters: 根据指定的多个过滤条件将文档分到多个桶
Pipeline Aggregations (管道聚合): 这类聚合比较特殊，它们不直接操作文档，而是对其他聚合的结果进行进一步的聚合。例如：
- min_bucket: 找出包含最小值的桶。
- max_bucket: 找出包含最大值的桶。
- avg_bucket: 计算桶的平均值。
- sum_bucket: 计算桶的总和。
- stats_bucket: 对桶进行统计分析
- derivative: 计算导数（例如，计算销售额的变化率）。

本文将重点介绍这三种聚合类型的基础用法。接下来，我们将分别深入探讨每种聚合类型，并通过示例演示如何在实际应用中使用它们。

四、指标聚合 (Metrics Aggregations)

指标聚合用于计算单个数值指标，例如平均值、最小值、最大值、总和等。这些指标可以帮助你了解数据的整体特征。

4.1 `avg` (平均值)

avg 聚合用于计算指定字段的平均值。

示例： 计算 product 索引中所有产品的平均价格。

GET /product/_search
{
  "size": 0,
  "aggs": {
    "avg_price": {
      "avg": {
        "field": "price"
      }
    }
  }
}

代码解释:

"size": 0: 不返回文档，只返回聚合结果。
"aggs": 聚合查询的开始。
"avg_price": 我们为这个聚合操作指定的名称。
"avg": 指定聚合类型为 avg (平均值)。
"field": "price": 指定要计算平均值的字段为 price。

结果 (部分):

{
  ...
  "aggregations": {
    "avg_price": {
      "value": 3008.8
    }
  }
}

结果中的 "value" 字段显示了所有产品价格的平均值。

4.2 `min` (最小值)

min 聚合用于计算指定字段的最小值。

示例： 计算 product 索引中所有产品的最低价格。

GET /product/_search
{
  "size": 0,
  "aggs": {
    "min_price": {
      "min": {
        "field": "price"
      }
    }
  }
}

结果 (部分):

{
  ...
  "aggregations": {
    "min_price": {
      "value": 399.0
    }
  }
}

4.3 `max` (最大值)

max 聚合用于计算指定字段的最大值。

示例： 计算 product 索引中所有产品的最高价格。

GET /product/_search
{
  "size": 0,
  "aggs": {
    "max_price": {
      "max": {
        "field": "price"
      }
    }
  }
}

结果 (部分):

{
  ...
  "aggregations": {
    "max_price": {
      "value": 4999.0
    }
  }
}

4.4 `sum` (总和)

sum 聚合用于计算指定字段的总和。

示例： 计算 product 索引中所有产品的价格总和。

GET /product/_search
{
  "size": 0,
  "aggs": {
    "sum_price": {
      "sum": {
        "field": "price"
      }
    }
  }
}

结果 (部分):

{
  ...
  "aggregations": {
    "sum_price": {
      "value": 30088.0
    }
  }
}

4.5 `stats` (统计信息)

stats 聚合可以一次性计算多个统计值，包括：

count: 文档数量。
min: 最小值。
max: 最大值。
avg: 平均值。
sum: 总和。

示例： 获取 product 索引中所有产品的价格统计信息。

GET /product/_search
{
  "size": 0,
  "aggs": {
    "price_stats": {
      "stats": {
        "field": "price"
      }
    }
  }
}

结果 (部分):

{
  ...
  "aggregations" : {
    "statistics" : {
      "count" : 10,
      "min" : 399.0,
      "max" : 4999.0,
      "avg" : 3008.8,
      "sum" : 30088.0
    }
  }
}

结果中一次性返回了count，min，max，avg和sum

4.6 `value_count` (值计数)

value_count 聚合用于计算指定字段的非空值的文档数量。

示例： 计算 product 索引中有多少个文档具有 price 字段（即有多少个产品有价格信息）。

GET /product/_search
{
  "size": 0,
  "aggs": {
    "price_count": {
      "value_count": {
        "field": "price"
      }
    }
  }
}

结果 (部分):

{
  ...
  "aggregations": {
    "price_count": {
      "value": 10
    }
  }
}

注意，由于有一个文档的 price 字段为 null，因此结果为 10，而不是 11。

4.7 `cardinality` (基数/去重计数)

cardinality 聚合用于计算指定字段的不同值的数量（即去重计数）。

示例： 计算 product 索引中有多少种不同的产品等级 (lv)。

GET /product/_search
{
  "size": 0,
  "aggs": {
    "lv_cardinality": {
      "cardinality": {
        "field": "lv.keyword"
      }
    }
  }
}

代码解释:

"lv_cardinality": 聚合的名称。
"cardinality": 指定聚合类型为 cardinality。
"field": "lv.keyword": 指定要计算基数的字段为 lv.keyword。这里使用 .keyword 子字段是因为我们要对原始的、未分词的 lv 值进行去重计数。

结果 (部分):

{
  ...
  "aggregations": {
    "lv_cardinality": {
      "value": 3
    }
  }
}

结果表明，product 索引中有 3 种不同的产品等级。

cardinality 聚合的计算结果是近似的，而不是完全精确的。对于低基数字段（即不同值较少），结果通常是准确的。但对于高基数字段（即不同值非常多），为了提高性能，Elasticsearch 使用了一种称为 HyperLogLog++ 的算法进行近似计算。你可以通过 precision_threshold 参数来控制精度和内存使用之间的权衡。如果需要完全精确的去重计数，并且数据集较小，可以考虑使用 terms 聚合，并设置一个足够大的 size 值。但对于大数据集，cardinality 聚合通常是更好的选择。

五、桶聚合 (Bucket Aggregations)

桶聚合（Bucket Aggregations）用于将文档分组到不同的“桶”中。每个桶代表一个分组，可以根据不同的条件来创建桶。桶聚合本身不进行统计运算，其主要作用是分组。通常会在桶聚合内嵌套一个或者多个指标聚合，用于统计每个桶内的指标。

5.1 `terms` (词条聚合)

terms 聚合是最常用的桶聚合之一。它根据指定字段的值对文档进行分组，每个不同的字段值都会创建一个桶。

示例： 按 tags.keyword 字段对 product 索引中的产品进行分组，并统计每个标签下的文档数量。

GET /product/_search
{
  "size": 0,
  "aggs": {
    "tag_bucket": {
      "terms": {
        "field": "tags.keyword",
        "size": 10,
        "order": {
          "_count": "desc"
        }
      }
    }
  }
}

代码解释:

"size": 0: 不返回文档，只返回聚合结果。
"aggs": 聚合查询的开始。
"tag_bucket": 我们为这个聚合操作指定的名称。
"terms": 指定聚合类型为 terms (词条聚合)。
"field": "tags.keyword": 指定要进行分组的字段为 tags.keyword。使用 .keyword 子字段是因为我们要基于标签的原始值进行分组，而不是分词后的结果。
"size": 10: 指定返回的桶的最大数量。默认情况下，terms 聚合会返回文档数量最多的前 10 个桶。
"order": { "_count": "desc" }: 指定桶的排序方式。这里按照每个桶中文档数量 (_count) 的降序 (desc) 进行排序。

结果（部分）:

{
  ...
  "aggregations": {
    "tag_bucket": {
      "doc_count_error_upper_bound": 0,
      "sum_other_doc_count": 8,
      "buckets": [
        {
          "key": "性价比",
          "doc_count": 3
        },
        {
          "key": "发烧",
          "doc_count": 2
        },
        {
          "key": "大片",
          "doc_count": 2
        },
        {
          "key": "蓝光8K",
          "doc_count": 2
        },
        {
          "key": "超薄",
          "doc_count": 2
        },
		{
          "key": "割韭菜",
          "doc_count": 2
        },
        {
          "key": "120W快充",
          "doc_count": 1
        },
        {
          "key": "120HZ刷新率",
          "doc_count": 1
        },
        {
          "key": "120倍变焦",
          "doc_count": 1
        },
        {
            "key": "4G全网通",
            "doc_count": 1
        }
      ]
    }
  }
}

结果解释:

"buckets": 这是一个数组，包含了根据 tags.keyword 字段值分组后的桶。
"key": 每个桶的键，即 tags.keyword 字段的值（例如 “性价比”, “发烧”）。
"doc_count": 每个桶中的文档数量。
"doc_count_error_upper_bound"：由于terms聚合默认情况下返回文档数量最多的前N个桶，这个值表示因为桶数量限制，没有被统计到的文档数量的最大可能误差值。
"sum_other_doc_count": 由于terms聚合默认情况下返回文档数量最多的前N个桶，这个值表示未返回的其他桶中文档数量的总和。

size 参数:

size 参数控制返回的桶的数量。如果你想返回所有桶，可以将 size 设置为一个较大的值（例如，大于字段中不同值的数量）。但是，请注意，如果字段的基数非常高（即有很多不同的值），返回所有桶可能会消耗大量内存。

order 参数:

order 参数控制桶的排序方式。除了按 _count 排序外，还可以：

按 _key 排序："order": { "_key": "asc" } (按字段值升序) 或 "order": { "_key": "desc" } (按字段值降序)。
按桶内指标聚合的结果排序（稍后在嵌套聚合中介绍）。

5.2 嵌套桶聚合

在实际应用中，我们经常需要进行多层级的聚合。例如，我们想先按type进行分组，然后统计每个type中price的平均值。这种情况下我们就需要用到嵌套聚合。

GET /product/_search
{
  "size": 0,
  "aggs": {
    "type_bucket": {
      "terms": {
        "field": "type.keyword"
      },
      "aggs": {
        "avg_price": {
          "avg": {
            "field": "price"
          }
        }
      }
    }
  }
}

代码解释:

外层是一个terms聚合, 根据type.keyword字段进行分组。
内层是一个avg聚合, 计算每个分组内price字段的平均值。
内层聚合的结果会作为外层聚合每个桶的一个属性。

结果（部分）:

{
  ...
  "aggregations": {
    "type_bucket": {
      "doc_count_error_upper_bound": 0,
      "sum_other_doc_count": 0,
      "buckets": [
        {
          "key" : "手机",
          "doc_count" : 6,
          "avg_price" : {
            "value" : 3939.0
          }
        },
        {
          "key" : "耳机",
          "doc_count" : 3,
          "avg_price" : {
            "value" : 1465.3333333333333
          }
        },
        {
          "key" : "电视",
          "doc_count" : 2,
          "avg_price" : {
            "value" : 2998.5
          }
        }
      ]
    }
  }
}

结果解释:

"buckets": 这是一个数组，包含了根据 type.keyword 字段值分组后的桶。
"key": 每个桶的键，即 type.keyword 字段的值（例如 “手机”, “耳机”）。
"doc_count": 每个桶中的文档数量。
"avg_price": 每个桶中嵌套聚合的结果, 即该类型商品的平均价格。

通过嵌套聚合，我们可以轻松实现多层级的数据分析。我们可以根据需求自由组合不同的聚合类型，构建出非常复杂的聚合查询。

六、管道聚合 (Pipeline Aggregations)

管道聚合（Pipeline Aggregations）是一种特殊的聚合类型。它们不像指标聚合和桶聚合那样直接操作文档，而是对其他聚合的结果进行进一步的聚合。这就像在数据处理流程中添加了一个额外的“管道”，对上游聚合的输出进行处理。

6.1 什么是管道聚合？

管道聚合的核心思想是：输入是另一个聚合（或多个聚合）的输出，而不是文档本身。这使得我们可以进行诸如以下操作：

找出平均价格最低的产品类别。
计算每个月销售额的总和，然后找出销售额最高的月份。
计算某个指标的导数或移动平均值。

管道聚合的关键参数是 buckets_path，它用于指定要作为输入的聚合的路径。

6.2 `min_bucket` (最小桶)

min_bucket 管道聚合用于找出包含最小值的桶。

示例： 找出平均价格最低的产品分类（基于之前嵌套聚合的结果）。

GET /product/_search
{
  "size": 0,
  "aggs": {
    "type_bucket": {
      "terms": {
        "field": "type.keyword"
      },
      "aggs": {
        "avg_price": {
          "avg": {
            "field": "price"
          }
        }
      }
    },
    "min_avg_price_bucket": {
      "min_bucket": {
        "buckets_path": "type_bucket>avg_price"
      }
    }
  }
}

代码解释:

"type_bucket": 这是一个 terms 聚合，按产品类型 (type.keyword) 分组。
"avg_price": 这是一个嵌套的 avg 聚合，计算每个产品类型的平均价格。
"min_avg_price_bucket": 这是我们定义的管道聚合的名称。
"min_bucket": 指定聚合类型为 min_bucket。
"buckets_path": "type_bucket>avg_price": 这是 buckets_path 参数，它指定了要处理的聚合路径。
- type_bucket: 表示外层的 terms 聚合。
- >: 表示嵌套关系。
- avg_price: 表示内层的 avg 聚合。
- 所以，"type_bucket>avg_price" 表示我们要找到 type_bucket 聚合中，avg_price 聚合结果最小的那个桶。

结果（部分）:

{
  ...
  "aggregations": {
    "type_bucket": {
      ... // 省略了 type_bucket 的详细结果
    },
    "min_avg_price_bucket": {
      "value": 1465.3333333333333,
      "keys": [
        "耳机"
      ]
    }
  }
}

结果解释:

"min_avg_price_bucket": 管道聚合的结果。
"value": 最小值 (最低的平均价格)。
"keys": 取得最小值的桶的key值数组, 在本例中, 平均价格最低的分类是 “耳机”。

6.3 其他管道聚合

除了 min_bucket 之外，ElasticSearch 还提供了其他几种管道聚合：

max_bucket: 找出包含最大值的桶。用法与min_bucket类似, 只是找出最大值。
avg_bucket: 计算所有桶中某个指标的平均值。
sum_bucket: 计算所有桶中某个指标的总和。
stats_bucket：一次性计算多个统计值, 类似于stats指标聚合, 但是stats_bucket是作用于桶聚合的结果之上。
derivative: 计算导数（例如，计算销售额的变化率）。
moving_avg: 计算移动平均值（例如，计算过去 7 天的平均销售额）。
bucket_script: 使用脚本对桶的指标进行自定义计算。
bucket_selector: 根据脚本过滤桶。
bucket_sort: 对桶进行排序。

这些管道聚合提供了更高级的数据分析功能。你可以在 ElasticSearch 的官方文档中找到关于它们的详细信息。

七、实战案例 (Practical Examples)

现在，让我们通过几个更贴近实际应用的示例，来展示如何组合不同类型的聚合，以解决真实的数据分析问题。

案例 1：统计每个产品类别中，价格最高的产品的价格，并按最高价格降序排列

这个案例结合了 terms 桶聚合、max 指标聚合和排序。

GET product/_search
{
  "size": 0, 
  "aggs": {
    "type_bucket": {
      "terms": {
        "field": "type.keyword",
        "order": {
          "max_price": "desc"
        }
      },
      "aggs": {
        "max_price": {
          "max": {
            "field": "price"
          }
        }
      }
    }
  }
}

代码解释:

"type_buckets": terms 聚合，按 type.keyword 字段（产品类型）分组。
"order": { "max_price": "desc" }: 按嵌套的 max_price 聚合的结果（即每个类别中的最高价格）进行降序排序。
"max_price": 嵌套的 max 聚合，计算每个类别中的最高价格。

结果（部分）:

{
  ...
  "aggregations": {
    "type_buckets": {
      ...
      "buckets": [
        {
          "key" : "手机",
          "doc_count" : 6,
          "max_price" : {
            "value" : 4999.0
          }
        },
        {
          "key" : "电视",
          "doc_count" : 2,
          "max_price" : {
            "value" : 2999.0
          }
        },
        {
          "key" : "耳机",
          "doc_count" : 3,
          "max_price" : {
            "value" : 2998.0
          }
        }
      ]
    }
  }
}

案例 2：找出每个月销售额最高的日期

这个案例结合了 date_histogram 桶聚合、sum 指标聚合和 max_bucket 管道聚合。

GET /product/_search
{
  "size": 0,
  "aggs": {
    "sales_per_month": {
      "date_histogram": {
        "field": "createtime",
        "calendar_interval": "month"
      },
      "aggs": {
        "sales_per_day": {
          "date_histogram": {
            "field": "createtime",
            "calendar_interval": "day"
          },
          "aggs": {
            "daily_sales": {
              "sum": {
                "field": "price"
              }
            }
          }
        },
        "max_daily_sales": {
          "max_bucket": {
            "buckets_path": "sales_per_day>daily_sales"
          }
        }
      }
    }
  }
}

代码解释:

sales_per_month (外层 date_histogram):
- 按月对文档进行分组（"calendar_interval": "month"）。
- field: “createtime”
sales_per_day (内层 date_histogram):
- 在每个月的桶内，再按天对文档进行分组（"calendar_interval": "day"）。
- field: “createtime”
daily_sales (指标聚合):
- 在每个天的桶内，计算当天的销售总额（"sum": { "field": "price" }）。
max_daily_sales (管道聚合):
- 使用 max_bucket 管道聚合。
- "buckets_path": "sales_per_day>daily_sales": 找出每个月内，daily_sales (销售总额) 最高的那个 sales_per_day (天) 桶。

结果 (部分):

{
  ...
  "aggregations": {
    "sales_per_month": {
      "buckets": [
        {
          "key_as_string": "2020-05-01T00:00:00.000Z",
          "key": 1588291200000,
          "doc_count": 1,
          "sales_per_day": {
            ...
          },
          "max_daily_sales": {
            "value": 4999.0,
            "keys": [
              "2020-05-21T00:00:00.000Z"
            ]
          }
        },
        {
          "key_as_string": "2020-06-01T00:00:00.000Z",
          "key": 1590969600000,
          "doc_count": 2,
           "sales_per_day": {
            ...
          },
          "max_daily_sales": {
            "value": 2999.0,
             "keys": [
              "2020-06-20T00:00:00.000Z"
            ]
          }
        },
		...
      ]
    }
  }
}

结果显示, 对于每个月, 销售额最高的那一天的日期和销售额都被找了出来. 例如, 在2020年5月, 销售额最高的那一天是2020-05-21, 销售额是4999.

这两个案例展示了如何将不同类型的聚合组合起来，以解决更复杂的数据分析问题。 ElasticSearch 聚合的强大之处在于其灵活性和可组合性，你可以根据自己的需求设计出各种各样的聚合查询。\

八、总结 (Conclusion)

在本教程中，我们深入探讨了 Elasticsearch 7.10 中聚合查询的基础知识。聚合查询是 Elasticsearch 中进行数据分析的强大工具，它能够帮助你从海量数据中提取出有价值的统计信息和洞察。

我们学习了：

聚合查询的基本概念和结构： 了解了聚合查询与搜索查询的区别，以及聚合查询的基本 JSON 结构。
三种核心的聚合类型：
- 指标聚合 (Metrics Aggregations): 用于计算单个数值指标，如平均值、最小值、最大值、总和、去重计数等。
- 桶聚合 (Bucket Aggregations): 用于将文档分组到不同的桶中，如按字段值分组、按日期范围分组等。
- 管道聚合 (Pipeline Aggregations): 用于对其他聚合的结果进行进一步的聚合，如找出最大值、最小值、计算导数等。
各种常用的聚合函数： avg, min, max, sum, stats, value_count, cardinality, terms, min_bucket, max_bucket 等。
如何使用嵌套聚合： 将不同类型的聚合组合起来，实现更复杂的数据分析。
实战案例： 通过两个实际案例，展示了如何运用聚合查询解决真实的数据分析问题。

Elasticsearch 的聚合功能远不止于此。本文只是一个入门指南，涵盖了最基础和最常用的部分。要充分发挥 Elasticsearch 聚合的威力，你需要不断学习和实践，探索更高级的聚合类型和用法。

进一步学习的建议：

阅读 Elasticsearch 官方文档： 官方文档是学习 ElasticSearch 的最佳资源。关于聚合的详细文档，请参考
尝试更多的聚合类型： 除了本文介绍的聚合类型外，ElasticSearch 还提供了许多其他聚合类型，如 date_histogram、range、filters、geo_distance、percentiles、top_hits 等等。
练习、练习、再练习： 最好的学习方法就是实践。尝试使用不同的数据集和不同的聚合组合，来解决各种数据分析问题。

希望本文能帮助你入门 Elasticsearch 聚合查询。祝你在数据分析的道路上不断进步！

你可能感兴趣的:(elasticsearch,elasticsearch,java)

java web5（黑马） rzl02 java 前端开发语言
Request&Response作用：Request：获取请求数据Response：设置响应数据Request继承体系1.Tomcat需要解析请求数据，封装为request对象，并且创建request对象传递到service方法中2.使用request对象，查阅JavaEEAPI文档的HttpServletRequest接口获取请求数据1.获取请求数据>请求行:GET/request-demo/r
jvm执行i++代码的步骤，内存中数据的流转过期小朋友、 jdk
大家好，今天看了一个java面试讲解课程，里面说i++，在jvm执行时，会被分成四步：1.主存中i的数值放到线程工作内存2.加一3.加一的值放回线程工作内存中4.线程工作内存中的值放回主存中使用idea编写了一个例子，获取jvm的汇编指令，使用指令说明，翻译过来在内存中数值流转。发现2,3是一个命令iadd。具体如下:例子：packagecom.wmr.jvmtest;publicclassIPl
java中next()和nextline()用法区别（详细说明）
直接给出总结:next()：当遇到空格/Tab键/回车截止读取,不包含空格/Tab键/回车,开头如果有空格/Tab/回车，直接无视，读取后面的字符，直到遇到空格/Tab键/回车截止读取；nextLine()：读取字符前后的空格/Tab键，有回车键时截止读取，包含回车键。注意:nextInt（）、nextdoublie（）、nextfloat（）和next（）方法的效果是一样的
常见构建工具使用与原理浅析
1.初版构建工具1.1.GruntGrunt是前端第一个正式的构建工具，它基于Node.js开发。Grunt同样是基于插件实现功能拓展增强，但对于像Webpack上很多能力，如HMR、ScopeHoisting等都是不支持的，可以作为学习Webpack前的了解。Grunt更像是一种自动化的配置工具集，就如官方所说，Grunt是TheJavaScriptTaskRunner，每个Grunt任务通常必
在项目架构时，如何选择打包构建工具？ aiguangyuan 前端架构前端开发系统架构
在选择打包构建工具时，项目的具体需求、团队的技术栈、开发者的熟悉程度、以及项目的复杂度都是需要考虑的重要因素。1.项目规模与复杂度大型复杂项目：如果你的项目是一个大型复杂的单页应用程序（SPA），例如企业级应用，建议使用Webpack。Webpack的强大配置能力和丰富的插件生态系统能够满足复杂项目的各种需求，如代码拆分、缓存优化、懒加载等。中小型项目或库：如果是中小型项目或开发一个JavaScr
进程 ⇢ JVM ⇢ 线程＋内存关系 MYGAG jvm
.从零到跑起一个Java程序OS创建进程execvejava…→新进程的地址空间、handle、时间片就位。JavaLauncher进场可执行文件里的C/C++的main()解析参数，dlopenlibjvm.so/jvm.dll。JNI_CreateJavaVM诞生JVM实例△分配堆、元空间、代码缓存等△拉起GC/JIT/信号处理等守护线程把Launcher的原生线程变成Javamain线程开始
java并发编程--可见性、原子性、有序性 weixin_ab jvm jvm
在Java并发编程中，可见性、原子性和有序性是保证多线程程序正确性的三个重要特性：1.原子性（Atomicity）定义：原子性指的是一个操作是不可中断的，要么全部执行成功，要么全部不执行。就好像是一个“原子”，不可再分。在Java中，对基本数据类型（除long和double在某些平台上）的简单读写操作是原子的，但像i++这样的复合操作不是原子的。示例：publicclassAtomicityExa
Java自定义类热加载实现原理与实践 weixin_ab #类的加载机制 java类加载
Java自定义类热加载实现原理与实践在Java开发中，类热加载（ClassReloading）指在程序运行时动态替换已加载的类，避免重启应用。核心原理是通过自定义类加载器打破JVM类加载的固有规则，实现类的动态加载与更新。以下从实现原理、核心步骤、代码示例到生产实践展开详细解析。一、热加载核心原理：突破类加载机制限制1.类加载器的隔离性每个类加载器维护独立的命名空间，相同类名的类由不同加载器加载会
Spring Boot类加载机制深度剖析 weixin_ab #类的加载机制 java类加载
SpringBoot类加载机制深度剖析：从可执行Jar到自动配置的实现原理SpringBoot通过对Java类加载机制的定制化扩展，实现了可执行Jar包运行、自动配置、热部署等核心特性。其类加载机制既保留了JVM标准规范，又针对微服务架构和嵌入式容器进行了优化，以下从架构设计、核心组件、典型场景到源码实现展开深度解析。一、SpringBoot类加载器体系架构（对比独立Tomcat）1.简化的两层类
java类加载机制：Tomcat的类加载机制 weixin_ab #类的加载机制 java类加载
Tomcat类加载机制深度解析：打破双亲委派的Web容器实现Tomcat作为JavaWeb容器，其类加载机制为满足Web应用的隔离性、热部署和兼容性需求，对标准Java类加载机制进行了定制化扩展，核心是打破双亲委派模型并引入多层级类加载器。以下从架构设计、核心组件、热部署实现到典型问题展开解析。一、Tomcat类加载器层级架构（与标准JVM的区别）1.四层类加载器体系BootstrapClassL
EasyExcel 初使用—— Java 实现多种写入 Excel 功能 Java雪荷 EasyExcel java excel 开发语言 github
前言大家好，我是雪荷。之前有一篇博客（EasyExcel初使用——Java实现读取Excel功能_javaeasyexcel.read-CSDN博客）介绍了Java如何读取Excel表格，那么此篇博客就和大家介绍下Java如何利用EasyExcel写入Excel。EasyExcel官方网址：EasyExcel官方文档-基于Java的Excel处理工具|EasyExcel前置准备引入依赖先创建一个S
Spring Boot 牵手EasyExcel：解锁高效数据处理姿势灵犀学长 Spring Boot 全栈开发 spring boot java 架构微服务后端
引言在日常的Java开发中，处理Excel文件是一个极为常见的需求。无论是数据的导入导出，还是报表的生成，Excel都扮演着重要的角色。例如，在企业的财务管理系统中，需要将每月的财务数据导出为Excel报表，方便财务人员进行数据分析和审计；在人力资源管理系统中，可能需要导入员工的基本信息、考勤记录等数据到系统中。然而，传统的Excel处理方式，如使用POI等工具，虽然功能强大，但在面对复杂的业务场
Java 工作中常用案例 qq_4240 java
1.LocalDateTime获取某月的第一天开始时间和最后一天的结束时间/***获取指定年和月的第一天和最后一天*应用：数据库同步，本地库和其他库按照月份分组统计后，两两比对后，得到不相同的月份，*根据月份的第一天和最后一天，查询两个库具体值，做交集或差集，然后得到未同步*的数据后同步数据*2022-12xx*2022-11xx*@parammonth2022-12*@return*/publi
使用Node.js命令行进行编程翠绿探寻 node.js vim 编辑器编程
Node.js是一个基于ChromeV8JavaScript引擎构建的运行时环境，它可以让开发者使用JavaScript语言编写服务器端代码。Node.js命令行界面（CLI）是一个强大的工具，它提供了与Node.js交互和执行JavaScript代码的能力。在本文中，我们将介绍如何在Node.js命令行中使用JavaScript进行编程，并提供相应的源代码示例。1.安装Node.js首先，我们需
Kafka系列之：不删除Kafka Topic，清理Kafka Topic中的数据快乐骑行^_^ Kafka Kafka系列不删除Kafka Topic 清理Kafka Topic数据
Kafka系列之：不删除KafkaTopic，清理KafkaTopic中的数据一、需求二、Java删除Topic中数据三、python删除Topic中数据一、需求需要清理topic中的数据但是不能通过删除topic删除数据，则采取基于topic的offset删除topic中的数据二、Java删除Topic中数据HashMapdeleteRecords=newHashMap<>();这一行创建了一个
反向遍历--当你修改一个元素的outerHTML时，该元素会被从 DOM 中移除专注VB编程开发20年 html javascript
varspans=editor.querySelectorAll('span[mytag]');//将NodeList转换为数组//varspansArray=Array.from(spans);varid=0spans.forEach(span=>{span.outerhtml这里无法直接修改吗?}在JavaScript中，outerHTML是一个可写属性，但你需要注意以下几点：1.属性名大小写
java中，stream的filter和list的removeIf筛选速度比较码傻啦弟软件开发 java list python
在Java里，Stream的filter和List的removeIf筛选效率要依据具体情形来判断。1.操作本质有别Stream的filter：它是一种中间操作，不会立刻执行，而是把筛选条件记录下来。只有遇到终端操作时，才会开始处理元素。此操作不会对原集合进行修改，而是生成一个新的流。List的removeIf：这是一种终端操作，会立即对原集合进行修改，删除满足条件的元素。它直接在原集合上进行元素的
Tomcat镜像实战：掌握Dockerfile的编写以及发布项目 hunjinYang Linux tomcat docker
1.为什么选择Docker部署Tomcat？在传统的JavaWeb项目部署中，我们通常需要手动安装JDK、配置Tomcat环境变量、手动部署WAR包，部署过程繁琐、不可重复、环境易出错。而Docker的出现彻底改变了这一局面。本博客将通过一个完整的Tomcat镜像构建与部署实例，带你逐步掌握以下技能：编写自己的Dockerfile构建定制化的Tomcat镜像（包含JDK与Tomcat）在容器中运行
ASP.NET Web Pages - 教程 samFuB asp.net 前端后端
ASP.NET是一个使用HTML、CSS、JavaScript和服务器脚本创建网页和网站的开发框架。ASP.NET支持三种不同的开发模式：WebPages（Web页面）、MVC（ModelViewController模型-视图-控制器）、WebForms（Web窗体）：本教程介绍WebPages。WebPagesMVCWebForms从何入手？多数开发人员学习一个新技术，是从查看运行实例开始的。通
ASP.NET Web Pages 教程：从入门到精通 KrDebugging asp.net 前端后端编程学习
ASP.NETWebPages是一种用于构建动态网页的技术，它结合了传统的HTML、CSS和JavaScript，以及强大的服务器端编程语言C#。本教程将带您逐步学习ASP.NETWebPages的基础知识，并通过示例代码演示如何创建交互性强、功能丰富的网页应用程序。环境设置在开始学习ASP.NETWebPages之前，您需要进行以下环境设置：安装VisualStudio：您可以从Microsof
JavaScript中==和===的区别，以及应用场景小熊哥^--^ 前端 javascript 前端开发语言
比较操作符==与===的区别==是一个等于操作符，如果操作数相等就会返回true，但==涉及JavaScript中的隐式转换。在使用==时会先进行类型转换，再判断操作数是否相等。以下是示例：console.log(true==1);//trueconsole.log("1"==true);//trueconsole.log("55"==55);//trueconsole.log(0==false)
Spring Boot 应用开发入门指南 20230310121 spring boot 后端
引言在现代软件开发中，SpringBoot以其简化配置和快速开发的特性，成为构建Java应用的热门选择。本文将通过多个主题为大家详细介绍如何搭建和开发SpringBoot应用，涵盖开发环境配置、项目搭建、持久层整合等内容。1.配置开发环境1.1JDK安装首先，确保安装了JDK（JavaDevelopmentKit）。推荐使用JDK11或更高版本。下载地址：OracleJDK安装完成后，配置环境变量
支持向量机（SVM）在肝脏CT/MRI图像分类（肝癌检测）中的应用及实现猿享天开医学影像支持向量机机器学习人工智能算法
博主简介：CSDN博客专家、CSDN平台优质创作者，高级开发工程师，数学专业，10年以上C/C++,C#,Java等多种编程语言开发经验，拥有高级工程师证书；擅长C/C++、C#等开发语言，熟悉Java常用开发技术，能熟练应用常用数据库SQLserver,Oracle,mysql,postgresql等进行开发应用，熟悉DICOM医学影像及DICOM协议,业余时间自学JavaScript,Vue,
简述C++ nlohmann/json 库 ikkkkkkkl json c++nlohmann
目录JSON概述nlohmann/json库的使用创建json数组/对象字符串解析（parse反序列化）数据访问序列化文件读写JSON概述JSON(JavaScripObjectNotation)是一种轻量级、跨语言的数据交换格式。它基于ECMAScript子集，以独立于编程语言的文本格式存储和表示数据，简洁清晰的结构使其成为理想的数据交换语言，易读、易写且便于机器解析生成，能提升网络传输效率。J
Android课程前言雪碧聊技术 Android android Java Kotlin
目录一.前言1.Android可以采用哪些语言2.Kotlin和Java的关系①完全互操作（核心关系）②Kotlin是Java的“升级版”③Google的官方态度④Java的现状⑤如何选择？⑥类比总结：一.前言1.Android可以采用哪些语言首选语言为Kotlin，但是上手难度较大；还可以使用Java,这是安卓的传统主力编程语言。总之，建议先使用Java语言开始学Android，后期再学Kotl
Spring IO 与企业级应用开发_构建标准化项目的最佳实践
1.前言1.1SpringIO的诞生背景与定位随着Spring生态的不断扩展，Java开发者在使用SpringBoot、SpringData、SpringSecurity等模块时，常常面临一个痛点：不同模块之间版本不一致、依赖冲突频发、升级困难。为了解决这一问题，Spring推出了SpringIOPlatform，它是一个统一版本管理平台，提供了一套经过验证的模块版本组合（BOM），帮助开发者快速
React + PDF.js 预览 PDF 文件：从基础实现到高级优化的完整指南 EndingCoder 前端开发 javascript react.js pdf 前端前端框架
关键点PDF.js：Mozilla开发的开源JavaScript库，用于在浏览器中渲染PDF文件。React集成：结合React组件化特性，实现高效、交互式的PDF预览功能。功能实现：支持PDF文件加载、页面导航、缩放、搜索、书签和注释。优化策略：包括性能优化（懒加载、缓存）、可访问性和手机端适配。常见问题：处理大文件加载、跨浏览器兼容性和内存管理。实践场景：通过一个文档管理应用，展示PDF.js
Vue3 学习教程，从入门到精通，Vue3 简介知识点及案例代码（1）知识分享小能手 vue3 前端开发网页开发学习 bootstrap javascript typescript 前端 vue.js vue
Vue3简介知识点及案例代码一、Vue3简介Vue3是一款用于构建用户界面的渐进式JavaScript框架，采用MVVM模式，具有响应式、组件化等优点，可提高开发效率，优化应用性能。二、Web前端开发概述Web前端开发涉及HTML、CSS、JavaScript等技术，用于构建用户可直接交互的页面部分。随着技术发展，出现了多种前端框架，Vue3是其中的优秀代表，基于前后端分离模式，使前后端开发解耦，
JAVA自带延时队列DelayQueue集成 m0_47460678 JAVA java 开发语言
importorg.springframework.context.annotation.Bean;importorg.springframework.context.annotation.Configuration;importjava.util.concurrent.DelayQueue;/***延迟队列管理器配置类*用于管理和配置延迟队列相关组件*/@Configurationpublicc
python+springboot+nodejs+uniapp基于微信小程序外卖系统 QQ_1963288475 python spring boot uni-app django flask node.js 微信小程序
文章目录具体实现截图本项目支持的技术路线源码获取详细视频演示：文章底部获取博主联系方式！！！！本系统开发思路进度安排及各阶段主要任务java类核心代码部分展示主要参考文献：源码获取/详细视频演示##项目介绍随着移动互联网的迅猛发展，微信小程序凭借其无需下载安装、即用即走的特点，成为众多应用开发的首选平台。本文设计并实现了一款基于微信小程序的外卖网站，旨在为用户提供便捷的点餐服务，同时为餐厅提供高效
微信开发者验证接口开发 362217990 微信开发者 token 验证
微信开发者接口验证。 Token，自己随便定义，与微信填写一致就可以了。根据微信接入指南描述 http://mp.weixin.qq.com/wiki/17/2d4265491f12608cd170a95559800f2d.html 第一步：填写服务器配置第二步：验证服务器地址的有效性第三步：依据接口文档实现业务逻辑这里主要讲第二步验证服务器有效性。建一个
一个小编程题-类似约瑟夫环问题 BrokenDreams 编程
今天群友出了一题：一个数列,把第一个元素删除,然后把第二个元素放到数列的最后,依次操作下去,直到把数列中所有的数都删除,要求依次打印出这个过程中删除的数。 &
linux复习笔记之bash shell (5) 关于减号-的作用 eksliang linux关于减号“-”的含义 linux关于减号“-”的用途 linux关于“-”的含义 linux关于减号的含义
转载请出自出处： http://eksliang.iteye.com/blog/2105677 管道命令在bash的连续处理程序中是相当重要的，尤其在使用到前一个命令的studout（标准输出）作为这次的stdin（标准输入）时，就显得太重要了，某些命令需要用到文件名，例如上篇文档的的切割命令（split）、还有
Unix(3) 18289753290 unix ksh
1)若该变量需要在其他子进程执行，则可用"$变量名称"或${变量}累加内容什么是子进程？在我目前这个shell情况下，去打开一个新的shell，新的那个shell就是子进程。一般状态下，父进程的自定义变量是无法在子进程内使用的，但通过export将变量变成环境变量后就能够在子进程里面应用了。 2)条件判断： &&代表and ||代表or&nbs
关于ListView中性能优化中图片加载问题酷的飞上天空 ListView
ListView的性能优化网上很多信息，但是涉及到异步加载图片问题就会出现问题。具体参看上篇文章http://314858770.iteye.com/admin/blogs/1217594 如果每次都重新inflate一个新的View出来肯定会造成性能损失严重，可能会出现listview滚动是很卡的情况，还会出现内存溢出。现在想出一个方法就是每次都添加一个标识，然后设置图
德国总理默多克：给国人的一堂“震撼教育”课永夜-极光教育
http://bbs.voc.com.cn/topic-2443617-1-1.html德国总理默多克：给国人的一堂“震撼教育”课　安吉拉—默克尔，一位经历过社会主义的东德人，她利用自己的博客，发表一番来华前的谈话，该说的话，都在上面说了，全世界想看想传播——去看看默克尔总理的博客吧！　　德国总理默克尔以她的低调、朴素、谦和、平易近人等品格给国人留下了深刻印象。她以实际行动为中国人上了一堂
关于Java继承的一个小问题。。。随便小屋 java
今天看Java 编程思想的时候遇见一个问题，运行的结果和自己想想的完全不一样。先把代码贴出来！ //CanFight接口 interface Canfight { void fight(); } //ActionCharacter类 class ActionCharacter { public void fight() { System.out.pr
23种基本的设计模式 aijuans 设计模式
Abstract Factory：提供一个创建一系列相关或相互依赖对象的接口，而无需指定它们具体的类。　　Adapter：将一个类的接口转换成客户希望的另外一个接口。A d a p t e r模式使得原本由于接口不兼容而不能一起工作的那些类可以一起工作。　　Bridge：将抽象部分与它的实现部分分离，使它们都可以独立地变化。　　Builder：将一个复杂对象的构建与它的表示分离，使得同
《周鸿祎自述：我的互联网方法论》读书笔记 aoyouzi 读书笔记
从用户的角度来看,能解决问题的产品才是好产品,能方便/快速地解决问题的产品,就是一流产品. 商业模式不是赚钱模式一款产品免费获得海量用户后,它的边际成本趋于0,然后再通过广告或者增值服务的方式赚钱,实际上就是创造了新的价值链. 商业模式的基础是用户,木有用户,任何商业模式都是浮云.商业模式的核心是产品,本质是通过产品为用户创造价值. 商业模式还包括寻找需求
JavaScript动态改变样式访问技术百合不是茶 JavaScript style属性 ClassName属性
一:style属性格式: HTML元素.style.样式属性="值"; 创建菜单:在html标签中创建或者在head标签中用数组创建 <html> <head> <title>style改变样式</title> </head> &l
jQuery的deferred对象详解 bijian1013 jquery deferred对象
jQuery的开发速度很快，几乎每半年一个大版本，每两个月一个小版本。每个版本都会引入一些新功能，从jQuery 1.5.0版本开始引入的一个新功能----deferred对象。 &nb
淘宝开放平台TOP Bill_chen C++c 物流 C#
淘宝网开放平台首页：http://open.taobao.com/ 淘宝开放平台是淘宝TOP团队的产品，TOP即TaoBao Open Platform，是淘宝合作伙伴开发、发布、交易其服务的平台。支撑TOP的三条主线为： 1.开放数据和业务流程 * 以API数据形式开放商品、交易、物流等业务； &
【大型网站架构一】大型网站架构概述 bit1129 网站架构
大型互联网特点面对海量用户、海量数据大型互联网架构的关键指标高并发高性能高可用高可扩展性线性伸缩性安全性大型互联网技术要点前端优化 CDN缓存反向代理 KV缓存消息系统分布式存储 NoSQL数据库搜索监控安全想到的问题： 1.对于订单系统这种事务型系统，如
eclipse插件hibernate tools安装白糖_ Hibernate
eclipse helios(3.6)版 1.启动eclipse 2.选择 Help > Install New Software...> 3.添加如下地址： http://download.jboss.org/jbosstools/updates/stable/helios/ 4.选择性安装：hibernate tools在All Jboss tool
Jquery easyui Form表单提交注意事项 bozch jquery easyui
jquery easyui对表单的提交进行了封装，提交的方式采用的是ajax的方式，在开发的时候应该注意的事项如下： 1、在定义form标签的时候，要将method属性设置成post或者get，特别是进行大字段的文本信息提交的时候，要将method设置成post方式提交，否则页面会抛出跨域访问等异常。所以这个要
Trie tree(字典树)的Java实现及其应用-统计以某字符串为前缀的单词的数量 bylijinnan java实现
import java.util.LinkedList; public class CaseInsensitiveTrie { /** 字典树的Java实现。实现了插入、查询以及深度优先遍历。 Trie tree's java implementation.(Insert,Search,DFS) Problem Description Igna
html css 鼠标形状样式汇总 chenbowen00 html css
css鼠标手型cursor中hand与pointer Example：CSS鼠标手型效果 <a href="#" style="cursor:hand">CSS鼠标手型效果</a><br/> Example：CSS鼠标手型效果 <a href="#" style=&qu
[IT与投资]IT投资的几个原则 comsci it
无论是想在电商,软件,硬件还是互联网领域投资,都需要大量资金,虽然各个国家政府在媒体上都给予大家承诺,既要让市场的流动性宽松,又要保持经济的高速增长....但是,事实上,整个市场和社会对于真正的资金投入是非常渴望的,也就是说,表面上看起来,市场很活跃,但是投入的资金并不是很充足的......
oracle with语句详解 daizj oracle with with as
oracle with语句详解转在oracle中，select 查询语句，可以使用with,就是一个子查询，oracle 会把子查询的结果放到临时表中，可以反复使用例子:注意，这是sql语句，不是pl/sql语句，可以直接放到jdbc执行的 ----------------------------------------------------------------
hbase的简单操作 deng520159 数据库 hbase
近期公司用hbase来存储日志,然后再来分析 ,把hbase开发经常要用的命令找了出来. 用ssh登陆安装hbase那台linux后用hbase shell进行hbase命令控制台! 表的管理 1）查看有哪些表 hbase(main)> list 2）创建表 # 语法：create <table>, {NAME => <family&g
C语言scanf继续学习、算术运算符学习和逻辑运算符 dcj3sjt126com c
/* 2013年3月11日20:37:32 地点：北京潘家园功能：完成用户格式化输入多个值目的：学习scanf函数的使用 */ # include <stdio.h> int main(void) { int i, j, k; printf("please input three number:\n"); //提示用
2015越来越好 dcj3sjt126com 歌曲
越来越好房子大了电话小了感觉越来越好假期多了收入高了工作越来越好商品精了价格活了心情越来越好天更蓝了水更清了环境越来越好活得有奔头人会步步高想做到你要努力去做到幸福的笑容天天挂眉梢越来越好婆媳和了家庭暖了生活越来越好孩子高了懂事多了学习越来越好朋友多了心相通了大家越来越好道路宽了心气顺了日子越来越好活的有精神人就不显
java.sql.SQLException: Value '0000-00-00' can not be represented as java.sql.Tim feiteyizu mysql
数据表中有记录的time字段（属性为timestamp）其值为：“0000-00-00 00:00:00” 程序使用select 语句从中取数据时出现以下异常： java.sql.SQLException:Value '0000-00-00' can not be represented as java.sql.Date java.sql.SQLException: Valu
Ehcache（07）——Ehcache对并发的支持 234390216 并发 ehcache 锁 ReadLock WriteLock
Ehcache对并发的支持在高并发的情况下，使用Ehcache缓存时，由于并发的读与写，我们读的数据有可能是错误的，我们写的数据也有可能意外的被覆盖。所幸的是Ehcache为我们提供了针对于缓存元素Key的Read（读）、Write（写）锁。当一个线程获取了某一Key的Read锁之后，其它线程获取针对于同
mysql中blob,text字段的合成索引 jackyrong mysql
在mysql中，原来有一个叫合成索引的，可以提高blob,text字段的效率性能，但只能用在精确查询，核心是增加一个列，然后可以用md5进行散列，用散列值查找则速度快比如： create table abc(id varchar(10),context blog,hash_value varchar(40)); insert into abc(1,rep
逻辑运算与移位运算 latty 位运算逻辑运算
源码：正数的补码与原码相同例+7 源码：00000111 补码：00000111 （用8位二进制表示一个数）负数的补码：符号位为1，其余位为该数绝对值的原码按位取反；然后整个数加1。 -7 源码： 10000111 ，其绝对值为00000111 取反加一：11111001 为-7补码已知一个数的补码，求原码的操作分两种情况：
利用XSD 验证XML文件 newerdragon java xml xsd
XSD文件（XML Schema 语言也称作 XML Schema 定义（XML Schema Definition，XSD）。具体使用方法和定义请参看： http://www.w3school.com.cn/schema/index.asp java自jdk1.5以上新增了SchemaFactory类可以实现对XSD验证的支持，使用起来也很方便。以下代码可用在J
搭建 CentOS 6 服务器(12) - Samba rensanning centos
（1）安装 # yum -y install samba Installed: samba.i686 0:3.6.9-169.el6_5 # pdbedit -a rensn new password:123456 retype new password:123456 …… （2）Home文件夹 # mkdir /etc
Learn Nodejs 01 toknowme nodejs
（1）下载nodejs https://nodejs.org/download/ 选择相应的版本进行下载（2）安装nodejs 安装的方式比较多，请baidu下我这边下载的是“node-v0.12.7-linux-x64.tar.gz”这个版本（1）上传服务器（2）解压 tar -zxvf node-v0.12.
jquery控制自动刷新的代码举例 xp9802 jquery
1、html内容部分复制代码代码示例: <div id='log_reload'> <select name="id_s" size="1"> <option value='2'>-2s-</option> <option value='3'>-3s-</option

掌握 ElasticSearch 聚合查询：Aggregations 入门与实战

掌握 ElasticSearch 聚合查询：Aggregations 入门与实战

一、引言 (Introduction)

二、数据准备 (Data Preparation)

2.1 创建索引 (Create Index)

2.2 批量导入数据 (Bulk Import Data)

三、聚合查询基础 (Aggregation Basics)

3.1 什么是聚合查询？(What are Aggregations?)

3.2 聚合查询的基本结构 (Basic Aggregation Structure)

3.3 聚合类型 (Aggregation Types)

四、指标聚合 (Metrics Aggregations)

4.1 avg (平均值)

4.2 min (最小值)

4.3 max (最大值)

4.4 sum (总和)

4.5 stats (统计信息)

4.6 value_count (值计数)

4.7 cardinality (基数/去重计数)

五、桶聚合 (Bucket Aggregations)

5.1 terms (词条聚合)

5.2 嵌套桶聚合

六、管道聚合 (Pipeline Aggregations)

6.1 什么是管道聚合？

6.2 min_bucket (最小桶)

6.3 其他管道聚合

七、实战案例 (Practical Examples)

案例 1：统计每个产品类别中，价格最高的产品的价格，并按最高价格降序排列

案例 2：找出每个月销售额最高的日期

八、总结 (Conclusion)

你可能感兴趣的:(elasticsearch,elasticsearch,java)

4.1 `avg` (平均值)

4.2 `min` (最小值)

4.3 `max` (最大值)

4.4 `sum` (总和)

4.5 `stats` (统计信息)

4.6 `value_count` (值计数)

4.7 `cardinality` (基数/去重计数)

5.1 `terms` (词条聚合)

6.2 `min_bucket` (最小桶)