等後那场雪

Elasticsearch使用篇 - 管道聚合

管道聚合

基于前一次聚合的结果，进行二次聚合统计。

从结构上可以分为兄弟级（Sibling）管道聚合和父级（Parent）管道聚合两种方式。

兄弟级管道聚合：在同一聚合级别上可以产生新聚合。

GET kibana_sample_data_logs/_search
{
  "size": 0,
  "aggs": {
    "count_per_day": {
      "date_histogram": {
        "field": "@timestamp",
        "calendar_interval": "day"
      }
    },
    "total_bytes_of_download": {
      "sum": {
        "field": "bytes"
      }
    }
  }
}

父级管道聚合。由父聚合提供输出，子聚合能够产生新的桶，然后可以添加到父桶中。

GET  kibana_sample_data_logs/_search
{
  "size": 0,
  "aggs": {
    "count_per_day": {
      "date_histogram": {
        "field": "@timestamp",
        "calendar_interval": "day"
      },
      "aggs": {
        "total_bytes_per_day": {
          "sum": {
            "field": "bytes"
          }
        }
      }
    }
  }
}

max_bucket、min_bucket、avg_bucket、sum_bucket

使用兄弟级管道聚合的方式，从多个分桶中获取指定数值指标的聚合结果（最大值 / 最小值 / 平均值 / 和）。

buckets_path：（必须）字段路径指向。
gap_policy：分桶数据出现空值或者缺失值的处理策略，默认 skip。gap_policy 详细说明
- skip：跳过空值或者缺失值，不参与聚合计算。
- insert_zeros：将空值或者缺失值当作 0 来参与聚合计算。
- keep_values：如果提供的指标值是一个空值或者缺失值则跳过，不参与聚合计算；否则使用该指标值参与聚合计算。
format：指定数值的输出格式，比如 #、#0.00。默认 null。

1、统计每个出发地国家的最大的航班飞行时间，并且获取航班飞行时间最长的国家以及对应的飞行时间。

GET kibana_sample_data_flights/_search
{
  "track_total_hits": true, 
  "size": 0,
  "aggs": {
    "OriginCountry_terms": {
      "terms": {
        "field": "OriginCountry",
        "size": 20
      },
      "aggs": {
        "FlightTimeMin_max": {
          "max": {
            "field": "FlightTimeMin"
          }
        }
      }
    },
    "pipeline-max-bucket": {
      "max_bucket": {
        "buckets_path": "OriginCountry_terms>FlightTimeMin_max"
      }
    }
  }
}

截取部分的聚合结果如下：

"my-pipeline" : {
  "value" : 1902.9019775390625,
  "keys" : [
    "AR"
  ]
}

2、获取出发地国家中每个出发地城市的航班飞行时间的相关指标，然后统计出发地城市中航班飞行最长的飞行时长以及对应的出发地城市名称。

GET kibana_sample_data_flights/_search
{
  "track_total_hits": true, 
  "size": 0,
  "aggs": {
    "OriginCountry_terms": {
      "terms": {
        "field": "OriginCountry",
        "size": 20
      },
      "aggs": {
        "OriginCityName_terms": {
          "terms": {
            "field": "OriginCityName",
            "size": 20
          },
          "aggs": {
            "FlgihtTimeMin_stats": {
              "stats": {
                "field": "FlightTimeMin"
              }
            }
          }
        },
        "OriginCityName_FlightTimeMin_max": {
          "max_bucket": {
            "buckets_path": "OriginCityName_terms>FlgihtTimeMin_stats.max"
          }
        }
      }
    }
  }
}

截取以出发地国家维度的第一个分桶中的管道聚合的结果。

"OriginCityName_FlightTimeMin_max" : {
  "value" : 1559.6236572265625,
  "keys" : [
    "Rome"
  ]
}

3、在 2 的基础上获取出发地国家中航班飞行最长的飞行时长以及对应的出发地国家名称。

GET kibana_sample_data_flights/_search
{
  "track_total_hits": true, 
  "size": 0,
  "aggs": {
    "OriginCountry_terms": {
      "terms": {
        "field": "OriginCountry",
        "size": 20
      },
      "aggs": {
        "OriginCityName_terms": {
          "terms": {
            "field": "OriginCityName",
            "size": 20
          },
          "aggs": {
            "FlgihtTimeMin_stats": {
              "stats": {
                "field": "FlightTimeMin"
              }
            }
          }
        },
        "OriginCityName_FlightTimeMin_max": {
          "max_bucket": {
            "buckets_path": "OriginCityName_terms>FlgihtTimeMin_stats.max"
          }
        }
      }
    },
    "OriginCountry_FlightTimeMin_max": {
      "max_bucket": {
        "buckets_path": "OriginCountry_terms>OriginCityName_FlightTimeMin_max"
      }
    }
  }
}

在 2 的基础上额外输出出发地国家维度的管道聚合的结果。

"OriginCountry_FlightTimeMin_max" : {
  "value" : 1902.9019775390625,
  "keys" : [
    "AR"
  ]
}

stats_bucket

使用兄弟级管道聚合的方式，从多个分桶中获取指定数值指标的统计聚合结果。

buckets_path：（必须）字段路径指向。
gap_policy：分桶数据出现空值或者缺失值的处理策略，默认 skip。gap_policy 详细说明
- skip：跳过空值或者缺失值，不参与聚合计算。
- insert_zeros：将空值或者缺失值当作 0 来参与聚合计算。
- keep_values：如果提供的指标值是一个空值或者缺失值则跳过，不参与聚合计算；否则使用该指标值参与聚合计算。
format：指定数值的输出格式，比如 #、#0.00。默认 null，
sigma：标准差的倍数，默认 2。用于确定一个数据点是否属于异常值。

1、统计出发地国家中每个出发地城市的航班飞行时间的平均时长，然后统计这些平均时长在出发地城市维度下的各项指标。

GET kibana_sample_data_flights/_search
{
  "size": 0,
  "track_total_hits": true,
  "aggs": {
    "OriginCountry_terms": {
      "terms": {
        "field": "OriginCountry",
        "size": 20
      },
      "aggs": {
        "OriginCityName_terms": {
          "terms": {
            "field": "OriginCityName",
            "size": 20
          },
          "aggs": {
            "FlightTimeMin_avg": {
              "avg": {
                "field": "FlightTimeMin"
              }
            }
          }
        },
        "pipeline_stats_bucket": {
          "stats_bucket": {
            "buckets_path": "OriginCityName_terms>FlightTimeMin_avg"
          }
        }
      }
    }
  }
}

截取部分的管道聚合结果。

"OriginCityName_FlightTimeMin_stats" : {
  "count" : 15,
  "min" : 226.4979310909907,
  "max" : 472.0975369329038,
  "avg" : 378.1233526619374,
  "sum" : 5671.850289929062
}

extended_stats_bucket

使用兄弟级管道聚合的方式，从多个分桶中获取指定数值指标的拓展统计聚合结果。

buckets_path：（必须）字段路径指向。
gap_policy：分桶数据出现空值或者缺失值的处理策略，默认 skip。gap_policy 详细说明
- skip：跳过空值或者缺失值，不参与聚合计算。
- insert_zeros：将空值或者缺失值当作 0 来参与聚合计算。
- keep_values：如果提供的指标值是一个空值或者缺失值则跳过，不参与聚合计算；否则使用该指标值参与聚合计算。
format：指定数值的输出格式，比如 #、#0.00。默认 null。

1、统计出发地国家中每个出发地城市的航班飞行时间的平均时长，然后统计这些平均时长在出发地城市维度下的各项指标。

GET kibana_sample_data_flights/_search
{
  "track_total_hits": true, 
  "size": 0,
  "aggs": {
    "OriginCountry_terms": {
      "terms": {
        "field": "OriginCountry",
        "size": 20
      },
      "aggs": {
        "OriginCityName_terms": {
          "terms": {
            "field": "OriginCityName",
            "size": 20
          },
          "aggs": {
            "FlgihtTimeMin_avg": {
              "avg": {
                "field": "FlightTimeMin"
              }
            }
          }
        },
        "OriginCityName_FlightTimeMin_extended_stats": {
          "extended_stats_bucket": {
            "buckets_path": "OriginCityName_terms>FlgihtTimeMin_avg"
          }
        }
      }
    }
  }
}

截取部分的管道聚合结果。

"OriginCityName_FlightTimeMin_extended_stats" : {
  "count" : 15,
  "min" : 226.4979310909907,
  "max" : 472.0975369329038,
  "avg" : 378.1233526619374,
  "sum" : 5671.850289929062,
  "sum_of_squares" : 2264926.8781446246,
  "variance" : 8017.855381337739,
  "variance_population" : 8017.855381337739,
  "variance_sampling" : 8590.559337147579,
  "std_deviation" : 89.54247808352045,
  "std_deviation_population" : 89.54247808352045,
  "std_deviation_sampling" : 92.68527033540755,
  "std_deviation_bounds" : {
    "upper" : 557.2083088289783,
    "lower" : 199.03839649489652,
    "upper_population" : 557.2083088289783,
    "lower_population" : 199.03839649489652,
    "upper_sampling" : 563.4938933327526,
    "lower_sampling" : 192.75281199112231
  }
}

cumulative_sum

[ˈkjuːmjəleɪtɪv]，累计的；累积的

从直方图聚合、日期直方图聚合中对相关数值指标使用父级管道聚合的方式进行累积聚合统计。

外层的直方图聚合、日期直方图聚合的 min_doc_count 必须设置为 0。

buckets_path：管道聚合函数的字段路径指向
format：指定数值的输出格式，比如 #、#0.00。默认 null

1、统计每个用户每天的消费总额，同时统计每个用户每天增长的累计消费金额。

GET kibana_sample_data_ecommerce/_search
{
  "size": 0,
  "track_total_hits": true,
  "aggs": {
    "order_date_histogram": {
      "date_histogram": {
        "field": "order_date",
        "calendar_interval": "day",
        "format": "yyyy-MM-dd"
      },
      "aggs": {
        "taxful_total_price_sum": {
          "sum": {
            "field": "taxful_total_price"
          }
        },
        "pipeline_cumulative_sum": {
          "cumulative_sum": {
            "buckets_path": "taxful_total_price_sum"
          }
        }
      }
    }
  }
}

截取部分的管道聚合结果。

"pipeline_cumulative_sum" : {
  "value" : 41455.5390625
}

cumulative_cardinality

[kɑːdɪ’nælɪtɪ]，基数

从直方图聚合、日期直方图聚合中对相关数值指标使用父级管道聚合的方式进行累积基数聚合统计。

外层的直方图聚合、日期直方图聚合的 min_doc_count 必须设置为 0。

buckets_path：（必须）字段路径指向。
format：指定数值的输出格式，比如 #、#0.00。默认 null。

1、统计每天下单的用户数以及累计的用户数。

GET kibana_sample_data_ecommerce/_search
{
  "size": 0,
  "track_total_hits": true,
  "aggs": {
    "order_date_histogram": {
      "date_histogram": {
        "field": "order_date",
        "calendar_interval": "day",
        "format": "yyyy-MM-dd"
      },
      "aggs": {
        "customer_id_cardinality": {
          "cardinality": {
            "field": "customer_id"
          }
        },
        "pipeline_cumulative_cardinality": {
          "cumulative_cardinality": {
            "buckets_path": "customer_id_cardinality"
          }
        }
      }
    }
  }
}

截取部分的管道聚合结果。

{
  "key_as_string" : "2022-07-16",
  "key" : 1657929600000,
  "doc_count" : 143,
  "customer_id_cardinality" : {
    "value" : 45
  },
  "pipeline_cumulative_cardinality" : {
    "value" : 46
  }
},
{
  "key_as_string" : "2022-07-17",
  "key" : 1658016000000,
  "doc_count" : 140,
  "customer_id_cardinality" : {
    "value" : 42
  },
  "pipeline_cumulative_cardinality" : {
    "value" : 46
  }
}

moving_avg

移动平均值聚合。在指定的数据序列中滑动一个窗口，通过父级管道聚合的方式计算出窗口内部的平均值。

buckets_path：（必须）字段路径指向。
window：滑动窗口的大小。默认 5。
gap_policy：分桶数据出现空值或者缺失值的处理策略，默认 skip。gap_policy 详细说明
- skip：跳过空值或者缺失值，不参与聚合计算。
- insert_zeros：将空值或者缺失值当作 0 来参与聚合计算。
- keep_values：如果提供的指标值是一个空值或者缺失值则跳过，不参与聚合计算；否则使用该指标值参与聚合计算。
model：指定移动平均值聚合的模型，默认 simple。每个模型对于窗口内部的值的加权方式不同。
- simple：简单模型。它会计算窗口内部的所有值的和，然后除以窗口大小。简单模型不执行随时间变化的加权，这意味着该模型下的移动平均值往往滞后于真实数据。
- linear：线性模型。它会对旧的数据点分配线性权重，以此来减少数据平均值的滞后性。
- ewma：单指数模型。它会对旧的数据点分配指数权重。权重衰减的速度可以通过 alpha 参数控制。默认 0.3。alpha 参数支持 0 到 1 之间的浮点数，值越小可以使权重缓慢衰减，提供了更好的平滑效果；值越大可以使权重快速衰减，减少了旧值对于移动平均值的影响，虽然平滑度较低，但是使移动平均值更紧密地跟踪数据。该模型可以最小化。
- holt：双指数模型。模型内部计算两个值：水平、趋势。基于数据的趋势，可以预测未来走向。alpha 参数对应水平衰减值，默认 0.3。beta 参数对应趋势衰减值，默认 0.1。alpha 参数、beta 参数都支持 0 到 1 之间的浮点数。该模型可以最小化。
- holt_winters：三指数模型。模型内部计算三个值：水平、趋势、季节性。基于数据的季节性变化，可以预测未来走向。alpha 参数对应水平衰减值，默认 0.3。beta 参数对应趋势衰减值，默认 0.1。gamma 参数对应季节衰减值，默认 0.3。alpha 参数、beta 参数、gamma 参数都支持 0 到 1 之间的浮点数。period 参数对应周期，默认 1。type 参数控制季节变化如何作用于数据，支持 add、mult。该模型可以最小化。
settings：指定模型的相关参数。
predict：指定预测的数量（会添加到序列的末尾）。每个移动平均值模型都支持预测模式，基于当前平滑的移动平均值推测未来数据。根据模型和参数的不同，预测结果的准确性也会有所不同。比如：predict: 10。
minimize：指定模型是否开启最小化。最小化是一个调整参数的过程，直到模型生成的预测与输出数据紧密匹配。对于 ewma、holt 模型，该参数默认 false，并且用处不大；对于 holt_winters 模型，该参数默认 true，有助于提高预测的准确性。比如：minimize: true。

对 simple 模型采用窗口大小为 3，进行举例说明。

分桶序号		分桶值			移动平均值
	1					10
	2					20				10
	3					30				(10 + 20) / 2
	4					40				(10 + 20 + 30) / 3
	5					50				(20 + 30 + 40) / 3

1、统计用户每天的消费金额，并且统计连续五天的平均消费金额。

GET kibana_sample_data_ecommerce/_search
{
  "size": 0,
  "track_total_hits": true,
  "aggs": {
    "order_date_histogram": {
      "date_histogram": {
        "field": "order_date",
        "calendar_interval": "day",
        "format": "yyyy-MM-dd"
      },
      "aggs": {
        "taxful_total_price_sum": {
          "sum": {
            "field": "taxful_total_price"
          }
        },
        "pipeline_moving_avg": {
          "moving_avg": {
            "buckets_path": "taxful_total_price_sum",
            "window": 5,
            "model": "simple"
          } 
        }
      }
    }
  }
}

截取部分的聚合结果。

{
  "key_as_string" : "2022-07-14",
  "key" : 1657756800000,
  "doc_count" : 146,
  "taxful_total_price_sum" : {
    "value" : 10578.53125
  }
},
{
  "key_as_string" : "2022-07-15",
  "key" : 1657843200000,
  "doc_count" : 153,
  "taxful_total_price_sum" : {
    "value" : 10448.0
  },
  "pipeline_moving_avg" : {
    "value" : 10578.53125
  }
},
{
  "key_as_string" : "2022-07-16",
  "key" : 1657929600000,
  "doc_count" : 143,
  "taxful_total_price_sum" : {
    "value" : 10283.484375
  },
  "pipeline_moving_avg" : {
    "value" : 10513.265625
  }
}

换成 ewma 模型看下效果。

GET kibana_sample_data_ecommerce/_search
{
  "size": 0,
  "track_total_hits": true,
  "aggs": {
    "order_date_histogram": {
      "date_histogram": {
        "field": "order_date",
        "calendar_interval": "day",
        "format": "yyyy-MM-dd"
      },
      "aggs": {
        "taxful_total_price_sum": {
          "sum": {
            "field": "taxful_total_price"
          }
        },
        "pipeline_moving_avg": {
          "moving_avg": {
            "buckets_path": "taxful_total_price_sum",
            "window": 5,
            "model": "ewma",
            "settings": {
              "alpha": 0.5
            }
          } 
        }
      }
    }
  }
}

moving_fn

移动函数聚合。在指定的数据序列中滑动一个窗口，通过父级管道聚合的方式以及使用自定义的脚本计算出窗口内部的值。移动函数聚合内置了一些常见的函数。

buckets_path：（必须）字段路径指向
window：（必须）滑动窗口的大小
script：（必须）对每个窗口中的数据执行的脚本
gap_policy：分桶数据出现空值或者缺失值的处理策略，默认 skip。gap_policy 详细说明
- skip：跳过空值或者缺失值，不参与聚合计算
- insert_zeros：将空值或者缺失值当作 0 来参与聚合计算
- keep_values：如果提供的指标值是一个空值或者缺失值则跳过，不参与聚合计算；否则使用该指标值参与聚合计算
shift：指定窗口的起始位置向右移动多少位。默认 0，即窗口内部的聚合计算不包括当前桶。该值每增加一，则窗口的起始位置向右移动一位。如果指定窗口内部的聚合计算包括当前桶，则可以将 shift 设置为 1

移动函数聚合内置了一些常见函数，如下：

MovingFunctions.max(values)：获取最大值（忽略 null、NaN 值，如果窗口为空或者窗口内部的值都是 null、NaN，则返回 NaN ）
MovingFunctions.min(values)：获取最小值（忽略 null、NaN 值，如果窗口为空或者窗口内部的值都是 null、NaN，则返回 NaN ）
MovingFunctions.sum(values)：获取总和（忽略 null、NaN 值，如果窗口为空或者窗口内部的值都是 null、NaN，则返回 0.0 ）
MovingFunctions.stdDev(values, 平均值)：获取标准差（忽略 null、NaN 值，如果窗口为空或者窗口内部的值都是 null、NaN，则返回 0.0 ）
MovingFunctions.unweightedAvg(values)：使用 simple 模型获取平均值。
MovingFunctions.linearWeightedAvg(values)：使用 linear 模型获取平均值。
MovingFunctions.ewma(values, alpha)：使用 ewma 模型获取平均值。
MovingFunctions.holt(values, alpha, beta)：使用 holt 模型获取平均值。
MovingFunctions.holtWinters(values, alpha, beta, gamma, period, multiplicative)：使用 holt_winters 模型获取平均值。multiplicative：布尔值，true 表示使用乘法计算；false 表示使用加法计算

1、统计每天的订单消费金额，并且统计连续五天的消费金额总和。

GET kibana_sample_data_ecommerce/_search
{
  "size": 0,
  "track_total_hits": true,
  "aggs": {
    "order_date_histogram": {
      "date_histogram": {
        "field": "order_date",
        "calendar_interval": "day",
        "format": "yyyy-MM-dd"
      },
      "aggs": {
        "taxful_total_price_sum": {
          "sum": {
            "field": "taxful_total_price"
          }
        },
        "pipeline-moving-fn": {
          "moving_fn": {
            "buckets_path": "taxful_total_price_sum",
            "window": 5,
            "script": "MovingFunctions.sum(values)",
            "shift": 1
          }
        }
      }
    }
  }
}

截取部分的聚合结果。

{
  "key_as_string" : "2022-07-14",
  "key" : 1657756800000,
  "doc_count" : 146,
  "taxful_total_price_sum" : {
    "value" : 10578.53125
  },
  "pipeline-moving-fn" : {
    "value" : 10578.53125
  }
},
{
  "key_as_string" : "2022-07-15",
  "key" : 1657843200000,
  "doc_count" : 153,
  "taxful_total_price_sum" : {
    "value" : 10448.0
  },
  "pipeline-moving-fn" : {
    "value" : 21026.53125
  }
}

bucket_script

分桶脚本聚合。基于父子管道聚合的方式，对多个分桶聚合的数值类型的指标使用脚本方式进行聚合统计。

buckets_path：（必须）管道聚合函数的字段路径指向
script：（必须）自定义脚本
gap_policy：分桶数据出现空值或者缺失值的处理策略，默认 skip。gap_policy 详细说明
- skip：跳过空值或者缺失值，不参与聚合计算
- insert_zeros：将空值或者缺失值当作 0 来参与聚合计算
- keep_values：如果提供的指标值是一个空值或者缺失值（null、NaN）则跳过，不参与聚合计算；否则使用该指标值参与聚合计算
format：指定数值的输出格式，比如 #、#0.00。默认 null

1、统计每天的订单消费总额以及商品的消费数量，然后统计每件商品的消费金额。

GET kibana_sample_data_ecommerce/_search
{
  "size": 0,
  "track_total_hits": true,
  "aggs": {
    "order_date_histogram": {
      "date_histogram": {
        "field": "order_date",
        "calendar_interval": "day",
        "format": "yyyy-MM-dd"
      },
      "aggs": {
        "taxful_total_price_stats": {
          "stats": {
            "field": "taxful_total_price"
          }
        },
        "total_quantity_stats": {
          "stats": {
            "field": "total_quantity"
          }
        },
        "pipeline-script": {
          "bucket_script": {
            "buckets_path": {
              "total_price": "taxful_total_price_stats.sum",
              "total_quantity": "total_quantity_stats.sum"
            },
            "script": """
              params.total_price/params.total_quantity;
            """
          }
        }
      }
    }
  }
}

截取部分的聚合结果。

{
  "key_as_string" : "2022-07-14",
  "key" : 1657756800000,
  "doc_count" : 146,
  "taxful_total_price_stats" : {
    "count" : 146,
    "min" : 18.984375,
    "max" : 230.0,
    "avg" : 72.45569349315069,
    "sum" : 10578.53125
  },
  "total_quantity_stats" : {
    "count" : 146,
    "min" : 2.0,
    "max" : 4.0,
    "avg" : 2.1780821917808217,
    "sum" : 318.0
  },
  "pipeline-script" : {
    "value" : 33.2658215408805
  }
}

bucket_selector

分桶过滤器聚合。基于父子管道聚合的方式，使用脚本过滤出符合条件的数值类型的分桶数据参与聚合统计。脚本需要返回布尔值。如果脚本语言是 expression，则脚本可以返回数值，0 被视为 false，其它值被视为 true。

buckets_path：（必须）管道聚合函数的字段路径指向
script：（必须）自定义脚本
gap_policy：分桶数据出现空值或者缺失值的处理策略，默认 skip。gap_policy 详细说明
- skip：跳过空值或者缺失值，不参与聚合计算
- insert_zeros：将空值或者缺失值当作 0 来参与聚合计算
- keep_values：如果提供的指标值是一个空值或者缺失值（null、NaN）则跳过，不参与聚合计算；否则使用该指标值参与聚合计算

1、统计每天的订单消费金额的相关指标，并筛选出总金额大于13000的日期。

GET kibana_sample_data_ecommerce/_search
{
  "size": 0,
  "track_total_hits": true,
  "aggs": {
    "order_date_histogram": {
      "date_histogram": {
        "field": "order_date",
        "calendar_interval": "day",
        "format": "yyyy-MM-dd"
      },
      "aggs": {
        "taxful_total_price_stats": {
          "stats": {
            "field": "taxful_total_price"
          }
        },
        "pipeline-bucket-selector": {
          "bucket_selector": {
            "buckets_path": {
              "sum": "taxful_total_price_stats.sum"
            },
            "script": """
              params.sum > 13000;
            """
          }
        }
      }
    }
  }
}

截取部分的聚合结果。

{
  "key_as_string" : "2022-07-22",
  "key" : 1658448000000,
  "doc_count" : 163,
  "taxful_total_price_stats" : {
    "count" : 163,
    "min" : 18.984375,
    "max" : 393.0,
    "avg" : 83.1910467791411,
    "sum" : 13560.140625
  }
},
{
  "key_as_string" : "2022-08-07",
  "key" : 1659830400000,
  "doc_count" : 165,
  "taxful_total_price_stats" : {
    "count" : 165,
    "min" : 18.984375,
    "max" : 225.0,
    "avg" : 79.36732954545455,
    "sum" : 13095.609375
  }
}

bucket_sort

分桶排序聚合。使用父子管道聚合的方式，对多个分桶进行排序。可以不指定字段或者指定多个字段用于排序。每个分桶可以根据 _key、_count 或者子聚合进行排序。

sort：指定用于排序的字段列表。
from：指定从第几个桶开始截断。默认 0。
size：指定返回多少个桶。默认返回所有桶。
gap_policy：分桶数据出现空值或者缺失值的处理策略，默认 skip。gap_policy 详细说明
- skip：跳过空值或者缺失值，不参与聚合计算
- insert_zeros：将空值或者缺失值当作 0 来参与聚合计算
- keep_values：如果提供的指标值是一个空值或者缺失值则跳过，不参与聚合计算；否则使用该指标值参与聚合计算

1、统计每天消费总额中最高的两天的消费金额的相关指标。

GET kibana_sample_data_ecommerce/_search
{
  "size": 0,
  "track_total_hits": true,
  "aggs": {
    "order_date_histogram": {
      "date_histogram": {
        "field": "order_date",
        "calendar_interval": "day",
        "format": "yyyy-MM-dd"
      },
      "aggs": {
        "taxful_total_price_stats": {
          "stats": {
            "field": "taxful_total_price"
          }
        },
        "pipeline-sort": {
          "bucket_sort": {
            "sort": [
              {
                "taxful_total_price_stats.sum": {
                  "order": "desc"
                }
              }  
            ],
            "size": 2
          }
        }
      }
    }
  }
}

截取部分的聚合结果。

"aggregations" : {
  "order_date_histogram" : {
    "buckets" : [
      {
        "key_as_string" : "2022-07-22",
        "key" : 1658448000000,
        "doc_count" : 163,
        "taxful_total_price_stats" : {
          "count" : 163,
          "min" : 18.984375,
          "max" : 393.0,
          "avg" : 83.1910467791411,
          "sum" : 13560.140625
        }
      },
      {
        "key_as_string" : "2022-08-07",
        "key" : 1659830400000,
        "doc_count" : 165,
        "taxful_total_price_stats" : {
          "count" : 165,
          "min" : 18.984375,
          "max" : 225.0,
          "avg" : 79.36732954545455,
          "sum" : 13095.609375
        }
      }
    ]
  }
}

2、统计前三天的消费金额的相关指标。

GET kibana_sample_data_ecommerce/_search
{
  "size": 0,
  "track_total_hits": true,
  "aggs": {
    "order_date_histogram": {
      "date_histogram": {
        "field": "order_date",
        "calendar_interval": "day",
        "format": "yyyy-MM-dd"
      },
      "aggs": {
        "taxful_total_price_stats": {
          "stats": {
            "field": "taxful_total_price"
          }
        },
        "pipeline-sort": {
          "bucket_sort": {
            "from": 0,
            "size": 3
          }
        }
      }
    }
  }
}

截取部分的聚合结果。

"aggregations" : {
  "order_date_histogram" : {
    "buckets" : [
      {
        "key_as_string" : "2022-07-14",
        "key" : 1657756800000,
        "doc_count" : 146,
        "taxful_total_price_stats" : {
          "count" : 146,
          "min" : 18.984375,
          "max" : 230.0,
          "avg" : 72.45569349315069,
          "sum" : 10578.53125
        }
      },
      {
        "key_as_string" : "2022-07-15",
        "key" : 1657843200000,
        "doc_count" : 153,
        "taxful_total_price_stats" : {
          "count" : 153,
          "min" : 22.984375,
          "max" : 220.0,
          "avg" : 68.2875816993464,
          "sum" : 10448.0
        }
      },
      {
        "key_as_string" : "2022-07-16",
        "key" : 1657929600000,
        "doc_count" : 143,
        "taxful_total_price_stats" : {
          "count" : 143,
          "min" : 18.984375,
          "max" : 250.0,
          "avg" : 71.91247814685315,
          "sum" : 10283.484375
        }
      }
    ]
  }
}

你可能感兴趣的:(elasticsearch,搜索引擎)

elasticsearch8.0+ 创建APIkey petunsecn devops 运维 elasticsearch
客户端连接ES,除了“用户名+密码”外，Elasticsearch也提供了APIkeys的访问方式。使用APIkey,也可方便的配置其不同的访问权限，用户，过期等。创建APIkey的方式：1.登录kibana,在Management--APIKey，点击【CrateAPIkey】具体参考：APIKeys|KibanaGuide[8.11]|Elastic2使用RESTAPIs创建POST/_sec
es java match_ElasticSearch查询第四篇：匹配查询（Match）哈哈哈哈哈哈哈哈鸽 es java match
《ElasticSearch查询》目录导航：匹配(Match)查询属于全文(Fulltext)查询，不同于词条查询，ElasticSearch引擎在处理全文搜索时，首先分析(analyze)查询字符串，然后根据分词构建查询，最终返回查询结果。匹配查询共有三种类型，分别是布尔(boolean)、短语(phrase)和短语前缀(phrase_prefix)，默认的匹配查询是布尔类型，这意味着，Elas
记录搭建一个私人搜索引擎
本人很喜欢搜索引擎技术，最近想搭建一个属于自己的私人搜索引擎，自动完成所有的出来流程，记录一下。把某个行业、某个领域，对应的网址放在一个txt文件内，接下来动动鼠标，点几下，从爬取到最后即时搜索，自动全部搞定，效果跟在百度搜索没什么两样。以下是具体的操作流程逻辑：第一步：创建一个索引任务，一键生成这个操作会自动创建对应的表，用来存放爬取的网页内容，不需要人工创建，省去一些过于细化的配置。第二步，开
CaigouSearch 基于ngram分词的轻量PHP全文检索插件 php全文检索模糊搜索
简单易用最关键，菜狗搜索：https://github.com/rock365/caigou这是一个基于ngram分词的PHP模糊搜索插件，且完全免费，对博客等中小型网站来说，绰绰有余，因为它是用PHP开发的，所以能跟PHP项目完美融合。如果你对elasticsearch的语法比较了解，那么你很快就会上手，不了解也没关系，照着文档复制填写就行了，没有任何难度。注意：id字段必须为整型递增安装导入在
Elasticsearch 实战应用周盛欢搜索引擎 elasticsearch jenkins
一、啥是Elasticsearch嘿，小伙伴们，今天给大家唠唠Elasticsearch。简单来说，它就是一个超厉害的搜索引擎，就像我们平时用的百度、谷歌一样，但它是专门给开发者用的，能帮你在海量数据里快速找到想要的东西。二、为啥要用Elasticsearch想象一下，你有个电商网站，商品信息多得跟天上的星星似的。要是没有Elasticsearch，用户想搜个商品，得等半天才能出结果，那多糟心啊。
SpringBoot 使用ElasticsearchRestTemplate hbzslb spring boot java mybatis
1.pom.xml添加org.springframework.bootspring-boot-starter-data-elasticsearch2.6.22.配置文件配置地址spring:data:elasticsearch:cluster-name:elasticsearchcluster-nodes:localhost:92003.开始使用3.0.创建实体类@Data@AllArgsCons
一步到位：购买适合 SEO 的域名全攻略后端
选择一个对SEO友好的域名不仅可以提高搜索引擎排名，还能增强品牌影响力。以下是简化优化后的购买流程：1.检查域名历史，确保无负面记录在购买域名前，务必确认它没有被封锁或拉黑，并且历史记录与您的行业相关：检查域名安全性和历史VirusTotal：查看域名是否被列为不安全。WebArchive：查看域名以前的用途，判断是否有不良记录或与您的行业冲突。GoogleTransparencyReport：检
http和https有哪些不同星沁城学习小记 http https 网络协议网络
http和https有哪些不同1.数据传输的安全性：http非加密，https加密2.端口号：http默认80端口，https默认443端口3.性能：http基于tcp三次握手建立连接，https在tcp三次握手后还有TLS协议的四次握手确认加密，所以http建立连接更快。4.SEO影响：搜索引擎更偏向于https的网站。SEO（SearchEngineOptimization，搜索引擎优化）是一
2025年极速申请永久免费通配符SSL证书
SSL证书不仅可以加密网站数据传输，保护用户隐私，还能提升网站的可信度和搜索引擎排名。通配符SSL证书又叫泛域名SSL证书，它可以保护一个主域名以及下级所有的子域名，是非常实用的。下面是免费申请流程：官网链接：https://www.joyssl.com/certificate/select/free.html?nid=19一、注册账号打开浏览器，访问JoySSL的官方网站。点击页面右上角的“注册
全站HTTPS轻松搞定！免费SSL助您快速部署！ sslhttps
为什么选择全站HTTPS？提升安全性HTTPS通过加密技术，保护用户的敏感信息（如登录密码、支付数据）免受窃取和篡改。提升搜索引擎排名搜索引擎，如Google，将HTTPS作为排名的重要因素，使用HTTPS可以帮助您的网站在搜索结果中获得更好的位置。消除“不安全”警告现代浏览器会在未启用HTTPS的网站上显示“不安全”的警告，全站HTTPS能提升用户信任感。↓免费SSL证书：https://www
ElasticSearch(3) - 慢查询优化思路川涂搜索 elasticsearch 数据库 mysql
ES的慢查询可能会导致性能瓶颈，影响系统的响应时间和用户体验。要优化ES查询性能，可以从查询语句和表结构两个方面入。从查询语句优化角度，可以优化查询类型、合理使用fliter、限制字段返回等都是有效的方法。从表结构优化角度，选择合适的字段类型、合理设置索引、优化分片和副本设置等也是提高性能的关键。1.查询语句优化1.1使用合适的查询类型精确匹配（TermQuery）：对于精确值匹配，使用term查
优化Elasticsearch搜索性能：查询调优与索引设计一勺菠萝丶 Java #ELK #SpringBoot elasticsearch 大数据搜索引擎
在构建基于Elasticsearch的搜索解决方案时，性能优化是关键。本文将深入探讨如何通过查询调优和索引设计来优化Elasticsearch的搜索性能，从而提高用户体验和系统效率。查询调优优化查询是提高Elasticsearch性能的重要方法。以下是一些有效的查询调优策略，并附上具体例子以便理解：使用合适的查询类型：选择最合适的查询类型可以提高查询效率。例如，对于精确匹配，使用termquery
es查询大文本效率_Elasticsearch 技术分析（七）： Elasticsearch 的性能优化 weixin_39672296 es查询大文本效率
javajava8java开发Elasticsearch技术分析(七)：Elasticsearch的性能优化硬件选择Elasticsearch(后文简称ES)的基础是Lucene，所有的索引和文档数据是存储在本地的磁盘中，具体的路径可在ES的配置文件../config/elasticsearch.yml中配置，如下：#-----------------------------------Paths
好用的算法推荐工具全解析 CodeJourney. 算法
一、引言在当今数字化时代，算法广泛应用于各个领域，从搜索引擎优化到金融风险预测，从图像识别到自然语言处理。对于算法学习者、研究者以及开发者而言，合适的算法推荐工具至关重要。它们不仅能帮助理解算法原理，还能在实际应用中提供高效的解决方案。接下来，我们将详细介绍多种好用的算法推荐工具。二、算法可视化工具（一）VisuAlgo功能特点-动态演示：VisuAlgo能够以动态的方式展示各类算法的执行过程。例
Elasticsearch中父子文档的关联：利用Join类型赋予文档的层级关系码到三十五 elasticsearch高手 elasticsearch java
码到三十五：个人主页心中有诗画，指尖舞代码，目光览世界，步履越千山，人间尽值得!Elasticsearch是一个强大的搜索引擎，它提供了丰富的功能来满足复杂的搜索需求。其中，父子索引类型的join功能是一个强大的工具，它允许我们在同一索引中创建具有层级关系的文档。在这篇博客中，我们将深入探讨Elasticsearch中的父子索引类型join，包括其工作原理、如何使用以及需要注意的事项。目录前言1.
详细描述一下Elasticsearch索引文档的过程？ java1234_小锋 java elasticsearch 大数据搜索引擎
大家好，我是锋哥。今天分享关于【详细描述一下Elasticsearch索引文档的过程？】面试题。希望对大家有帮助；详细描述一下Elasticsearch索引文档的过程？1000道互联网大厂Java工程师精选面试题-Java资源分享网Elasticsearch是一个开源的分布式搜索和分析引擎，广泛用于处理大规模数据。其核心功能之一就是索引文档，它通过特定的流程将数据存储在索引中，并使数据可被高效搜索
电商项目-基于ElasticSearch实现商品搜索功能(三) kong7906928 项目功能 Java框架 elasticsearch 电商项目商品搜索
本系列文章主要介绍基于SpringDataElasticsearch实现商品搜索的后端代码，介绍代码逻辑和代码实现。主要实现功能：根据搜索关键字查询、条件筛选、规格过滤、价格区间搜索、搜索查询分页、搜索查询排序、高亮查询。主要应用技术:canal，Eureka，微服务架构（MicroservicesArchitecture），SpringDataElasticsearch一、搜索分页1分页分析基于
https证书获取的方法及好处
获取HTTPS证书的多种方法及其优势✨在现代互联网环境中，HTTPS已成为保障网站安全的基本标准。获取HTTPS证书不仅能提升网站的安全性，还能增强用户信任度和提升搜索引擎排名。本文将详细介绍获取HTTPS证书的几种常见方法及其各自的优势，并通过图表和流程图帮助理解其工作原理。获取HTTPS证书的方法️1.购买商业证书购买商业证书是获取HTTPS证书的传统方式，适用于需要高信任度和额外保障的企业和
Elasticsearch搭建框架以及测试小郭爱编程
elasticsearch学习介绍Elasticsearch简介Elasticsearch是一个建立在全文搜索引擎ApacheLucene™基础上的搜索引擎，可以说Lucene是当今最先进，最高效的全功能开源搜索引擎框架。用通俗的话理解就是：将不同服务器需要的数据，弄成一个文档，放到es中去，当我们去搜索的时候，就是去搜索文档。es是一个非关系型数据库，和redis一样，redis是一个键值对的数
微服务实战——ElasticSearch（搜索）松弛进取微服务实战 java 后端微服务 springcloud 分布式
商品检索——ElasticSearch（搜索）1.检索条件&排序条件分析全文检索：skuTitle->keyword排序：saleCount（销量）、hotScore（热度分）、skuPrice（价格）过滤：hasStock、skuPrice区间、brandId、catalog3Id、attrs聚合：attrs完整查询参数keyword=小米&sort=saleCount_desc/asc&has
设计一个缓存策略，动态缓存热点数据「已注销」智力题&场景题缓存数据库 java 排行榜
写在前面，因为我们最近的大作业项目需要用到热点排行这个功能，因为我们是要使用Elasticsearch来存储数据，然后最初设想是在ES中实现这个热点排行的功能，但是经过仔细思考，在我们这个项目中使用ES来做热点排行是一个很蠢的方式，因为我们这只是一个很小的排行，所以最终我们还是使用Redis来实现热点排行使用LRU？LRU是一种常见的算法，假如我们设定TOP10的热点数据，那么我们可以规定LRU容
学英语学Elasticsearch：04 Elastic integrations 工具箱实现对第三方数据源的采集、存储、可视化，开箱即用学会了没 elasticsearch 大数据搜索引擎 Elastic Agent Logstash 与第三方集成
：先看关键单词，再看英文，最后看中文总结，再回头看一遍英文原文，效果更佳！！关键词ingestion摄取/ɪnˈdʒɛstʃən/observability可观察性/ˌɑːbzərvəˈbɪlɪti/scalability可扩展性/ˌskeɪləˈbɪlɪti/deployment部署/dɪˈplɔɪmənt/functionality功能/ˌfʌŋkʃəˈnæləti/pre-packaged预
MYSQL数据库表的设计 qq_45849275 java
一、https://blog.csdn.net/jasonhui512/article/details/53134054页面原型需求分析表结构的设计数据库设计案例elasticSearchpostgresqlmongodbRedisneo4jfastDFSmemcachemavengitsvnluencemybatismybatisplusspringspringMVCspringbootspri
2024年大数据最全【ES专题】ElasticSearch集群架构剖析_es集群 kenzsoft 程序员大数据 elasticsearch 架构
IngestNode：数据前置处理转换节点，支持pipeline管道设置，可以使用ingest对数据进行过滤、转换等操作MachineLearningNode：负责跑机器学习的Job，用来做异常检测TribeNode：TribeNode连接到不同的Elasticsearch集群，并且支持将这些集群当成一个单独的集群处理以下是一个多集群业务架构图：1.2.1.1MasterNode主节点的功能Mas
http和https的区别在哪 httpshttp
HTTP（超文本传输协议）和HTTPS（超文本传输安全协议）之间存在几个关键区别主要涉及安全性、端口、成本、加密方式、搜索引擎优化（SEO）、身份验证等方面1、安全性：HTTP（超文本传输协议）是互联网上应用最为广泛的一种网络协议，它用于从万维网（WWW:WorldWideWeb）服务器传输超文本到本地浏览器。然而，HTTP协议在数据传输过程中是明文传输，这意味着数据在传输过程中可能会被截获或篡改
Linux离线部署ELK 行者僧 linux elk jenkins
文章目录前期准备开始安装安装elasticsearch安装logstash安装kibana配置ELK配置ElasticSearch配置logstash配置kibana启动ELK启动命令启动测试设置ELK策略创建ILM策略将ILM策略与日志index关联查看索引是否被ILM策略管理前期准备ELK包含三部分软件ElasticSearch用作搜索引擎Logstash用作日志收集，也可以是其他的日志搜集器
【1】Elasticsearch 30分钟快速入门不知名美食探索家 ES快速学习 es elasticsearch
文章目录一、Elasticsearch基本概念及工作原理（一）基本概念（二）工作原理二、Elasticsearch原生RESTful方式的增删改查（一）创建索引（二）插入文档（三）查询文档（四）更新文档（五）删除文档（六）删除索引三、PythonSDK实现增删改查（一）安装ElasticsearchPythonSDK（二）连接到Elasticsearch（三）插入文档（四）查询文档（五）更新文档（
【Elasticsearch】节点与集群：架构原理与优化实践程风破～ Elasticsearch Elasticsearch实战 elasticsearch 架构大数据
博主简介：CSDN博客专家，历代文学网（PC端可以访问：https://literature.sinhy.com/#/?__c=1000，移动端可微信小程序搜索“历代文学”）总架构师，15年工作经验，精通Java编程，高并发设计，Springboot和微服务，熟悉Linux，ESXI虚拟化以及云原生Docker和K8s，热衷于探索科技的边界，并将理论知识转化为实际应用。保持对新技术的好奇心，乐于分
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
Java：爬虫框架 dingcho Java java 爬虫
一、ApacheNutch2【参考地址】Nutch是一个开源Java实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。Nutch致力于让每个人能很容易,同时花费很少就可以配置世界一流的Web搜索引擎.为了完成这一宏伟的目标,Nutch必须能够做到:每个月取几十亿网页为这些网页维护一个索引对索引文件进行每秒上千次的搜索提供高质量的搜索结果简单来说Nutch支持分
设计模式介绍 tntxia 设计模式
设计模式来源于土木工程师克里斯托弗亚历山大（http://en.wikipedia.org/wiki/Christopher_Alexander）的早期作品。他经常发表一些作品，内容是总结他在解决设计问题方面的经验，以及这些知识与城市和建筑模式之间有何关联。有一天，亚历山大突然发现，重复使用这些模式可以让某些设计构造取得我们期望的最佳效果。亚历山大与萨拉-石川佳纯和穆雷西乐弗斯坦合作
android高级组件使用(一) 百合不是茶 android RatingBar Spinner
1、自动完成文本框（AutoCompleteTextView） AutoCompleteTextView从EditText派生出来，实际上也是一个文本编辑框，但它比普通编辑框多一个功能：当用户输入一个字符后，自动完成文本框会显示一个下拉菜单，供用户从中选择，当用户选择某个菜单项之后，AutoCompleteTextView按用户选择自动填写该文本框。使用AutoCompleteTex
[网络与通讯]路由器市场大有潜力可挖掘 comsci 网络
如果国内的电子厂商和计算机设备厂商觉得手机市场已经有点饱和了,那么可以考虑一下交换机和路由器市场的进入问题..... 这方面的技术和知识,目前处在一个开放型的状态,有利于各类小型电子企业进入 &nbs
自写简单Redis内存统计shell 商人shang Linux shell 统计Redis内存
#!/bin/bash address="192.168.150.128:6666,192.168.150.128:6666" hosts=(${address//,/ }) sfile="staticts.log" for hostitem in ${hosts[@]} do ipport=(${hostitem
单例模式(饿汉 vs懒汉) oloz 单例模式
package 单例模式; /* * 应用场景:保证在整个应用之中某个对象的实例只有一个 * 单例模式种的《懒汉模式》 * */ public class Singleton { //01 将构造方法私有化，外界就无法用new Singleton()的方式获得实例 private Singleton(){}; //02 申明类得唯一实例 priva
springMvc json支持杨白白 json springmvc
1.Spring mvc处理json需要使用jackson的类库，因此需要先引入jackson包 2在spring mvc中解析输入为json格式的数据:使用@RequestBody来设置输入 @RequestMapping("helloJson") public @ResponseBody JsonTest helloJson() {
android播放，掃描添加本地音頻文件小桔子
最近幾乎沒有什麽事情，繼續鼓搗我的小東西。想在項目中加入一個簡易的音樂播放器功能，就像華為p6桌面上那麼大小的音樂播放器。用過天天動聽或者QQ音樂播放器的人都知道，可已通過本地掃描添加歌曲。不知道他們是怎麼實現的，我覺得應該掃描設備上的所有文件，過濾出音頻文件，每個文件實例化為一個實體，記錄文件名、路徑、歌手、類型、大小等信息。具體算法思想，
oracle常用命令 aichenglong oracle dba 常用命令
1 创建临时表空间 create temporary tablespace user_temp tempfile 'D:\oracle\oradata\Oracle9i\user_temp.dbf' size 50m autoextend on next 50m maxsize 20480m extent management local
25个Eclipse插件 AILIKES eclipse插件
提高代码质量的插件1. FindBugsFindBugs可以帮你找到Java代码中的bug，它使用Lesser GNU Public License的自由软件许可。2. CheckstyleCheckstyle插件可以集成到Eclipse IDE中去，能确保Java代码遵循标准代码样式。3. ECLemmaECLemma是一款拥有Eclipse Public License许可的免费工具，它提供了
Spring MVC拦截器+注解方式实现防止表单重复提交 baalwolf spring mvc
原理：在新建页面中Session保存token随机码，当保存时验证，通过后删除，当再次点击保存时由于服务器端的Session中已经不存在了，所有无法验证通过。 1.新建注解： ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
《Javascript高级程序设计(第3版)》闭包理解 bijian1013 JavaScript
“闭包是指有权访问另一个函数作用域中的变量的函数。”--《Javascript高级程序设计(第3版)》看以下代码： <script type="text/javascript"> function outer() { var i = 10; return f
AngularJS Module类的方法 bijian1013 JavaScript AngularJS Module
AngularJS中的Module类负责定义应用如何启动，它还可以通过声明的方式定义应用中的各个片段。我们来看看它是如何实现这些功能的。一.Main方法在哪里如果你是从Java或者Python编程语言转过来的，那么你可能很想知道AngularJS里面的main方法在哪里？这个把所
[Maven学习笔记七]Maven插件和目标 bit1129 maven插件
插件(plugin)和目标(goal) Maven，就其本质而言，是一个插件执行框架，Maven的每个目标的执行逻辑都是由插件来完成的，一个插件可以有1个或者几个目标，比如maven-compiler-plugin插件包含compile和testCompile，即maven-compiler-plugin提供了源代码编译和测试源代码编译的两个目标使用插件和目标使得我们可以干预
【Hadoop八】Yarn的资源调度策略 bit1129 hadoop
1. Hadoop的三种调度策略 Hadoop提供了3中作业调用的策略， FIFO Scheduler Fair Scheduler Capacity Scheduler 以上三种调度算法，在Hadoop MR1中就引入了，在Yarn中对它们进行了改进和完善.Fair和Capacity Scheduler用于多用户共享的资源调度 2. 多用户资源共享的调度
Nginx使用Linux内存加速静态文件访问 ronin47
Nginx是一个非常出色的静态资源web服务器。如果你嫌它还不够快，可以把放在磁盘中的文件，映射到内存中，减少高并发下的磁盘IO。先做几个假设。nginx.conf中所配置站点的路径是/home/wwwroot/res，站点所对应文件原始存储路径：/opt/web/res shell脚本非常简单，思路就是拷贝资源文件到内存中，然后在把网站的静态文件链接指向到内存中即可。具体如下：
关于Unity3D中的Shader的知识 brotherlamp unity unity资料 unity教程 unity视频 unity自学
首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，然后我们来看下Unity3D自带的60多个S
CopyOnWriteArrayList vs ArrayList bylijinnan java
package com.ljn.base; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.concurrent.CopyOnWriteArrayList; /** * 总述： * 1.ArrayListi不是线程安全的，CopyO
内存中栈和堆的区别 chicony 内存
1、内存分配方面：堆：一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回收。注意它与数据结构中的堆是两回事，分配方式是类似于链表。可能用到的关键字如下：new、malloc、delete、free等等。栈：由编译器(Compiler)自动分配释放，存放函数的参数值，局部变量的值等。其操作方式类似于数据结构中
回答一位网友对Scala的提问 chenchao051 scala map
本来准备在私信里直接回复了，但是发现不太方便，就简要回答在这里。问题写道对于scala的简洁十分佩服，但又觉得比较晦涩，例如一例，Map("a" -> List(11,111)).flatMap(_._2)，可否说下最后那个函数做了什么，真正在开发的时候也会如此简洁？谢谢先回答一点，在实际使用中，Scala毫无疑问就是这么简单。
mysql 取每组前几条记录 daizj mysql 分组最大值最小值每组三条记录
一、对分组的记录取前N条记录：例如：取每组的前3条最大的记录 1.用子查询： SELECT * FROM tableName a WHERE 3> (SELECT COUNT(*) FROM tableName b WHERE b.id=a.id AND b.cnt>a. cnt) ORDER BY a.id,a.account DE
HTTP深入浅出 http请求 dcj3sjt126com http
HTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP，使HTTP客户（如Web浏览器）能够从HTTP服务器(Web服务器)请求信息和服务，HTTP目前协议的版本是1.1.HTTP是一种无状态的协议，无状态是指Web浏览器和Web服务器之间不需要建立持久的连接，这意味着当一个客户端向服务器端发出请求，然后We
判断MySQL记录是否存在方法比较 dcj3sjt126com mysql
把数据写入到数据库的时，常常会碰到先要检测要插入的记录是否存在，然后决定是否要写入。　　我这里总结了判断记录是否存在的常用方法：　　sql语句： select count ( * ) from tablename; 　　然后读取count(*)的值判断记录是否存在。对于这种方法性能上有些浪费，我们只是想判断记录记录是否存在，没有必要全部都查出来。
对HTML XML的一点认识 e200702084 html xml
感谢http://www.w3school.com.cn提供的资料 HTML 文档中的每个成分都是一个节点。节点根据 DOM，HTML 文档中的每个成分都是一个节点。 DOM 是这样规定的：整个文档是一个文档节点每个 HTML 标签是一个元素节点包含在 HTML 元素中的文本是文本节点每一个 HTML 属性是一个属性节点注释属于注释节点 Node 层次
jquery分页插件 genaiwei jquery Web 前端分页插件
//jquery页码控件// 创建一个闭包 (function($) { // 插件的定义 $.fn.pageTool = function(options) { var totalPa
Mybatis与Ibatis对照入门于学习 Josh_Persistence mybatis ibatis 区别联系
一、为什么使用IBatis/Mybatis 对于从事 Java EE 的开发人员来说，iBatis 是一个再熟悉不过的持久层框架了，在 Hibernate、JPA 这样的一站式对象 / 关系映射（O/R Mapping）解决方案盛行之前，iBaits 基本是持久层框架的不二选择。即使在持久层框架层出不穷的今天，iBatis 凭借着易学易用、
C中怎样合理决定使用那种整数类型？秋风扫落叶 c 数据类型
如果需要大数值(大于32767或小于32767), 使用long 型。否则, 如果空间很重要 (如有大数组或很多结构), 使用 short 型。除此之外, 就使用 int 型。如果严格定义的溢出特征很重要而负值无关紧要, 或者你希望在操作二进制位和字节时避免符号扩展的问题, 请使用对应的无符号类型。但是, 要注意在表达式中混用有符号和无符号值的情况。 &nbs
maven问题 zhb8015 maven问题
问题1： Eclipse 中新建maven项目无法添加src/main/java 问题 eclipse创建maevn web项目，在选择maven_archetype_web原型后，默认只有src/main/resources这个Source Floder。按照maven目录结构，添加src/main/ja
(二)androidpn-server tomcat版源码解析之--push消息处理 spjich java androdipn 推送
在 (一)androidpn-server tomcat版源码解析之--项目启动这篇中，已经描述了整个推送服务器的启动过程，并且把握到了消息的入口即XmppIoHandler这个类，今天我将继续往下分析下面的核心代码，主要分为3大块，链接创建，消息的发送，链接关闭。先贴一段XmppIoHandler的部分代码 /** * Invoked from an I/O proc
用js中的formData类型解决ajax提交表单时文件不能被serialize方法序列化的问题中华好儿孙 JavaScript Ajax Web 上传文件 FormData
var formData = new FormData($("#inputFileForm")[0]); $.ajax({ type:'post', url:webRoot+"/electronicContractUrl/webapp/uploadfile", data:formData, async: false, ca
mybatis常用jdbcType数据类型 ysj5125094 mybatis mapper jdbcType
MyBatis 通过包含的jdbcType 类型 BIT FLOAT CHAR