Hive窗口函数

窗口函数

定义

Hive窗口函数_第1张图片

语法

Function (arg1,…, argn) OVER ([PARTITION BY <…>] [ORDER BY <…>]
[])
参数说明:
function:

  • Aggregate Functions: 聚合函数,比如:sum(…)、 max(…)、min(…)、avg(…)等.

  • Sort Functions: 数据排序函数, 比如 :rank(…)、row_number(…)等.

  • Analytics Functions: 统计和比较函数, 比如:lead(…)、lag(…)、
    first_value(…)等.
    OVER ([PARTITION BY <…>] [ORDER BY <…>]
    PARTITION BY 表示将数据先按 字段 进行分区
    ORDER BY 表示将各个分区内的数据按 排序字段 进行排序
    window_expression 用于确定窗边界

如果不指定 PARTITION BY,则不对数据进行分区,换句话说,所有数据看作同一个分区;
如果不指定 ORDER BY,则不对各分区做排序,通常用于那些顺序无关的窗口函数,例如 SUM()

你可能感兴趣的:(hive,hive,hadoop,数据仓库)