hive sql常用开窗函数

开窗函数:定义一个行为列,在查询结果上直接新增一列窗口函数值,开窗函数的特征是带有over()。开窗函数从使用目的上可以分为两类:排序开窗函数和聚合开窗函数。
常用排序开窗函数:

row_number() over(partition by ……order by ……),当不加partition by ……order by ……时直接按记录顺序生成从1开始的自然数序列;
rank() over(partition by ……order by ……),排序对于出现相同值会生成相同序号,下一个序号会根据相同值个数发生间断,如序号3出现两次,下一个序号则为5;
dense_rank() over(partition by ……order by ……),排序对于出现相同值会生成相同序号,下一个序号不会发生间断,如序号3出现两次,下一个序号则为4;
ntile(n) over(partition by ……order by ……)。
常用聚合开窗函数:
1.count() over(partition by ……order by ……);
2.max() over(partition by ……order by ……);
3. min() over(partition by ……order by ……);
4.sum() over(partition by ……order by ……);
5.avg() over(partition by ……order by ……);
6.first_value() over(partition by ……order by ……);
7.last_value() over(partition by ……order by ……);
8.lag(exp_str,offset,default) over(partition by ……order by ……),可以取每一个分区开始的前一条记录;
9.lead(exp_str,offset,default) over(partition by ……order by ……),可以取每一个分区结束的后一条记录。
 

你可能感兴趣的:(hive,窗口函数,sql,hive)