Hive 函数使用(一)(datediff,row_number,partition)

datediff: 返回天数的差值

    示例:datediff(a,b) 返回b-a的天数


row_number():对排序内容添加编号,多与over(partition by)等函数联用


over (partition by a):进行分组,常与聚合函数sum()、count()、avg()等结合使用,实现聚合分组

    示例:  function over (paritition by a) 

                sum(b) over (paritition by a)  返回根据a进行分组的b的叠加值,如a为日期,b为登录记录,则返回每日的登录次数。

    备注:使用的时候会有重复的现象,暂不知该如何处理11


group by:也是分组函数的一种,与partition的区别在于,group by 仅能显示与分组有联系的字段

示例: group by a  ,以a字段为基准进行分组

你可能感兴趣的:(Hive)