hive临时表中 取 分组排序后所有排列第一的元素集合

以下sql的作用为:从订单表中,获取每个人201606月份最偏好的出行时刻。

select b.* from
(
select *, row_number() over (partition by passenger_phone order by hour_num desc) as od from
(
select passenger_phone , substr(create_time,12,2) as chuxing_hour, count(*) as hour_num from taxi.order where concat(year,month) =’201606’ and is_succ_order=1 and starting_lat>0 and dest_lat>0 group by passenger_phone , substr(create_time,12,2)
)t
) b
where b.od=1 ;

第一步:先分组聚合,形成一个临时表t

第二步:再对临时表 t 进行分区,按聚合字段 hour_num 降序排序,每一条记录加上行号, 形成临时表 b

第三步:取出 表 b 中所有行号 为 1 的记录,即是。

你可能感兴趣的:(KV&分布式存储数据库,hive,sql)