hive中三个排序函数rank、row_number、dense_rank区别

hive中三个排序函数rank、row_number、dense_rank日常中比较常用到,今天来说说三者的区别:

1、rank()函数

此排序方法进行排序时,相同的排序是一样的,而且下一个不同值是跳着排序的。
1、1、3、3、3、6.、7…

2、row_number()函数

此方法不管排名是否有相同的,都按照顺序1,2,3……n

3、dense_rank()函数

此方法对于排名相同的名次一样,且后面名次不跳跃, 1、2、2、2、3、3、4…

hive中三个排序函数rank、row_number、dense_rank区别_第1张图片

--三种函数进行对比
--rank:
select id
      ,name
      ,score
      ,rank() over(order by score) as rank
from dw_zdb.tmp_temp_inland_train
--row_number
select id
      ,name
      ,score
      ,row_number() over(order by score) as dense_number
from dw_zdb.tmp_temp_inland_train
--dense_number
select id
      ,name
      ,score
      ,dense_rank() over(order by score) as dense_number
from dw_zdb.tmp_temp_inland_train

结果如下:
hive中三个排序函数rank、row_number、dense_rank区别_第2张图片

你可能感兴趣的:(hive,hive,hadoop,数据仓库)