hive中dense_rank&row_number&rank函数

hive中三个排序函数rank、row_number、dense_rank日常中比较常用到,今天来说说三者的区别:

1、rank()函数

此排序方法进行排序时,相同的排序是一样的,而且下一个不同值是跳着排序的。

2、row_number()函数

此方法不管排名是否有相同的,都按照顺序1,2,3…..n 

3、dense_rank()函数

此方法对于排名相同的名次一样,且后面名次不跳跃

案例:

数据结构如下:

hive中dense_rank&row_number&rank函数_第1张图片

代码实例:

--三种函数进行对比
--rank:
select id
      ,name
      ,score
      ,rank() over(order by score) as rank
from dw_zdb.tmp_temp_inland_train
--row_number
select id
      ,name
      ,score
      ,row_number() over(order by score) as dense_number
from dw_zdb.tmp_temp_inland_train
--dense_number
select id
      ,name
      ,score
      ,dense_number() over(order by score) as dense_number
from dw_zdb.tmp_temp_inland_train

结果如下:

hive中dense_rank&row_number&rank函数_第2张图片

 

 

 

 

你可能感兴趣的:(hive)