总结四个函数的特点:
row_number():连续不重复;1234567
rank() :重复不连续;1222567
dense_rank():重复且连续;1222345
ntile():平均分组;1122334
SQL Server中的排序函数有四个:row_number(),rank(),dense_rank()及ntile()函数;
特点: row_number()函数可以为每条记录添加递增的顺序数值序号,即使值完全相同也依次递增序号,不会重复。
语法:
ROW_NUMBER() OVER (
[PARTITION BY partition_expression, ... ]
ORDER BY sort_expression [ASC | DESC], ...
)
PARTITION BY
子句将结果集划分为分区。 ROW_NUMBER()函数分别应用于每个分区,并重新初始化每个分区的行号。PARTITION BY
子句是可选的。如果未指定,ROW_NUMBER()函数会将整个结果集视为单个分区。
ORDER BY
子句定义结果集的每个分区中的行的逻辑顺序。 ORDER BY
子句是必需的,因为ROW_NUMBER()函数对顺序敏感。
特点: rank()函数也是返回每条记录的排名序号,但当值相同时,序号也将相同,同时跳跃排序(比如两个第一名后面是第三名)。
语法:
RANK() OVER (
[PARTITION BY partition_expression, ... ]
ORDER BY sort_expression [ASC | DESC], ...
)
PARTITION BY
子句划分应用该函数的结果集分区的行。
ORDER BY
子句指定应用该函数每个分区中行的逻辑排序顺序。
特点: dense_rank()函数进行排序时,也会将值相同的数据赋予同一个序号,但与rank()函数不同的是,dense_rank()函数为连续排序(比如两个第一名后面是第二名)。
语法:
DENSE_RANK() OVER (
[PARTITION BY partition_expression, ... ]
ORDER BY sort_expression [ASC | DESC], ...
)
dense_rank()函数以ORDER BY
子句定义的指定顺序应用于PARTITION BY
子句定义的每个分区的行。它会在划分分区边界时重置等级。
PARITION BY
子句是可选的。如果省略它,该函数会将整个结果集视为单个分区。
特点: ntile(n)函数会将数据分为n组,自动进行分组 (每组数量大致相等,若无法均分为n组,则每组的记录数不能大于它上一组的记录数),每组将会分配同一个序号(组号为1-n)。
语法:
NTILE(integer_expression) OVER (
[PARTITION BY partition_expression, ... ]
ORDER BY sort_expression [ASC | DESC], ...
)
integer_expression
为数据行划分的组数。
PARTITION BY
子句将结果集的行分配到应用了NTILE()函数的分区中。
ORDER BY
子句指定应用NTILE()的每个分区中行的逻辑顺序。
select row_number()over(order by SCORE) as num,sc.* from sc
另外,可以使用partition by为数据进行分组排序
例如,按照CNO分组,将score排序
select row_number()over(partition by CNO order by SCORE) as num,sc.* from sc
select rank()over(order by SCORE) as num,sc.* from sc
结果
可以看到,score相同的数据行,排序相同。并且为跳跃排序(五个9后面是14)。
partition by使用方法相同,不再模拟。
select dense_rank()over(order by SCORE) as num,sc.* from sc
结果
可以看到,score相同的数据行,排序相同。但为顺序排序(五个9后面仍是10)。
PS:
dense_rank()函数还有个用处,就是将一组内的数据分为同一个序号,并按组递增排序。这样可以获得groupby的num值,对于只有值,没有ID的数据,比较有用。
例如:按照CNO分组排序
select dense_rank()over(order by CNO ) as num,sc.* from sc
select ntile(4)over(order by SCORE ) as num,sc.* from sc