开窗函数(一)
开窗函数在SQL语句中属于一种特殊的用法。开窗函数的引入,是为了既可以显示聚集前的数据,也要显示聚集后的数据。
而在SQL中,开窗函数又分类两类,一类是排序函数,一类是聚合函数。
语法
<开窗函数> over (partition by <用于分组的列> order by <用于排序的列>)
开窗函数:如果这里我们使用的是排序函数,那么输入Rank()这类;如果这里我们选择的是聚合函数,那么输入Sum(列)这类。
注:用于分组的列,可以进行省略,类似于CALCULATE中ALL(‘表’)的效果。
本期我们主要介绍的是排序函数:rank、dense_rank、row_number、ntile。
使用实例
案例数据:
在白茶本机的数据库中存在名为“CaseData”的数据库。"Dim_Product"产品表。
例子1:使用Rank函数,对Product进行排序,排序依据为Price,按照ProductGroup进行分组。
SELECT *,RANK() OVER (PARTITION BY ProductGroup ORDER BY price) AS Rankx
FROM Dim_Product
结果如下:
从结果上我们可以看出,Rank函数是国际的通用排名,结果允许出现并列排名,不保留被占用的排序位数。
例如:1、2、3、3、5。其中4因为并列排名的原因,排序位数不保留。
例子2:使用Dense_Rank函数,对Product进行排序,排序依据为Price,按照ProductGroup进行分组。
SELECT *,Dense_Rank() OVER (PARTITION BY ProductGroup ORDER BY price) AS Rankx
FROM Dim_Product
结果如下:
从结果上我们可以看出,Dense_Rank函数是中国式排名,结果允许出现并列排名,保留被占用的排序位数。
例如:1、2、3、3、4。其中,4的排序位数顺延保留。
例子3:使用Row_Number函数,对Product进行排序,排序依据为Price,按照ProductGroup进行分组。
SELECT *,Row_Number() OVER (PARTITION BY ProductGroup ORDER BY price) AS Rankx
FROM Dim_Product
结果如下:
从结果上我们可以看出,Row_Number函数不允许出现并列排名。
例如:1、2、3、4、5。
例子4:使用Ntile函数,对Product进行排序,排序依据为Price,按照ProductGroup进行分组,组内分为4组。
SELECT *,Ntile(4) OVER (PARTITION BY ProductGroup ORDER BY price) AS Rankx
FROM Dim_Product
结果如下:
从结果上我们可以看出,Ntile函数会按照我们输入的参数,进行内置分组。
当组内数量小于参数时,那么返回结果就是对应的排名。
当组内数量大于参数时,那么返回结果为组内数量除以参数。
总结一下:
Rank函数是标准的排名,允许出现并列排名,例:1,1,3。
Dense_Rank是中国式排名,允许出现并列,例:1,1,2。
Row_Number不允许出现并列排名,例:1,2,3。
Ntile是分区函数,比如10行数据分四个区,例:1,1,2,2,3,3,4,4。