面试新收获-窗口排序函数

背景

2025年4月26日

今天参加了一家公司的二面,有一个问题没有听过,sql里面的“窗口排序函数的区别”

窗口,ok,我知道一些,

排序,ok,我知道,

函数,ok,我知道,

排序函数,ok,我知道

窗口排序函数,???

确实忘了,还导致面试官质疑科班身份,搞得我下来了还特意去查了本科学的《数据库系统概论》,好像没有啊

ok,算了,问GPT

1. 什么是窗口函数?

窗口函数(Window Function)是针对查询结果中的每一行,根据定义好的窗口(分组+排序规则)计算一个额外值,而不影响原来的行数

窗口函数的结构:

函数名() OVER ([PARTITION BY 分组字段] ORDER BY 排序字段)

部分 含义
函数名() 比如 RANK(), DENSE_RANK(), SUM(), AVG()
OVER 必须有的关键字
PARTITION BY 按某列分组(可选)
ORDER BY 按某列排序(通常必选)

2. 常见排序类窗口函数(核心)

函数名 作用 特点
ROW_NUMBER() 全局唯一递增编号(无跳号) 不管值是否相同
RANK() 相同值排名相同,后续跳号 有跳号
DENSE_RANK() 相同值排名相同,后续不跳号 不跳号

3. 三个函数的具体区别(超重要)

比如我们有这样一组分数数据(score越高排越前):

id score
1 100
2 90
3 90
4 80

排序规则:score降序(DESC)

函数 结果(id顺序)
ROW_NUMBER() 1,2,3,4(严格递增,不管值是否相同)
RANK() 1,2,2,4(值相同名次一样,后面跳号)
DENSE_RANK() 1,2,2,3(值相同名次一样,后面连续编号)

ROW_NUMBER() 流程(严格编号,不管分数是否相同)
--------------------------------------------------
id: 1   score: 100   row_number: 1
id: 2   score: 90    row_number: 2
id: 3   score: 90    row_number: 3
id: 4   score: 80    row_number: 4

RANK() 流程(相同分数占同一名,后面跳号)
--------------------------------------------------
id: 1   score: 100   rank: 1
id: 2   score: 90    rank: 2
id: 3   score: 90    rank: 2
id: 4   score: 80    rank: 4

DENSE_RANK() 流程(相同分数占同一名,后面连续编号)
--------------------------------------------------
id: 1   score: 100   dense_rank: 1
id: 2   score: 90    dense_rank: 2
id: 3   score: 90    dense_rank: 2
id: 4   score: 80    dense_rank: 3

4.核心对比总结表

函数 相同分数占同一名? 排名跳号? 特点
ROW_NUMBER() 否(每行唯一编号) 不管分数是否相同,依次递增编号
RANK() 相同分数排名一样,后面跳号
DENSE_RANK() 相同分数排名一样,后面连续

5.每个函数的应用场景

1. ROW_NUMBER() 应用场景

  • 分页查询(比如取第11-20条数据)

  • 需要唯一行号编号的场景(比如流水线、排名流水)

2. RANK() 应用场景

  • 标准排行榜,相同分数并列排名,后续跳号

  • 比赛计分系统,要求同分并列+跳过名次

3. DENSE_RANK() 应用场景

  • 紧凑型排行榜,相同分数并列但后续不跳名次

  • 积分等级评定,要求排名连续紧凑

实操

SELECT
    user_id,
    score,
    RANK() OVER (ORDER BY score DESC) AS rank,
    DENSE_RANK() OVER (ORDER BY score DESC) AS dense_rank,
    ROW_NUMBER() OVER (ORDER BY score DESC) AS row_number
FROM
    user_scores;

你可能感兴趣的:(从面试中学习,面试知识集合,数据库,sql)