MySQL窗口函数是一种特殊的函数,它能够在查询结果中进行计算和聚合操作,并且可以在查询结果中返回每个行的值。它们通常与OVER子句一起使用,该子句定义了如何对窗口函数进行分组和排序。
以下是一些常用的MySQL窗口函数:
ROW_NUMBER():为每个行分配一个唯一的数字标识符。
RANK():为每个行分配一个排名,如果有相同的值,则排名相同。
DENSE_RANK():为每个行分配一个排名,如果有相同的值,则排名不同。
NTILE(n):将结果集分成n个等份,并为每个行分配一个组号。
LAG(column, offset, default):返回当前行之前的offset行的值,如果没有,则返回default。
LEAD(column, offset, default):返回当前行之后的offset行的值,如果没有,则返回default。
FIRST_VALUE(column):返回每个分组的第一个行的值。
LAST_VALUE(column):返回每个分组的最后一个行的值。
使用窗口函数可以方便地进行各种计算和聚合操作,例如计算总和、平均值、最大值、最小值、中位数等。它们还可以帮助我们在结果集中查找特定的值、比较相邻的值等。
需要注意的是,MySQL窗口函数只能在SELECT语句中使用,而不能在WHERE或HAVING子句中使用。此外,使用窗口函数可能会导致查询性能下降,因此需要谨慎使用。
假设我们有一个包含以下数据的表格:
id | name | department | salary |
---|---|---|---|
1 | John | Marketing | 5000 |
2 | Jane | Sales | 6000 |
3 | Peter | Marketing | 4500 |
4 | Mary | Sales | 5500 |
5 | Jack | Marketing | 4000 |
6 | Jill | Sales | 7000 |
SELECT ROW_NUMBER() OVER() AS row_num, name, salary
FROM employees;
效果:在employees表中为每一行添加一个序号,序号从1开始递增。
输出结果如下:
row_num | name | salary |
---|---|---|
1 | John | 5000 |
2 | Jane | 6000 |
3 | Peter | 4500 |
4 | Mary | 5500 |
5 | Jack | 4000 |
6 | Jill | 7000 |
SELECT name, salary, RANK() OVER(ORDER BY salary DESC) AS salary_rank
FROM employees;
效果:在employees表中根据员工的薪资进行排名,并为每个员工分配一个排名。
输出结果如下:
name | salary | salary_rank |
---|---|---|
Jill | 7000 | 1 |
Jane | 6000 | 2 |
Mary | 5500 | 3 |
John | 5000 | 4 |
Peter | 4500 | 5 |
Jack | 4000 | 6 |
SELECT name, salary, DENSE_RANK() OVER(ORDER BY salary DESC) AS salary_rank
FROM employees;
效果:在employees表中根据员工的薪资进行排名,并为每个员工分配一个排名,相同薪资的员工排名相同。
输出结果如下:
name | salary | salary_rank |
---|---|---|
Jill | 7000 | 1 |
Jane | 6000 | 2 |
Mary | 5500 | 3 |
John | 5000 | 4 |
Peter | 4500 | 5 |
Jack | 4000 | 6 |
SELECT name, salary, NTILE(3) OVER(ORDER BY salary DESC) AS salary_group
FROM employees;
效果:在employees表中根据员工的薪资将员工分为3组,并为每个员工分配一个组号。
输出结果如下:
name | salary | salary_group |
---|---|---|
Jill | 7000 | 1 |
Jane | 6000 | 1 |
Mary | 5500 | 2 |
John | 5000 | 2 |
Peter | 4500 | 3 |
Jack | 4000 | 3 |
SELECT name, salary, LAG(salary, 1, 0) OVER(ORDER BY salary DESC) AS prev_salary
FROM employees;
效果:在employees表中根据员工的薪资,为每个员工添加一个前一位员工的薪资。
输出结果如下:
name | salary | prev_salary |
---|---|---|
Jill | 7000 | 0 |
Jane | 6000 | 7000 |
Mary | 5500 | 6000 |
John | 5000 | 5500 |
Peter | 4500 | 5000 |
Jack | 4000 | 4500 |
SELECT name, salary, LEAD(salary, 1, 0) OVER(ORDER BY salary DESC) AS next_salary
FROM employees;
效果:在employees表中根据员工的薪资,为每个员工添加一个后一位员工的薪资。
输出结果如下:
name | salary | next_salary |
---|---|---|
Jill | 7000 | 6000 |
Jane | 6000 | 5500 |
Mary | 5500 | 5000 |
John | 5000 | 4500 |
Peter | 4500 | 4000 |
Jack | 4000 | 0 |
SELECT department, salary, FIRST_VALUE(name) OVER(PARTITION BY department ORDER BY salary DESC) AS top_performer
FROM employees;
效果:在employees表中根据每个员工的部门和薪资,为每个部门添加一个最高薪资的员工姓名。
输出结果如下:
department | salary | top_performer |
---|---|---|
Marketing | 5000 | John |
Marketing | 4500 | John |
Marketing | 4000 | John |
Sales | 7000 | Jill |
Sales | 6000 | Jill |
Sales | 5500 | Jill |
SELECT department, salary, LAST_VALUE(name) OVER(PARTITION BY department ORDER BY salary DESC) AS last_employee
FROM employees;
效果:在employees表中根据每个员工的部门和薪资,为每个部门添加一个最低薪资的员工姓名。
输出结果如下:
department | salary | last_employee |
---|---|---|
Marketing | 5000 | Jack |
Marketing | 4500 | Jack |
Marketing | 4000 | Jack |
Sales | 7000 | Jill |
Sales | 6000 | Jill |
Sales | 5500 | Jill |
以下是一些支持窗口函数的数据库及其支持版本:
Oracle Database:支持窗口函数,从Oracle 8i版本开始支持。
Microsoft SQL Server:支持窗口函数,从SQL Server 2005版本开始支持。
PostgreSQL:支持窗口函数,从PostgreSQL 8.4版本开始支持。
MySQL:支持窗口函数,从MySQL 8.0版本开始支持。
SQLite:支持窗口函数,从SQLite 3.25.0版本开始支持。
IBM Db2:支持窗口函数,从Db2 9.5版本开始支持。
SAP HANA:支持窗口函数,从SAP HANA SPS05版本开始支持。
Amazon Redshift:支持窗口函数,从Redshift 1.5版本开始支持。
需要注意的是,不同版本的数据库可能支持的窗口函数有所不同,具体支持情况可以查阅相应数据库的官方文档。