MySQL窗口函数OVER()
下面的讲解将基于这个employee2表
mysql> SELECT * FROM employee2; +----+-----------+------+---------+---------+ | id | name | age | salary | dept_id | +----+-----------+------+---------+---------+ | 3 | 小肖 | 29 | 30000.0 | 1 | | 4 | 小东 | 30 | 40000.0 | 2 | | 6 | 小非 | 24 | 23456.0 | 3 | | 7 | 晓飞 | 30 | 15000.0 | 4 | | 8 | 小林 | 23 | 24000.0 | NULL | | 10 | 小五 | 20 | 4500.0 | NULL | | 11 | 张山 | 24 | 40000.0 | 1 | | 12 | 小肖 | 28 | 35000.0 | 2 | | 13 | 李四 | 23 | 50000.0 | 1 | | 17 | 王武 | 24 | 56000.0 | 2 | | 18 | 猪小屁 | 2 | 56000.0 | 2 | | 19 | 小玉 | 25 | 58000.0 | 1 | | 21 | 小张 | 23 | 50000.0 | 1 | | 22 | 小胡 | 25 | 25000.0 | 2 | | 96 | 小肖 | 19 | 35000.0 | 1 | | 97 | 小林 | 20 | 20000.0 | 2 | +----+-----------+------+---------+---------+ 16 rows in set (0.00 sec)
窗口函数是OVER(),其中对应子句有PARTITION BY 以及 ORDER BY子句,所以形式有:
OVER()
这时候,是一个空子句,此时的效果和没有使用OVER()函数是一样的,作用的是这个表所有数据构成的窗口。
mysql> SELECT -> name, -> salary, -> MAX(salary) OVER() AS max_salary -- 作用于一整个窗口,此时返回的是所有数据中的MAX(salary),表示所有员工的最大工资 -> FROM employee2; +-----------+---------+------------+ | name | salary | max_salary | +-----------+---------+------------+ | 小肖 | 30000.0 | 58000.0 | | 小东 | 40000.0 | 58000.0 | | 小非 | 23456.0 | 58000.0 | | 晓飞 | 15000.0 | 58000.0 | | 小林 | 24000.0 | 58000.0 | | 小五 | 4500.0 | 58000.0 | | 张山 | 40000.0 | 58000.0 | | 小肖 | 35000.0 | 58000.0 | | 李四 | 50000.0 | 58000.0 | | 王武 | 56000.0 | 58000.0 | | 猪小屁 | 56000.0 | 58000.0 | | 小玉 | 58000.0 | 58000.0 | | 小张 | 50000.0 | 58000.0 | | 小胡 | 25000.0 | 58000.0 | | 小肖 | 35000.0 | 58000.0 | | 小林 | 20000.0 | 58000.0 | +-----------+---------+------------+ 16 rows in set (0.00 sec) mysql> SELECT -> name, -> salary, -> MAX(salary) OVER() -- 获取部门为1的所有员工的name,salary以及这个部门的最大工资 -> FROM employee2 -> WHERE dept_id = 1; +--------+---------+--------------------+ | name | salary | MAX(salary) OVER() | +--------+---------+--------------------+ | 小肖 | 30000.0 | 58000.0 | | 张山 | 40000.0 | 58000.0 | | 李四 | 50000.0 | 58000.0 | | 小玉 | 58000.0 | 58000.0 | | 小张 | 50000.0 | 58000.0 | | 小肖 | 35000.0 | 58000.0 | +--------+---------+--------------------+ 6 rows in set (0.00 sec)
OVER(PARTITION BY yyy1,yyy2,yyy3)
含有了PARTITION BY 子句,此时就会根据yyy1,yyy2,yyy3这些列构成的整体进行划分窗口,只有这些列构成的整体相同,才会处在同一个窗口中。
mysql> SELECT -> name, -> salary, -> MAX(salary) OVER(PARTITION BY dept_id) AS dept_max_salary -- 利用了PARTITION BY ,从而根据dept_id进行分组,然后获取每个分组的最大值 -> FROM employee2; +-----------+---------+-----------------+ | name | salary | dept_max_salary | +-----------+---------+-----------------+ | 小林 | 24000.0 | 24000.0 | --| 分组为NULL的 | 小五 | 4500.0 | 24000.0 | --| | 小肖 | 30000.0 | 58000.0 | -----| | 张山 | 40000.0 | 58000.0 | | 李四 | 50000.0 | 58000.0 | -- 分组为dept_id = 1的 | 小玉 | 58000.0 | 58000.0 | | 小张 | 50000.0 | 58000.0 | | 小肖 | 35000.0 | 58000.0 | -----| | 小东 | 40000.0 | 56000.0 | ---------| | 小肖 | 35000.0 | 56000.0 | | 王武 | 56000.0 | 56000.0 | | 猪小屁 | 56000.0 | 56000.0 | -- 分组为dept_id = 2的 | 小胡 | 25000.0 | 56000.0 | | 小林 | 20000.0 | 56000.0 | ---------| | 小非 | 23456.0 | 23456.0 | -- ------------| 分组为dept_id = 3的 | 晓飞 | 15000.0 | 15000.0 | -- --------------| 分组为dept_id = 4的 +-----------+---------+-----------------+ 16 rows in set (0.00 sec)
OVER(ORDER BY yyy1,yyy2,yyy3 ASC\DESC)
每个窗口中利用ORDER BY子句,这时候将按照yyy1进行对应的升序\降序的顺序进行排序,如果yyy1相同,将根据yyy2排序(和ORDER BY 的用法一样),这时候不仅会进行排序操作,如果是SUM与其连用的话,同时进行了累加的操作,即值是当前行加上前一行对应的值。但是下面的例子中却发现ORDER BY 后面对应的值相同的时候,并不是当前这一行加上以前行的值,例如ORDER BY salary\ORDER BY name的时候。
mysql> SELECT -> name, -> salary, -> SUM(salary) OVER(ORDER BY salary) AS already_paid_salary -- 利用ORDER BY ,窗口中对应的行将按照salary进行升序排序,然后调用SUM聚集 函数,不同的窗口进行累计 -> FROM employee2; +-----------+---------+---------------------+ | name | salary | already_paid_salary | +-----------+---------+---------------------+ | 小五 | 4500.0 | 4500.0 | | 晓飞 | 15000.0 | 19500.0 | | 小林 | 20000.0 | 39500.0 | | 小非 | 23456.0 | 62956.0 | | 小林 | 24000.0 | 86956.0 | | 小胡 | 25000.0 | 111956.0 | | 小肖 | 30000.0 | 141956.0 | | 小肖 | 35000.0 | 211956.0 | -- -----| 这两行同处相同,此时这个窗口的already_paid_salary | 小肖 | 35000.0 | 211956.0 | -- -----| = (35000 * 2) (当前两行) + 141956(前面的行) | 小东 | 40000.0 | 291956.0 | -- ---| 这两行同处相同,此时这个窗口的already_paid_salary | 张山 | 40000.0 | 291956.0 | -- ---| = (40000 * 2)(当前两行) + 211956(之前行的) | 李四 | 50000.0 | 391956.0 | -- | 道理同上 | 小张 | 50000.0 | 391956.0 | -- | | 王武 | 56000.0 | 503956.0 | -- ------|道理同上 | 猪小屁 | 56000.0 | 503956.0 | -- ------| | 小玉 | 58000.0 | 561956.0 | +-----------+---------+---------------------+ 16 rows in set (0.00 sec) mysql> SELECT -> name, -> salary, -> SUM(salary) OVER(ORDER BY name) -- 每个窗口的所有行将根据name进行升序排序这时候,然后不同name的行将会进行累计操作,直接是当前行+以嵌行的,相同的时候,是相同行的和加上之前行的值 -> FROM employee2; +-----------+---------+---------------------------------+ | name | salary | SUM(salary) OVER(ORDER BY name) | +-----------+---------+---------------------------------+ | 小东 | 40000.0 | 40000.0 | | 小五 | 4500.0 | 44500.0 | | 小张 | 50000.0 | 94500.0 | | 小林 | 24000.0 | 138500.0 | -- |这两组同处相同,所以对应的值为(24000 + 20000)(相同的两行) + 94500(之前的行) | 小林 | 20000.0 | 138500.0 | -- | | 小玉 | 58000.0 | 196500.0 | | 小肖 | 30000.0 | 296500.0 | -- ---|这两组同处相同,所以对应的值为(30000 + 35000 + 35000)(相同的三行) + 196500(之前的行) | 小肖 | 35000.0 | 296500.0 | | 小肖 | 35000.0 | 296500.0 | -- ---| | 小胡 | 25000.0 | 321500.0 | | 小非 | 23456.0 | 344956.0 | | 张山 | 40000.0 | 384956.0 | | 晓飞 | 15000.0 | 399956.0 | | 李四 | 50000.0 | 449956.0 | | 猪小屁 | 56000.0 | 505956.0 | | 王武 | 56000.0 | 561956.0 | +-----------+---------+---------------------------------+ 16 rows in set (0.00 sec)
同时值得注意的是,OVER()是一个全局函数,所以在使用ORDER BY 的时候,那么最后输出的时候也将是按照这个有序输出,但是仅仅在没有使用PARTITION BY的情况才是这样的.这个可以从PARTITION BY进行说明,没有使用PARTITION BY的时候,ORVER()中的ORDER BY将是针对整张表进行排序的,所以这时候如果FROM子句后面的ORDER BY后的字段和OVER()中ORDER BY后的字段相同的时候,就会显得多此一举了。
即
# 下面两个代码是一样的,但是仅仅OVER()只使用ORDER BY子句的时候,并且才这样 # 两个ORDER BY后面的字段是相同才可以保证效果一样 # 如果使用了PARTITION BY子句,那么OVER()中的ORDER BY将是针对每一个窗口 # 中的所有行进行排序的,而在FROM子句后面的ORDER BY将是针对整张表,所以 # 导致结果不同 SELECT name, SUM(salary) OVER(ORDER BY NAME) FROM employee2; SELECT name, SUM(salary) OVER(ORDER BY NAME) FROM employee2 ORDER BY name; mysql> SELECT -> name,salary, -> SUM(salary) OVER(ORDER BY name) -> FROM employee2; +-----------+---------+---------------------------------+ | name | salary | SUM(salary) OVER(ORDER BY name) | +-----------+---------+---------------------------------+ | 小东 | 40000.0 | 40000.0 | | 小五 | 4500.0 | 44500.0 | | 小张 | 50000.0 | 94500.0 | | 小林 | 24000.0 | 138500.0 | | 小林 | 20000.0 | 138500.0 | | 小玉 | 58000.0 | 196500.0 | | 小肖 | 30000.0 | 296500.0 | | 小肖 | 35000.0 | 296500.0 | | 小肖 | 35000.0 | 296500.0 | | 小胡 | 25000.0 | 321500.0 | | 小非 | 23456.0 | 344956.0 | | 张山 | 40000.0 | 384956.0 | | 晓飞 | 15000.0 | 399956.0 | | 李四 | 50000.0 | 449956.0 | | 猪小屁 | 56000.0 | 505956.0 | | 王武 | 56000.0 | 561956.0 | +-----------+---------+---------------------------------+ 16 rows in set (0.00 sec) # 两个ORDER BY后面的字段相同时,作用就会相当只使用SUM(salary) OVER(ORDER BY name) mysql> SELECT -> name,salary, -> SUM(salary) OVER(ORDER BY name) -> FROM employee2 -> ORDER BY name; +-----------+---------+---------------------------------+ | name | salary | SUM(salary) OVER(ORDER BY name) | +-----------+---------+---------------------------------+ | 小东 | 40000.0 | 40000.0 | | 小五 | 4500.0 | 44500.0 | | 小张 | 50000.0 | 94500.0 | | 小林 | 24000.0 | 138500.0 | | 小林 | 20000.0 | 138500.0 | | 小玉 | 58000.0 | 196500.0 | | 小肖 | 30000.0 | 296500.0 | | 小肖 | 35000.0 | 296500.0 | | 小肖 | 35000.0 | 296500.0 | | 小胡 | 25000.0 | 321500.0 | | 小非 | 23456.0 | 344956.0 | | 张山 | 40000.0 | 384956.0 | | 晓飞 | 15000.0 | 399956.0 | | 李四 | 50000.0 | 449956.0 | | 猪小屁 | 56000.0 | 505956.0 | | 王武 | 56000.0 | 561956.0 | +-----------+---------+---------------------------------+ 16 rows in set (0.00 sec) # 两个ORDER BY后的字段不同,那么FROM 子句后的ORDER BY将会覆盖OVER()中的ORDER BY mysql> SELECT -> name,salary, -> SUM(salary) OVER(ORDER BY name) -> FROM employee2 -> ORDER BY salary; +-----------+---------+---------------------------------+ | name | salary | SUM(salary) OVER(ORDER BY name) | +-----------+---------+---------------------------------+ | 小五 | 4500.0 | 44500.0 | | 晓飞 | 15000.0 | 399956.0 | | 小林 | 20000.0 | 138500.0 | | 小非 | 23456.0 | 344956.0 | | 小林 | 24000.0 | 138500.0 | | 小胡 | 25000.0 | 321500.0 | | 小肖 | 30000.0 | 296500.0 | | 小肖 | 35000.0 | 296500.0 | | 小肖 | 35000.0 | 296500.0 | | 小东 | 40000.0 | 40000.0 | | 张山 | 40000.0 | 384956.0 | | 小张 | 50000.0 | 94500.0 | | 李四 | 50000.0 | 449956.0 | | 猪小屁 | 56000.0 | 505956.0 | | 王武 | 56000.0 | 561956.0 | | 小玉 | 58000.0 | 196500.0 | +-----------+---------+---------------------------------+ 16 rows in set (0.00 sec) # OVER()中的ORDER BY针对的窗口中的所有行进行排序的,而下面的FROM子句中的 # ORDER BY是针对整个表的,所以此时两者的作用并不相同 mysql> SELECT -> name,salary, -> SUM(salary) OVER(PARTITION BY dept_id ORDER BY name) -> FROM employee2; +-----------+---------+------------------------------------------------------+ | name | salary | SUM(salary) OVER(PARTITION BY dept_id ORDER BY name) | +-----------+---------+------------------------------------------------------+ | 小五 | 4500.0 | 4500.0 | | 小林 | 24000.0 | 28500.0 | | 小张 | 50000.0 | 50000.0 | | 小玉 | 58000.0 | 108000.0 | | 小肖 | 30000.0 | 173000.0 | | 小肖 | 35000.0 | 173000.0 | | 张山 | 40000.0 | 213000.0 | | 李四 | 50000.0 | 263000.0 | | 小东 | 40000.0 | 40000.0 | | 小林 | 20000.0 | 60000.0 | | 小肖 | 35000.0 | 95000.0 | | 小胡 | 25000.0 | 120000.0 | | 猪小屁 | 56000.0 | 176000.0 | | 王武 | 56000.0 | 232000.0 | | 小非 | 23456.0 | 23456.0 | | 晓飞 | 15000.0 | 15000.0 | +-----------+---------+------------------------------------------------------+ 16 rows in set (0.00 sec) mysql> SELECT -> name,salary, -> SUM(salary) OVER(PARTITION BY dept_id ORDER BY name) -> FROM employee2 -> ORDER BY name; +-----------+---------+------------------------------------------------------+ | name | salary | SUM(salary) OVER(PARTITION BY dept_id ORDER BY name) | +-----------+---------+------------------------------------------------------+ | 小东 | 40000.0 | 40000.0 | | 小五 | 4500.0 | 4500.0 | | 小张 | 50000.0 | 50000.0 | | 小林 | 24000.0 | 28500.0 | | 小林 | 20000.0 | 60000.0 | | 小玉 | 58000.0 | 108000.0 | | 小肖 | 30000.0 | 173000.0 | | 小肖 | 35000.0 | 173000.0 | | 小肖 | 35000.0 | 95000.0 | | 小胡 | 25000.0 | 120000.0 | | 小非 | 23456.0 | 23456.0 | | 张山 | 40000.0 | 213000.0 | | 晓飞 | 15000.0 | 15000.0 | | 李四 | 50000.0 | 263000.0 | | 猪小屁 | 56000.0 | 176000.0 | | 王武 | 56000.0 | 232000.0 | +-----------+---------+------------------------------------------------------+ 16 rows in set (0.00 sec)
OVER(PARTITION BY yyy ORDER BY zzz ASC\DESC)
根据PARTITION BY ,此时表示根据yyy进行分组,然后在每个窗口中的所有行将利用ORDER BY 子句,将根据zzz进行排序。值得注意的是,如果zzz和yyy相同的时候,这时候作用相当于OVER(PARTITION BY yyy),和没有ORDER BY子句是一样的,因为都处在一个窗口了。
mysql> SELECT -> name, -> salary, -> SUM(salary) OVER(PARTITION BY dept_id) -> FROM employee2; +-----------+---------+----------------------------------------+ | name | salary | SUM(salary) OVER(PARTITION BY dept_id) | +-----------+---------+----------------------------------------+ | 小林 | 24000.0 | 28500.0 | -- | 分组为dept_id = NULL的 | 小五 | 4500.0 | 28500.0 | -- | | 小肖 | 30000.0 | 263000.0 | ------| | 张山 | 40000.0 | 263000.0 | | 李四 | 50000.0 | 263000.0 | | 小玉 | 58000.0 | 263000.0 | -- 分组为dept_id = 1的 | 小张 | 50000.0 | 263000.0 | | 小肖 | 35000.0 | 263000.0 | ------| | 小东 | 40000.0 | 232000.0 | --------| | 小肖 | 35000.0 | 232000.0 | | 王武 | 56000.0 | 232000.0 | | 猪小屁 | 56000.0 | 232000.0 | -- 分组为dept_id = 2的 | 小胡 | 25000.0 | 232000.0 | | 小林 | 20000.0 | 232000.0 | --------| | 小非 | 23456.0 | 23456.0 | -- ---------| 分组为dept_id = 3的 | 晓飞 | 15000.0 | 15000.0 | -- ------------| 分组为dept_id = 4的 +-----------+---------+----------------------------------------+ 16 rows in set (0.00 sec) mysql> SELECT -> name, -> salary, -> SUM(salary) OVER(PARTITION BY dept_id ORDER BY dept_id) -> FROM employee2; +-----------+---------+---------------------------------------------------------+ | name | salary | SUM(salary) OVER(PARTITION BY dept_id ORDER BY dept_id) | +-----------+---------+---------------------------------------------------------+ | 小林 | 24000.0 | 28500.0 | | 小五 | 4500.0 | 28500.0 | | 小肖 | 30000.0 | 263000.0 | | 张山 | 40000.0 | 263000.0 | | 李四 | 50000.0 | 263000.0 | | 小玉 | 58000.0 | 263000.0 | | 小张 | 50000.0 | 263000.0 | | 小肖 | 35000.0 | 263000.0 | | 小东 | 40000.0 | 232000.0 | | 小肖 | 35000.0 | 232000.0 | | 王武 | 56000.0 | 232000.0 | | 猪小屁 | 56000.0 | 232000.0 | | 小胡 | 25000.0 | 232000.0 | | 小林 | 20000.0 | 232000.0 | | 小非 | 23456.0 | 23456.0 | | 晓飞 | 15000.0 | 15000.0 | +-----------+---------+---------------------------------------------------------+ 16 rows in set (0.00 sec) # 注意查看dept_id = 1窗口中的name = "小肖"的值 mysql> SELECT -> name,salary, -> SUM(salary) OVER(PARTITION BY dept_id ORDER BY name) -> FROM employee2; +-----------+---------+------------------------------------------------------+ | name | salary | SUM(salary) OVER(PARTITION BY dept_id ORDER BY name) | +-----------+---------+------------------------------------------------------+ | 小五 | 4500.0 | 4500.0 | | 小林 | 24000.0 | 28500.0 | | 小张 | 50000.0 | 50000.0 | | 小玉 | 58000.0 | 108000.0 | | 小肖 | 30000.0 | 173000.0 | | 小肖 | 35000.0 | 173000.0 | | 张山 | 40000.0 | 213000.0 | | 李四 | 50000.0 | 263000.0 | | 小东 | 40000.0 | 40000.0 | | 小林 | 20000.0 | 60000.0 | | 小肖 | 35000.0 | 95000.0 | | 小胡 | 25000.0 | 120000.0 | | 猪小屁 | 56000.0 | 176000.0 | | 王武 | 56000.0 | 232000.0 | | 小非 | 23456.0 | 23456.0 | | 晓飞 | 15000.0 | 15000.0 | +-----------+---------+------------------------------------------------------+ 16 rows in set (0.00 sec)
而窗口函数可以和SUM()\AVG()\COUNT()\MAX()\MIN()这几个函数一起使用:
其中这些函数有一些特点,如果AVG()\COUNT()\MAX()\MIN()的括号中必须要有参数,用于统计某一列的对应的值,并且这一列中如果含有值为NULL的行,那么就会忽略值NULL的行,而COUNT()则比较特殊,如果是COUNT(*),那么就不会忽略NULL值的行,用来统计这个表中有多少行,否则,如果是COUNT(column),统计某一列column有多少行,那么就会忽略NULL的行。
如果需要指定AVG()等小数的输出格式,则需要使用下面几个函数:
FORMAT(xxx,yyy,zzz)
指定xxx有yyy个小数。但是这个函数有个特点,就是整数部分每三个数字就会用分隔符隔开(从小数点左边第一个数开始算的),如果不写zzz这个参数,即只有两个参数,就会以,作为分隔符了。
例如45000,如果利用FORMAT(45000,2),最后得到的是45,000.00的形式,再例如FORMAT(45000,4),得到的是45,000.0000
# 利用FORMAT,从而指定小数最后保留多少个小数点,同时从小数点左边第一个数字往左算,每三个数字 # 就会有一个分隔符.注意的是,原本FORMAT()有三个参数,如果不写zzz这个参数,就会默认用','作 # 为分隔符 mysql> SELECT -> name, -> FORMAT(salary,4) -> FROM employee2; +-----------+------------------+ | name | FORMAT(salary,4) | +-----------+------------------+ | 小肖 | 30,000.0000 | | 小东 | 40,000.0000 | | 小非 | 23,456.0000 | | 晓飞 | 15,000.0000 | | 小林 | 24,000.0000 | | 小五 | 4,500.0000 | | 张山 | 40,000.0000 | | 小肖 | 35,000.0000 | | 李四 | 50,000.0000 | | 王武 | 56,000.0000 | | 猪小屁 | 56,000.0000 | | 小玉 | 58,000.0000 | | 小张 | 50,000.0000 | | 小胡 | 25,000.0000 | | 小肖 | 35,000.0000 | | 小林 | 20,000.0000 | +-----------+------------------+ 16 rows in set (0.00 sec)
CAST(xxx AS decimal(12,yyy))
:指定xxx有yyy个小数.作用和CONVERT()一样,指定xxx有yyy个小数,但是和FORMAT()不同,他并不会每3个数字就用逗号隔开,例如45000,指定输出3个小数,则CONVERT(45000,DECIMAL(12,3)),将会输出45000.0,并没有逗号隔开.
mysql> SELECT -> name, -> CAST(salary AS DECIMAL(12,3)) -- 使用CAST,这时候相当于CONVERT一样,指定有多少个小数,并且不会出现分隔符 -> FROM employee2; +-----------+-------------------------------+ | name | CAST(salary AS DECIMAL(12,3)) | +-----------+-------------------------------+ | 小肖 | 30000.000 | | 小东 | 40000.000 | | 小非 | 23456.000 | | 晓飞 | 15000.000 | | 小林 | 24000.000 | | 小五 | 4500.000 | | 张山 | 40000.000 | | 小肖 | 35000.000 | | 李四 | 50000.000 | | 王武 | 56000.000 | | 猪小屁 | 56000.000 | | 小玉 | 58000.000 | | 小张 | 50000.000 | | 小胡 | 25000.000 | | 小肖 | 35000.000 | | 小林 | 20000.000 | +-----------+-------------------------------+ 16 rows in set (0.00 sec)
CONVERT(xxx,DECIMAL(12,yyy))
:指定xxx有yyy个小数,但是和FORMAT()不同,他并不会每3个数字就用逗号隔开,例如45000,指定输出3个小数,则CONVERT(45000,DECIMAL(12,3)),将会输出45000.0,并没有逗号隔开.
# 利用CONVERT,在指定有多少个小数的同时,不会出现逗号这样的分隔符,即从小数点左边的第一个数 # 字开始算,每三个数字并不会向FORMAT一样出现分隔符 mysql> SELECT -> name, -> CONVERT(salary,DECIMAL(12,3)) -> FROM employee2; +-----------+-------------------------------+ | name | CONVERT(salary,DECIMAL(12,3)) | +-----------+-------------------------------+ | 小肖 | 30000.000 | | 小东 | 40000.000 | | 小非 | 23456.000 | | 晓飞 | 15000.000 | | 小林 | 24000.000 | | 小五 | 4500.000 | | 张山 | 40000.000 | | 小肖 | 35000.000 | | 李四 | 50000.000 | | 王武 | 56000.000 | | 猪小屁 | 56000.000 | | 小玉 | 58000.000 | | 小张 | 50000.000 | | 小胡 | 25000.000 | | 小肖 | 35000.000 | | 小林 | 20000.000 | +-----------+-------------------------------+ 16 rows in set (0.00 sec)
此外,上面三个函数除了分隔符区别外,还有的是在ORDER BY方面,因为FORMAT得到的是一个字符串,所以利用ORDER BY 的时候,此时是基于字典顺序进行排序的,而CONVERT\CAST得到的是一个数字,所以利用ORDER BY 的时候,依旧是按照数字进行排序的。
# 利用CAST,然后利用这个列进行排序输出,由于CAST得到的是一个数字,所以利用ORDER BY # 的时候,就是按照数字大小进行排序的 mysql> SELECT -> name, -> CAST(salary AS DECIMAL(12,3)) AS cast_salary -> FROM employee2 -> ORDER BY cast_salary; +-----------+-------------+ | name | cast_salary | +-----------+-------------+ | 小五 | 4500.000 | | 晓飞 | 15000.000 | | 小林 | 20000.000 | | 小非 | 23456.000 | | 小林 | 24000.000 | | 小胡 | 25000.000 | | 小肖 | 30000.000 | | 小肖 | 35000.000 | | 小肖 | 35000.000 | | 小东 | 40000.000 | | 张山 | 40000.000 | | 李四 | 50000.000 | | 小张 | 50000.000 | | 王武 | 56000.000 | | 猪小屁 | 56000.000 | | 小玉 | 58000.000 | +-----------+-------------+ 16 rows in set (0.00 sec) # 利用FORMAT,然后利用这个列进行排序输出,由于FORMAT得到的是一个字符串,所以利用ORDER BY # 的时候,就是按照字典顺序进行排序的 mysql> SELECT -> name, -> FORMAT(salary,3) AS format_salary -> FROM employee2 -> ORDER BY format_salary; +-----------+---------------+ | name | format_salary | +-----------+---------------+ | 晓飞 | 15,000.000 | | 小林 | 20,000.000 | | 小非 | 23,456.000 | | 小林 | 24,000.000 | | 小胡 | 25,000.000 | | 小肖 | 30,000.000 | | 小肖 | 35,000.000 | | 小肖 | 35,000.000 | | 小五 | 4,500.000 | | 小东 | 40,000.000 | | 张山 | 40,000.000 | | 李四 | 50,000.000 | | 小张 | 50,000.000 | | 王武 | 56,000.000 | | 猪小屁 | 56,000.000 | | 小玉 | 58,000.000 | +-----------+---------------+ 16 rows in set (0.00 sec) # 利用CONVERT,然后利用这个列进行排序输出,由于CONVERT得到的是一个数字,所以利用ORDER BY # 的时候,就是按照数字大小进行排序的 mysql> SELECT -> name, -> CONVERT(salary,DECIMAL(12,3)) AS convert_salary -> FROM employee2 -> ORDER BY convert_salary; +-----------+----------------+ | name | convert_salary | +-----------+----------------+ | 小五 | 4500.000 | | 晓飞 | 15000.000 | | 小林 | 20000.000 | | 小非 | 23456.000 | | 小林 | 24000.000 | | 小胡 | 25000.000 | | 小肖 | 30000.000 | | 小肖 | 35000.000 | | 小肖 | 35000.000 | | 小东 | 40000.000 | | 张山 | 40000.000 | | 李四 | 50000.000 | | 小张 | 50000.000 | | 王武 | 56000.000 | | 猪小屁 | 56000.000 | | 小玉 | 58000.000 | +-----------+----------------+ 16 rows in set (0.00 sec)
这一题中就有讲到输出的格式:考试分数(一)
值得一提的是,MAX()\MIN()不仅可以求解数值和日期的最值,同时可以求解文本的最值。
这里主要讲一下SUM()和窗口函数使用:SUM(xxx) OVER(PARTITION BY yyy ORDER BY zzz) :这个是根据yyy进行分组,从而划分成为了多个窗口,这些窗口根据zzz进行排序,然后每个窗口将进行连续累计xxx。
下面这一题就是运用到了SUM()函数与窗口函数OVER()一起使用了:
统计salary的累计和running_total
最差是第几名
窗口函数还可以和排序函数一起使用
ROW_NUMBER() OVER()
:直接表示第几行了,并不会出现并列的情况DENSE_RANK() OVER()
:并列连续RANK() OVER()
:并列不连续
# ROW_NUMBER() OVER() 直接表示第几行 mysql> SELECT -> name, -> salary, -> ROW_NUMBER() OVER(ORDER BY salary DESC) -> FROM employee2; +-----------+---------+-----------------------------------------+ | name | salary | ROW_NUMBER() OVER(ORDER BY salary DESC) | +-----------+---------+-----------------------------------------+ | 小玉 | 58000.0 | 1 | | 王武 | 56000.0 | 2 | | 猪小屁 | 56000.0 | 3 | | 李四 | 50000.0 | 4 | | 小张 | 50000.0 | 5 | | 小东 | 40000.0 | 6 | | 张山 | 40000.0 | 7 | | 小肖 | 35000.0 | 8 | | 小肖 | 35000.0 | 9 | | 小肖 | 30000.0 | 10 | | 小胡 | 25000.0 | 11 | | 小林 | 24000.0 | 12 | | 小非 | 23456.0 | 13 | | 小林 | 20000.0 | 14 | | 晓飞 | 15000.0 | 15 | | 小五 | 4500.0 | 16 | +-----------+---------+-----------------------------------------+ 16 rows in set (0.00 sec) # RANK() OVER() 表示并列,但是不会连续 mysql> SELECT -> name, -> salary, -> RANK() OVER(ORDER BY salary DESC) -- 根据salary降序进行排序 -> FROM employee2; +-----------+---------+-----------------------------------+ | name | salary | RANK() OVER(ORDER BY salary DESC) | +-----------+---------+-----------------------------------+ | 小玉 | 58000.0 | 1 | | 王武 | 56000.0 | 2 | -- --| 这两组同处于第2,但是不会连续,所以下一组是 | 猪小屁 | 56000.0 | 2 | -- --| 从4开始了 | 李四 | 50000.0 | 4 | | 小张 | 50000.0 | 4 | | 小东 | 40000.0 | 6 | | 张山 | 40000.0 | 6 | | 小肖 | 35000.0 | 8 | | 小肖 | 35000.0 | 8 | | 小肖 | 30000.0 | 10 | | 小胡 | 25000.0 | 11 | | 小林 | 24000.0 | 12 | | 小非 | 23456.0 | 13 | | 小林 | 20000.0 | 14 | | 晓飞 | 15000.0 | 15 | | 小五 | 4500.0 | 16 | +-----------+---------+-----------------------------------+ 16 rows in set (0.00 sec) # DENSE_RANK() OVER() 并列连续排序 mysql> SELECT -> name, -> salary, -> DENSE_RANK() OVER(ORDER BY salary DESC) -> FROM employee2; +-----------+---------+-----------------------------------------+ | name | salary | DENSE_RANK() OVER(ORDER BY salary DESC) | +-----------+---------+-----------------------------------------+ | 小玉 | 58000.0 | 1 | | 王武 | 56000.0 | 2 | -- |这两组并列第2,并且是连续排序的 | 猪小屁 | 56000.0 | 2 | -- |所以下一组是从3开始的 | 李四 | 50000.0 | 3 | | 小张 | 50000.0 | 3 | | 小东 | 40000.0 | 4 | | 张山 | 40000.0 | 4 | | 小肖 | 35000.0 | 5 | | 小肖 | 35000.0 | 5 | | 小肖 | 30000.0 | 6 | | 小胡 | 25000.0 | 7 | | 小林 | 24000.0 | 8 | | 小非 | 23456.0 | 9 | | 小林 | 20000.0 | 10 | | 晓飞 | 15000.0 | 11 | | 小五 | 4500.0 | 12 | +-----------+---------+-----------------------------------------+ 16 rows in set (0.00 sec)
此外窗口函数还可以和其他一些函数使用,这里就不列举了。
利用了排序函数对应的练习:刷题通过的题目排名
参考资料:
WHAT IS the MySQL OVER clause?
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。