数据库的数据分组GROUP BY

1、数据分组入门

数据分组用来将数据分为多个逻辑组,从而可以对每个组进行聚合运算。SQL语句中使用

GROUP BY子句进行分组,使用方式为“GROUP BY 分组字段”。分组语句必须和聚合函数一

起使用,GROUP BY子句负责将数据分成逻辑组,而聚合函数则对每一个组进行统计计算。

虽然GROUP BY子句常常和聚合函数一起使用,不过GROUP BY子句并不是不能离开聚合函数而单独使用。

SELECT FAge FROM T_Employee

GROUP BY FAge  //查看公司员工有哪些年龄段

需要注意的是GROUP BY子句的位置,GROUP BY子句必须放到SELECT语句的之后,如果SELECT语句有WHERE子句,则GROUP BY子句必须放到WHERE语句的之后

SELECT FAge FROM T_Employee

WHERE FSubCompany = 'Beijing'

GROUP BY FAge

需要分组的所有列都必须位于GROUP BY子句的列名列表中,也就是没有出现在GROUP BY子句中的列(聚合函数除外)是不能放到SELECT语句后的列名列表中的。

SELECT FAge,FSalary FROM T_Employee

GROUP BY FAge  //错误的,因为不存在能够统一代表本组工资水平的FSalary字段

SELECT FAge,AVG(FSalary) FROM T_Employee

GROUP BY FAge  //可以对FSalary使用聚合函数

GROUP BY子句中可以指定多个列,只需要将多个列的列名用逗号隔开即可。指定多个分组规则以后,数据库系统将按照定义的分组顺序来对数据进行逐层分组,首先按照第一个分组列进行分组,然后在每个小组内按照第二个分组列进行再次分组……逐层分组,从而实现“组中组”的效果,而查询的结果集是以最末一级分组来进行输出的。

SELECT FSubCompany,FDepartment FROM T_Employee

GROUP BY FSubCompany,FDepartment

2、数据分组与聚合函数

SELECT FAge,COUNT(*) AS CountOfThisAge FROM T_Employee

GROUP BY FAge  //查看每个年龄段的员工的人数

SELECT FSubCompany,FAge,COUNT(*) AS CountOfThisSubCompAge FROM

T_Employee

GROUP BY FSubCompany,FAge  //统计每个分公司的年龄段的人数

上面的执行结果是按照数据库系统默认的年龄进行排序的,为了更容易的按照每个分公司进行查看,我们可以指定按照FSubCompany字段进行排序,带ORDER BY的SQL语句如下:

SELECT FSubCompany,FAge,COUNT(*) AS CountOfThisSubCompAge FROM

T_Employee

GROUP BY FSubCompany,FAge

ORDER BY FSubCompany

“COUNT(*)”对每一个分组统计总数,这样就可以统计出每个公司每个年龄段的员工的人数了。

SUM、AVG、MIN、MAX也可以在分组中使

SELECT FSubCompany,SUM(FSalary) AS FSalarySUM FROM T_Employee

GROUP BY FSubCompany  //统计每个公司中的工资的总值

SELECT FDepartment,SUM(FSalary) AS FSalarySUM FROM T_Employee

GROUP BY FDepartment  //统计每个垂直部门中的工资的平均值

SELECT FDepartment,MIN(FAge) AS FAgeMIN,MAX(FAge) AS FAgeMAX FROM T_Employee

GROUP BY FDepartment  //统计每个垂直部门中员工年龄的最大值和最小值

3、HAVING 语句

有的时候需要对部分分组进行过滤,比如只检索人数多余1个的年龄段

SELECT FAge,COUNT(*) AS CountOfThisAge FROM T_Employee

GROUP BY FAge

WHERE COUNT(*)>1

以上SQL语句数据库系统会提示语法错误,这是因为聚合函数不能在WHERE语句中使用,必须使用HAVING子句来代替

SELECT FAge,COUNT(*) AS CountOfThisAge FROM T_Employee

GROUP BY FAge

HAVING COUNT(*)>1

HAVING语句中也可以像WHERE语句一样使用复杂的过滤条件

SELECT FAge,COUNT(*) AS CountOfThisAge FROM T_Employee

GROUP BY FAge

HAVING COUNT(*) =1 OR COUNT(*) =3 //检索人数为1个或者3个的年龄段,

也可以使用IN操作符来实现上面的功能,SQL语句如下:

SELECT FAge,COUNT(*) AS CountOfThisAge FROM T_Employee

GROUP BY FAge

HAVING COUNT(*) IN (1,3)

HAVING语句能够使用的语法和WHERE几乎是一样的,不过使用WHERE的时候GROUP BY子句要位于WHERE子句之后,而使用HAVING子句的时候GROUP BY子句要位于HAVING子句之前,比如下面的SQL是错误的:

SELECT FAge,COUNT(*) AS CountOfThisAge FROM T_Employee

HAVING COUNT(*) IN (1,3)

GROUP BY FAge

需要特别注意,在HAVING语句中不能包含未分组的列名,比如下面的SQL语句是错误的:

SELECT FAge,COUNT(*) AS CountOfThisAge FROM T_Employee

GROUP BY FAge

HAVING FName IS NOT NULL

执行的时候数据库系统会提示类似如下的错误信息:

HAVING 子句中的列'T_Employee.FName' 无效,因为该列没有包含在聚合函数或GROUP BY 子句中。

需要用WHERE语句来代替HAVING,修改后的SQL语句如下:

SELECT FAge,COUNT(*) AS CountOfThisAge FROM T_Employee

WHERE FName IS NOT NULL

GROUP BY FAge

以上摘自《程序员的SQL 金典》

你可能感兴趣的:(数据库的数据分组GROUP BY)