where,group by 和having的使用实例及区别

where,group by, having是数据库查询中最常用的几个关键字。

where:

数据库中常用的是where关键字,用于在初始表中筛选查询。它是一个约束声明,用于约束数据,在返回结果集之前起作用。如下面这个例子,从user表中查询出userDepartmentId等于2的数据。

select  *  from  dbo.user  where  userDepartmentId = 2

group by:

对select查询出来的结果集按照某个字段或者表达式进行分组,获得一组组的集合,然后从每组中取出一个指定字段或者表达式的值。

在说group by的时候,我们还需要了解聚合函数,聚合函数是SQL语言中一种特殊的函数。例如:

count(*):获取数量
sum():求和(这里要注意求和是忽略null值的,null与其他数值相加结果为null,所以可以通过ifnull(xxx,0)将null的值赋为0)
avg():求平均数
max():求最大值
min():求最小值

这些函数和其它函数的根本区别就是它们一般作用在多条记录上。

我们需要注意的是:在使用group by的SQL语句中,select中返回的字段,必须满足以下两个条件之一:

  • 1.包含在group by语句的后面,作为分组的依据;
  • 2.这些字段包含在聚合函数中。

从刚才的那个例子中,我们查询出每个城市,相同年龄的员工数量:

select  city, count(*),age  from  dbo.user  where  departmentID = 2  group  by  city,age

having:

用于对where和group by查询出来的分组经行过滤,查出满足条件的分组结果。它是一个过滤声明,是在查询返回结果集以后对查询结果进行的过滤操作

所以having的使用需要注意以下几点:

  • 1.having只能用于group by(分组统计语句中)
  • 2.where 是用于在初始表中筛选查询,having用于在where和group by 结果分组中查询
  • 3.having 子句中的每一个元素也必须出现在select列表中
  • 4.having语句可以使用聚合函数,而where不使用。

还是刚才的例子,我们进一步整理,查询员工数量大于20的城市和年龄段

select  city, count(*),age  from  dbo.user  
    where  departmentID = 2  
    group  by  city,age  
    having  age  > 40

回到开头的那个问题:当一个语句中同时含有where、group by 、having及聚集函数时,执行顺序如下:

  • 1.执行where子句查找符合条件的数据;
  • 2.使用group by 子句对数据进行分组;对group by 子句形成的组运行聚集函数计算每一组的值;
  • 3.最后用having 子句去掉不符合条件的组。

需要注意的是:

  • 1.having 子句中的每一个元素也必须出现在select列表中。有些数据库例外,如oracle.
  • 2.having子句和where子句都可以用来设定限制条件以使查询结果满足一定的条件限制。
  • 3.having子句限制的是组,而不是行。where子句中不能使用聚集函数,而having子句中可以。

当加上其他sql语句时,执行顺序如下:

select – > where – > group by – > having – > order by (顺序是不能改变的)

当一个查询语句同时出现了where,group by,having,order by的时候,执行顺序和编写顺序是:

  • 1.执行where xx对全表数据做筛选,返回第1个结果集。
  • 2.针对第1个结果集使用group by分组,返回第2个结果集。
  • 3.针对第2个结果集中的每1组数据执行select xx,有几组就执行几次,返回第3个结果集。
  • 4.针对第3个结集执行having xx进行筛选,返回第4个结果集。
  • 5.针对第4个结果集排序。

实例分析:

完成一个复杂的查询语句,需求如下:
按由高到低的顺序显示个人平均分在70分以上的学生姓名和平均分,为了尽可能地提高平均分,在计算平均分前不包括分数在60分以下的成绩,并且也不计算贱人(jr)的成绩。
分析:
确定第1步:要求显示学生姓名和平均分

select  s_name,avg(score)  from  student

确定第2步:计算平均分前不包括分数在60分以下的成绩,并且也不计算贱人(jr)的成绩

where  score >= 60  and  s_name  != ’jr’

确定第3步:显示个人平均分,相同名字的学生(同一个学生)考了多门科目 因此按姓名分组

group  by  s_name

确定第4步 :显示个人平均分在70分以上

having  avg(s_score) >= 70

确定第5步:按由高到低的顺序

order  by  avg(s_score)  desc

你可能感兴趣的:(where,group by 和having的使用实例及区别)