【MySQL】SQL语句的基本执行顺序详解

一、基本SQL语句

1、基本执行顺序

  • SELECT

  • DISTINGCT(T1.name)

  • FROM table_name1 T1

  • JOIN table_name2 T2

  • ON T2.t1_id = T1.id

  • WHERE T1.name = 'test'

  • GROUP BY T1.class

  • HAVING AVG(T1.age)

  • ORDER BY createTime DESC

  • LIMIT 1,10;

2、说明

  • FORM: 对FROM的左边的表和右边的表计算笛卡尔积。产生虚表VT1

  • ON: 对虚表VT1进行ON筛选,只有那些符合的行才会被记录在虚表VT2中。

  • JOIN: 如果指定了OUTER JOIN(比如left join、 right join),那么保留表中未匹配的行就会作为外部行添加到虚拟表VT2中,产生虚拟表VT3, rug from子句中包含两个以上的表的话,那么就会对上一个join连接产生的结果VT3和下一个表重复执行步骤1~3这三个步骤,一直到处理完所有的表为止。

  • WHERE: 对虚拟表VT3进行WHERE条件过滤。只有符合的记录才会被插入到虚拟表VT4中

  • GROUP BY: 根据group by子句中的列,对VT4中的记录进行分组操作,产生VT5.

  • CUBE | ROLLUP: 对表VT5进行cube或者rollup操作,产生表VT6.

  • HAVING: 对虚拟表VT6应用having过滤,只有符合的记录才会被 插入到虚拟表VT7中。

  • SELECT: 执行select操作,选择指定的列,插入到虚拟表VT8中。

  • DISTINCT: 对VT8中的记录进行去重。产生虚拟表VT9.

  • ORDER BY: 将虚拟表VT9中的记录按照进行排序操作,产生虚拟表VT10.

  • LIMIT:取出指定行的记录,产生虚拟表VT11, 并将结果返回。

  • 写的顺序:
select ... from. where.. group by.. having.. order by.. limit [offset,] (rows)
  • 执行顺序:
from... where...group by... having.... select ... order by... limit

3、WHERE、HAVING 的区别

  • WHERE 是一个约束声明,使用Where来约束来之数据库的数据,Where是在结果返回之前起作用的,且Where中不能使用聚合函数。

  • HAVING是一个过滤声明,是在查询返回结果集以后对查询结果进行的过滤操作,在Having中可以使用聚合函数。

  • HAVING子句可以让我们筛选成组后的各组数据,WHERE子句在聚合前先筛选记录,也就是说作用在GROUP BY 子句和HAVING子句前;而HAVING子句在聚合后对组记录进行筛选。

1、实例

  • 显示每个地区的总人口数和总面积:
SELECT region, SUM(population), SUM(area)
FROM bbc
GROUP BY region

先以region把返回记录分成多个组,这就是GROUP BY的字面含义。分完组后,然后用聚合函数对每组中的不同字段(一或多条记录)作运算。

  • 显示每个地区的总人口数和总面积.仅显示那些人口数量超过1000000的地区。并通过sum后的字段进行排序
SELECT region, SUM(population), SUM(area)
FROM bbc
GROUP BY region
HAVING SUM(population)>1000000
ORDER BY sum(population) desc

用having就一定要和group by连用,
用group by不一有having (它只是一个筛选条件用的)


二、聚合函数

1、常用聚合函数

  • 平均值AVG
  • 标准偏差STDEV
  • 方差VAR
  • 最大值MAX
  • 最小值MIN
  • 合计SUM
  • 次数COUNT
  • 极差值MAX-MIN
  • 变异系数STDEV/AVG*100
SELECT  Name AS '射击手' ,
        AVG(Score) AS '平均值' ,
        STDEV(Score) AS '标准偏差' ,
        VAR(Score) AS '方差' ,
        MAX(Score) AS '最大值' ,
        MIN(Score) AS '最小值' ,
        MAX(Score) - MIN(Score) AS '极差值' ,
        STDEV(Score) / AVG(Score) AS '变异系数' ,
        COUNT(Score) AS '次数'
FROM    @t1
GROUP BY Name

2、为什么要用标准差?

方差和标准差时表示一组数据离散程度的最好指标,是最常用的差异量数。

  • 其特点有:

    • 1、反应灵敏,每个数据变化都应在方差上体现;
    • 2、计算严密;
    • 3、容易计算;
    • 4、适合代数运算;
    • 5、受抽样变动影响小;
    • 6、简单明了;
    • 7、容易受极端数据影响。
  • 计算方差的步骤可概括为“先平均,后求差,平方后,再平均”.

  • 方差用来衡量一批数据的波动大小.(即这批数据偏离平均数的大小).

  • 方差越大,说明数据的波动越大,越不稳定.

3、变异系数:

变异系数又称“标准差率”,是衡量资料中各观测值变异程度的另一个统计量。当进行两个或多个资料变异程度的比较时,如果度量单位与平均数相同,可以直接利用标准差来比较。如果单位和(或)平均数不同时,比较其变异程度就不能采用标准差,而需采用标准差与平均数的比值(相对值)来比较。

4、极差值:

指一组数据中最大数据与最小数据的差,在统计中常用极差来刻画一组数据的离散程度。

4、注意

  • having放在group by 的后面

  • group by 后面只能放非聚合函数的列

  • where 子句的作用是在对查询结果进行分组前,将不符合where条件的行去掉,即在分组之前过滤数据,条件中不能包含聚组函数,使用where条件显示特定的行。

  • having 子句的作用是筛选满足条件的组,即在分组之后过滤数据,条件中经常包含聚组函数,使用having 条件显示特定的组,也可以使用多个分组标准进行分组。

  • 用having就一定要和group by连用,

  • 用group by不一有having (它只是一个筛选条件用的

三、实例

  • 查询每个租户对应的用户数量,且用户数量大于10,并且以数量倒序排序
SELECT a.tenantId,COUNT(1) 
FROM fsmuserex a 
WHERE !a.deleted 
GROUP BY a.tenantId 
HAVING COUNT(1) > 10 
ORDER BY COUNT(1) DESC;

你可能感兴趣的:(【MySQL】SQL语句的基本执行顺序详解)