SQL语句执行过程详解

如下图所示,当向MySQL发送一个请求的时候,MySQL到底做了什么:

1.客户端发送一条查询给服务器。
2.服务器先检查查询缓存,如果命中了缓存,则立刻返回存储在缓存中的结果。否则进入下一阶段。
3.服务器端进行SQL解析、预处理,再由优化器生成对应的执行计划。
4.MySQL根据优化器生成的执行计划,再调用存储引擎的API来执行查询。
5.将结果返回给客户端。

逻辑查询处理阶段简介:

  • FROM:对 FROM 子句中的前两个表执行笛卡尔积(Cartesian product)(交叉联接),生成虚拟表VT1

  • ON:对VT1应用ON筛选器。只有那些使为真的行才被插入VT2。

  • OUTER(JOIN):如 果指定了OUTER JOIN(相对于CROSS JOIN 或(INNER JOIN),保留表(preserved table:左外部联接把左表标记为保留表,右外部联接把右表标记为保留表,完全外部联接把两个表都标记为保留表)中未找到匹配的行将作为外部行添加到 VT2,生成VT3.如果FROM子句包含两个以上的表,则对上一个联接生成的结果表和下一个表重复执行步骤1到步骤3,直到处理完所有的表为止。

  • WHERE:对VT3应用WHERE筛选器。只有使为true的行才被插入VT4.

  • GROUP BY:按GROUP BY子句中的列列表对VT4中的行分组,生成VT5.

  • CUBE|ROLLUP:把超组(Suppergroups)插入VT5,生成VT6.

  • HAVING:对VT6应用HAVING筛选器。只有使为 true 的组才会被插入VT7.

  • SELECT:处理SELECT列表,产生VT8.

  • DISTINCT:将重复的行从VT8中移除,产生VT9.

  • ORDER BY:将VT9中的行按RDER BY 子句中的列列表排序,生成游标(VC10).

  • TOP:从VC10的开始处选择指定数量或比例的行,生成表VT11,并返回调用者。

注:步骤10,按ORDER BY子句中的列列表排序上步返回的行,返回游标VC10.这一步是第一步也是唯一 一步可以使用SELECT列表中的列别名的步骤。这一步不同于其它步骤的 是,它不返回有效的表,而是返回一个游标。SQL是基于集合理论的。集合不会预先对它的行排序,它只是成员的逻辑集合,成员的顺序无关紧要。对表进行排序 的查询可以返回一个对象,包含按特定物理顺序组织的行。ANSI把这种对象称为游标。理解这一步是正确理解SQL的基础。

因为这一步不返回表(而是返回游标),使用了ORDER BY子句的查询不能用作表表达式。表表达式包括:视图、内联表值函数、子查询、派生表和共用表达式。它的结果必须返回给期望得到物理记录的客户端应用程序。例如,下面的派生表查询无效,并产生一个错误:

select * 
from(select orderid,customerid from orders order by orderid) as d

下面的视图也会产生错误:

create view my_view
as
select *
from orders
order by orderid

在 SQL 中,表表达式中不允许使用带有 ORDER BY 子句的查询,而在T—SQL中却有一个例外(应用TOP选项)。

所以要记住,不要为表中的行假设任何特定的顺序。换句话说,除非你确定要有序行,否则不要指定 ORDER BY 子句。排序是需要成本的,SQL Server需要执行有序索引扫描或使用排序运行符。

以上就是一条sql的执行过程,同时我们在书写查询sql的时候应当遵守以下顺序。

SELECT XXX FROM XXX WHERE XXX GROUP BY XXX HAVING XXX ORDER BY XXX LIMIT XXX;

你可能感兴趣的:(MySQL,数据库系统原理,sql,数据库,database)