Sql语句执行顺序,你理解了吗

1.序言

记得前几年,还是初级的时候,面试官问到,请你讲一下sql语句的执行顺序。当时我以为就是按照sql的关键字排列顺序来执行的。当时说完,面试官心里估计已经直接pass我了吧。今天复习的时候,突然想起这个基础知识点,所以有时间就来发表一下了。

 

2.sql语句的执行顺序

2.1 为什么要了解sql语句执行顺序

了解一个sql语句的执行顺序,可以让我们清楚到sql执行时的操作顺序,进而有利于我们更好的优化自己的sql语句,提升程序性能。

举个栗子:

--sql 1
select a.* from table_a a left join table_b b on a.id = b.a_id where b.name = 'john';

--sql 2
select * from table_a where id = (select a_id from table_b where name = 'john');

倘若说table_a和table_b都是几十几百万数据的表。而name=‘john’这个过滤字段可以查到table_b的唯一数据。那么此时,一定是sql2的执行效率要高于sql1的。为什么?通过sql执行顺序可以知道,table_a和table_b会优先执行联表操作,两个都是大表。其查询出来的结果集虚拟表也会很大。而sql2中,table_a只用通过table_b查询出来的唯一数据更快的获取到指定结果。

所以,如果你不知道sql执行顺序,同样的业务需求,也许,你就使用了性能不够好的sql1了。

2.2 sql语句执行顺序说明

(8) SELECT (9)DISTINCT
(1) FROM 
(3)  JOIN 
(2)         ON 
(4) WHERE 
(5) GROUP BY 
(6) WITH {CUBE|ROLLUP}
(7) HAVING 
(10) ORDER BY 
(11) LIMIT 

(1) FROM:对FROM子句中的左表和右表执行笛卡儿积,产生虚拟表VT1;
(2) ON: 对虚拟表VT1进行ON筛选,只有那些符合的行才被插入虚拟表VT2;
(3) JOIN: 如果指定了OUTER JOIN(如LEFT OUTER JOIN、RIGHT OUTER JOIN),那么保留表中未匹配的行作为外部行添加到虚拟表VT2,产生虚拟表VT3。如果FROM子句包含两个以上的表,则对上一个连接生成的结果表VT3和下一个表重复执行步骤1~步骤3,直到处理完所有的表;
(4) WHERE: 对虚拟表VT3应用WHERE过滤条件,只有符合的记录才会被插入虚拟表VT4;
(5) GROUP By: 根据GROUP BY子句中的列,对VT4中的记录进行分组操作,产生VT5;
(6) CUBE|ROllUP: 对VT5进行CUBE或ROLLUP操作,产生表VT6;
(7) HAVING: 对虚拟表VT6应用HAVING过滤器,只有符合的记录才会被插入到VT7;
(8) SELECT: 第二次执行SELECT操作,选择指定的列,插入到虚拟表VT8中;
(9) DISTINCT: 去除重复,产生虚拟表VT9;
(10) ORDER BY: 将虚拟表VT9中的记录按照进行排序操作,产生虚拟表VT10;
(11) LIMIT: 取出指定街行的记录,产生虚拟表VT11,并返回给查询用户

 

参考链接:

https://blog.csdn.net/u013887008/article/details/93377939

你可能感兴趣的:(数据库专栏)