在企业的应用场景中,为了知道优化SQL语句的执行,需要查看SQL语句的具体执行过程,以加快SQL语句的执行效率。可以使用explain+SQL语句来模拟优化器执行SQL查询语句,从而知道mysql是如何处理sql语句的。
1、执行计划中包含的信息
Column | Meaning |
---|---|
id | The SELECT identifier |
select_type | The SELECT type |
table | The table for the output row |
partitions | The matching partitions |
type | The join type |
possible_keys | The possible indexes to choose |
key | The index actually chosen |
key_len | The length of the chosen key |
ref | The columns compared to the index |
rows | Estimate of rows to be examined |
filtered | Percentage of rows filtered by table condition |
extra | Additional information |
id
select查询的序列号,包含一组数字,表示查询中执行select子句或者操作表的顺序
id号分为三种情况:
1、如果id相同,那么执行顺序从上到下
2、如果id不同,如果是子查询,id的序号会递增,id值越大优先级越高,越先被执行
3、id相同和不同的,同时存在:相同的可以认为是一组,从上往下顺序执行,在所有组中,id值越大,优先级越高,越先执行
mysql将select查询分为简单和复杂类型,复杂类型可以分成3大类:简单子查询、所谓的派生表、UNION查询,下面是一个简单的子查询:explain select (select 1 from actor limit 1) from film
下面是一个from子句中的基本子查询:
explain select film_id from ( select film_id from film ) as der
这个查询执行时有一个匿名临时表。mysql内部通过别名der在外层查询中引用这个临时表,在更复杂的查询中可以看到ref列。
最后,下面是一个UNION查询。
explain select 1 union all select 1
UNION结果总是放在一个匿名临时表中,之后mysql将结果读取到临时表中。临时表并不在原sql中出现,因此它的id列是null。
到目前位置这些都非常直接了当,但这三类语句的混合则会使输出变得非常复杂,之后就会看到。
select_type
主要用来分辨查询的类型,是普通查询还是联合查询还是子查询。simple意味着查询不包括子查询和UNION,如果查询有任何复杂的字部分,则最外层部分标记PRIMARY 。
Column | Meaning |
---|---|
SIMPLE | Simple SELECT (not using UNION or subqueries) |
PRIMARY | The SELECT type |
UNION | 在UNION的第二个和随后的select被标记UNION。如果UNION被from子句中的子查询包括,那么它的第一个select会被标记为DERIVED |
DEPENDENT UNION | The matching partitions |
UNION RESULT | 用来从UNION的匿名临时表检索结果的SELECT被标记为UNION RESULT |
SUBQUERY | 子查询的select,不再from子句中 |
DEPENDENT SUBQUERY | The index actually chosen |
DERIVED | 包含在from子句中的子查询,mysql会递归执行并将结果放在一个临时表中。服务器内部称“派生表”,因为该临时表是从子查询中派生来的 |
UNCACHEABLE SUBQUERY | The columns compared to the index |
UNCACHEABLE UNION | Estimate of rows to be examined |
案例:
--sample:简单的查询,不包含子查询和union
explain select * from emp;
--primary:查询中若包含任何复杂的子查询,最外层查询则被标记为Primary
explain select staname,ename supname from (select ename staname,mgr from emp) t join emp on t.mgr=emp.empno ;
--union:若第二个select出现在union之后,则被标记为union
explain select * from emp where deptno = 10 union select * from emp where sal >2000;
--dependent union:跟union类似,此处的depentent表示union或union all联合而成的结果会受外部表影响
explain select * from emp e where e.empno in ( select empno from emp where deptno = 10 union select empno from emp where sal >2000)
--union result:从union表获取结果的select
explain select * from emp where deptno = 10 union select * from emp where sal >2000;
--subquery:在select或者where列表中包含子查询
explain select * from emp where sal > (select avg(sal) from emp) ;
--dependent subquery:subquery的子查询要受到外部表查询的影响
explain select * from emp e where e.deptno in (select distinct deptno from dept);
--DERIVED: from子句中出现的子查询,也叫做派生类,
explain select staname,ename supname from (select ename staname,mgr from emp) t join emp on t.mgr=emp.empno ;
--UNCACHEABLE SUBQUERY:表示使用子查询的结果不能被缓存
explain select * from emp where empno = (select empno from emp where deptno=@@sort_buffer_size);
--uncacheable union:表示union的查询结果不能被缓存:sql语句未验证
table
对应行正在访问哪一个表,表名或者别名,可能是临时表或者union合并结果集
1、如果是具体的表名,则表明从实际的物理表中获取数据,当然也可以是表的别名
2、表名是derivedN的形式,表示使用了id为N的查询产生的衍生表
3、当有union result的时候,表名是union n1,n2等的形式,n1,n2表示参与union的id
可以在这一列中从上往下观察mysql的关联优化器为查询选择的查询顺序。例如,可以看到下面的查询中mysql选择的关联顺序不同于语句中所指定的顺序。
explain select film.film_id from film
inner join film_actor using(film_id)
inner join actor using(actor_id)
当from子句中有子查询或UNION,table列会变的复杂的多。在这些场景中,确实没有一个表可以参考到,因为mysql创建的匿名临时表仅在查询执行过程中存在。
当在from子句中有子查询的时候,table列是
type
type显示的是访问类型,访问类型表示我是以何种方式去访问我们的数据,最容易想的是全表扫描,直接暴力的遍历一张表去寻找需要的数据,效率非常低下,访问的类型有很多,效率从最好到最坏依次是:
system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range > index > ALL
一般情况下,得保证查询至少达到range级别,最好能达到ref
ALL
这就是人们所称的全表扫描。通常意味着mysql将扫描整张表,从头到尾,去找到需要的行。index
这个跟全表扫描一样,只是mysql扫描表时按索引次序进行而不是行。它的主要优点是避免了排序,最大的缺点是要承担按索引次序读取整个表的开销。这通常意味着若是按随即次序访问行,开销将非常大。
如果在Extra列中看到了“Using index”,说明mysql正在使用覆盖索引,它只扫描索引的数据,而不是按索引次序的每一行。它比按索引次序全表扫描的开销要少很多。range
范围扫描就是一个有限制的索引扫描,它开始于索引里的某一点,返回匹配这个值域的行。这比全索引扫描好一些,因为它用不着遍历全部索引。显而易见的范围扫描是带有between或在where子句中带有 > 的查询。ref
这是一种索引访问,也有的叫索引查找。它返回所有匹配某个单值的行。 然后,它可能会找到多个符合条件的行,因此,它是查找和扫描的混合体。此类索引访问只有当使用非唯一索引或唯一索引的非唯一前缀时才发生。把它叫做ref是因为索引要跟某个参考值相比较,这个参考值或是一个常数,或是来自多表查询前一个表里的结果值。ref_or_null是ref的一个表种,他表示mysql必须在初次查找的结果里进行第二次查找以找出NULL的条目。eq_ref
mysql最多只返回一条符合条件的记录。这个访问方法可以在mysql使用主键或唯一性索引查找时看到,它会将他们与某个参考值做比较。mysql对这类访问类型的优化做的非常好,因为它只到无需估计匹配行的范围或在找到匹配行后在继续查找。const,system
当mysql能对查询的某部分进行优化并将其转换成一个常量的时候,就会使用该类型。举例来说,如果你通过将某一行的主键放入where子句里的方式来选取此行的主键,mysql就能把这个查询转换为一个常量。NULL
这中访问方式意味着mysql能在优化阶段分解查询语句,在执行阶段甚至不用再访问表或者索引,例如,从一个索引列里选取最小值可以通过单独查找索引来完成,不需要在执行时访问表。
案例
--all:全表扫描,一般情况下出现这样的sql语句而且数据量比较大的话那么就需要进行优化。
explain select * from emp;
--index:全索引扫描这个比all的效率要好,主要有两种情况,一种是当前的查询时覆盖索引,即我们需要的数据在索引中就可以索取,或者是使用了索引进行排序,这样就避免数据的重排序
explain select empno from emp;
--range:表示利用索引查询的时候限制了范围,在指定范围内进行查询,这样避免了index的全索引扫描,适用的操作符: =, <>, >, >=, <, <=, IS NULL, BETWEEN, LIKE, or IN()
explain select * from emp where empno between 7000 and 7500;
--index_subquery:利用索引来关联子查询,不再扫描全表
explain select * from emp where emp.job in (select job from t_job);
--unique_subquery:该连接类型类似与index_subquery,使用的是唯一索引
explain select * from emp e where e.deptno in (select distinct deptno from dept);
--index_merge:在查询过程中需要多个索引组合使用,没有模拟出来
--ref_or_null:对于某个字段即需要关联条件,也需要null值的情况下,查询优化器会选择这种访问方式
explain select * from emp e where e.mgr is null or e.mgr=7369;
--ref:使用了非唯一性索引进行数据的查找
create index idx_3 on emp(deptno);
explain select * from emp e,dept d where e.deptno =d.deptno;
--eq_ref :使用唯一性索引进行数据查找
explain select * from emp,emp2 where emp.empno = emp2.empno;
--const:这个表至多有一个匹配行,
explain select * from emp where empno = 7369;
--system:表只有一行记录(等于系统表),这是const类型的特例,平时不会出现
possible_keys
显示可能应用在这张表中的索引,一个或多个,查询涉及到的字段上若存在索引,则该索引将被列出,但不一定被查询实际使用
key
实际使用的索引,如果为null,则没有使用索引,查询中若使用了覆盖索引,则该索引和查询的select字段重叠。
key_len
表示索引中使用的字节数,可以通过key_len计算查询中使用的索引长度,在不损失精度的情况下长度越短越好。
ref
显示索引的哪一列被使用了,如果可能的话,是一个常数
raws
根据表的统计信息及索引使用情况,大致估算出找出所需记录需要读取的行数,此参数很重要,直接反应的sql找了多少数据,在完成目的的情况下越少越好
extra
包含额外的信息。
--using filesort:说明mysql无法利用索引进行排序,只能利用排序算法进行排序,会消耗额外的位置
explain select * from emp order by sal;
--using temporary:建立临时表来保存中间结果,查询完成之后把临时表删除
explain select ename,count(*) from emp where deptno = 10 group by ename;
--using index:这个表示当前的查询时覆盖索引的,直接从索引中读取数据,而不用访问数据表。如果同时出现using where 表名索引被用来执行索引键值的查找,如果没有,表面索引被用来读取数据,而不是真的查找
explain select deptno,count(*) from emp group by deptno limit 10;
--using where:使用where进行条件过滤
explain select * from t_user where id = 1;
--using join buffer:使用连接缓存,情况没有模拟出来
--impossible where:where语句的结果总是false
explain select * from emp where empno = 7469;