表的读取顺序,数据读取操作的类型,哪些索引可以使用,哪些索引实际使用了,表之间的引用,每张表有多少行被优化器查询等信息。
下面是使用explain 的例子:
mysql> explain select * from mysql.user;
±—±------------±------±-----------±-----±--------------±-----±--------±-----±-----±---------±------+
| id | select_type | table | partitions | type |possible_keys | key | key_len | ref | rows | filtered | Extra |
±—±------------±------±-----------±-----±--------------±-----±--------±-----±-----±---------±------+
| 1 |SIMPLE | user | NULL | ALL | NULL | NULL | NULL | NULL | 26 | 100.00 | NULL |
±—±------------±------±-----------±-----±--------------±-----±--------±-----±-----±---------±------+
1 row in set, 1 warning (0.00 sec)
其中最重要的字段为:id、type、key、rows、Extra
在 select 语句之前增加 explain 关键字,MySQL 会在查询上设置一个标记,执行查询时,会返回执行计划的信息,而不是执行这条SQL(如果 from 中包含子查询,仍会执行该子查询,将结果放入临时表中)。
注:explain 有两个变种:
1) explain extended:会在 explain 的基础上额外提供一些查询优化的信息。紧随其后通过 showwarnings 命令可以 得到优化后的查询语句,从而看出优化器优化了什么。额外还有 filtered 列,是一个半分比的值,rows * filtered/100 可以估算出将要和 explain 中前一个表进行连接的行数(前一个表指 explain 中的id值比当前表id值小的表)。
2)explain partitions:相比 explain 多了个 partitions 字段,如果查询是基于分区表的话,会显示查询将访问的分区。
id列的编号是 select 的序列号,有几个 select 就有几个id,并且id的顺序是按 select 出现的顺序增长的。MySQL将 select 查询分为简单查询和复杂查询。复杂查询分为三类:简单子查询、派生表(from语句中的子查询)、union 查询。
1)简单子查询
mysql> explain select (select 1 from actorlimit 1) from film;
±—±------------±------±------±--------------±---------±--------±-----±-----±------------+
| id | select_type | table | type |possible_keys | key | key_len| ref | rows | Extra |
±—±------------±------±------±--------------±---------±--------±-----±-----±------------+
| 1 | PRIMARY |film | index | NULL | idx_name | 32 | NULL | 1 | Using index |
| 2 | SUBQUERY | actor | index | NULL | PRIMARY | 4 | NULL | 2 | Using index |
±—±------------±------±------±--------------±---------±--------±-----±-----±------------+
2)from子句中的子查询
mysql> explain select id from (select id from film) as der;
±—±------------±-----------±------±--------------±---------±--------±-----±-----±------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
±—±------------±-----------±------±--------------±---------±--------±-----±-----±------------+
| 1 | PRIMARY | | ALL | NULL | NULL | NULL | NULL | 2 | NULL |
| 2 | DERIVED | film | index | NULL |idx_name | 32 | NULL | 1 | Using index |
±—±------------±-----------±------±--------------±---------±--------±-----±-----±------------+
这个查询执行时有个临时表别名为der,外部 select 查询引用了这个临时表
3)union查询
mysql> explain select 1 union all select 1;
±—±-------------±-----------±-----±--------------±-----±--------±-----±-----±----------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
±—±-------------±-----------±-----±--------------±-----±--------±-----±-----±----------------+
| 1 | PRIMARY | NULL | NULL | NULL | NULL | NULL | NULL | NULL | No tables used |
| 2 | UNION | NULL | NULL | NULL | NULL | NULL | NULL | NULL | No tables used |
| NULL | UNION RESULT |
±—±-------------±-----------±-----±--------------±-----±--------±-----±-----±----------------+
union结果总是放在一个匿名临时表中,临时表不在SQL总出现,因此它的id是NULL。
ID理解是SQL执行的顺利的标识,SQL从大到小的执行,先执行的语句编号大。
ID的三种情况:
1、id相同:执行顺序由上至下
2、id不同:如果是子查询,id的序号会递增,id值越大优先级越高,越先被执行
理解是SQL执行的顺利的标识,SQL从大到小的执行,先执行的语句编号大;
3、id相同又不同(两种情况同时存在):id如果相同,可以认为是一组,从上往下顺序执行;在所有组中,id值越大,优先级越高,越先执行
查询的类型,主要是用于区分普通查询、联合查询、子查询等复杂的查询
类型 | 说明 |
---|---|
simple | 表示不需要union操作或者不包含子查询的简单select查询。有连接查询时,外层的查询为simple,且只有一个。 |
primary | 一个需要union操作或者含有子查询的select,位于最外层的单位查询的select_type即为primary。且只有一个。 |
subquery | 除了from字句中包含的子查询外,其他地方出现的子查询都可能是subquery |
dependentsubquery | 与dependent union类似,表示这个subquery的查询要受到外部表查询的影响。 |
derived | from字句中出现的子查询,也叫做派生表,其他数据库中可能叫做内联视图或嵌套select。 |
union | union连接的两个select查询,第一个查询是dervied派生表,除了第一个表外,第二个以后的表select_type都是union。 |
dependentunion | 与union一样,出现在union 或union all语句中,但是这个查询要受到外部查询的影响 |
unionresult | 包含union的结果集,在union和union all语句中,因为它不需要参与查询,所以id字段为null。 |
这一列表示 explain 的一行正在访问哪个表。
显示的查询表名,如果查询使用了别名,那么这里显示的是别名。
如果不涉及对数据表的操作,那么这显示为null。
如果显示为尖括号括起来的< derivedN>就表示这个是临时表,后边的N就是执行计划中的id,表示结果来自于这个查询产生。
如果是尖括号括起来的
这列表示关联类型或访问类型,即MySQL决定如何查找表中的行。
访问类型,sql查询优化中一个很重要的指标,结果值从好到坏依次是:
依次从最优到最差分别为:system >const > eq_ref > ref > fulltext > ref_or_null > index_merge >unique_subquery > index_subquery > range > index > ALL
从最好到最差的连接类型为const、eq_reg、ref、range、indexhe和ALL
一般来说,好的sql查询至少达到range级别,最好能达到ref
NULL:mysql能够在优化阶段分解查询语句,在执行阶段用不着再访问表或索引。例如:在索引列中选取最小值,可以单独查找索引来完成,不需要在执行时访问表
具体值:
类型 | 说明 |
---|---|
system | 表中只有一行数据或者是空表,且只能用于myisam和memory表。如果是Innodb引擎表,type列在这个情况通常都是all或者index |
const | 使用唯一索引或者主键,返回记录一定是1行记录的等值where条件时,通常type是const。其他数据库也叫做唯一索引扫描。 |
eq_ref | 出现在要连接过个表的查询计划中,驱动表只返回一行数据,且这行数据是第二个表的主键或者唯一索引,且必须为not null,唯一索引和主键是多列时,只有所有的列都用作比较时才会出现eq_ref。 |
ref | 不像eq_ref那样要求连接顺序,也没有主键和唯一索引的要求,只要使用相等条件检索时就可能出现,常见与辅助索引的等值查找。或者多列主键、唯一索引中,使用第一个列之外的列作为等值查找也会出现,总之,返回数据不唯一的等值查找就可能出现。 |
fulltext | 全文索引检索,要注意,全文索引的优先级很高,若全文索引和普通索引同时存在时,mysql不管代价,优先选择使用全文索引。 |
ref_or_null | 与ref方法类似,只是增加了null值的比较。实际用的不多。 |
index_merge | 表示查询使用了两个以上的索引,最后取交集或者并集,常见and ,or的条件使用了不同的索引,官方排序这个在ref_or_null之后,但是实际上由于要读取所个索引,性能可能都不如range。 |
unique_subquery | 用于where中的in形式子查询,子查询返回不重复值唯一值。 |
index_subquery | 用于in形式子查询使用到了辅助索引或者in常数列表,子查询可能返回重复值,可以使用索引将子查询去重。 |
range | 索引范围扫描,常见于使用>,<,is null,between,in ,like等运算符的查询中。 |
index | 索引全表扫描,把索引从头到尾扫一遍,常见于使用索引列就可以处理不需要读取数据文件的查询、可以使用索引排序或者分组的查询。 |
all | 这个就是全表扫描数据文件,然后再在server层进行过滤返回符合要求的记录。 |
这一列显示查询可能使用哪些索引来查找。
explain时可能出现 possible_keys 有列,而 key 显示 NULL 的情况,这种情况是因为表中数据不多,mysql认为索引对此查询帮助不大,选择了全表查询。
如果该列是NULL,则没有相关的索引。在这种情况下,可以通过检查 where 子句看是否可以创造一个适当的索引来提高查询性能,然后用 explain 查看效果。
这一列显示mysql实际采用哪个索引来优化对该表的访问。
如果没有使用索引,则该列是 NULL。如果想强制mysql使用或忽视possible_keys列中的索引,在查询中使用 force index、ignore index。
查询中如果使用了覆盖索引,则该索引仅出现在key列表中。
select_type为index_merge时,这里可能出现两个以上的索引,其他的select_type这里只会出现一个。
表示索引中使用的字节数,查询中使用的索引的长度(最大可能长度),并非实际使用长度,理论上长度越短越好。key_len是根据表定义计算而得的,不是通过表内检索出的;=》这一列显示了mysql在索引里使用的字节数,通过这个值可以算出具体使用了索引中的哪些列。
(用于处理查询的索引长度,如果是单列索引,那就整个索引长度算进去,如果是多列索引,那么查询不一定都能使用到所有的列,具体使用到了多少个列的索引,这里就会计算进去,没有使用到的列,这里不会计算进去。留意下这个列的值,算一下你的多列索引总长度就知道有没有使用到所有的列了。要注意,mysql的ICP特性使用到的索引不会计入其中。另外,key_len只计算where条件用到的索引长度,而排序和分组就算用到了索引,也不会计算到key_len中。)
key_len计算规则如下:
字符串
char(n):n字节长度
varchar(n):2字节存储字符串长度,如果是utf-8,则长度 3n + 2
数值类型
tinyint:1字节
smallint:2字节
int:4字节
bigint:8字节
时间类型
date:3字节
timestamp:4字节
datetime:8字节
如果字段允许为 NULL,需要1字节记录是否为 NULL
索引最大长度是768字节,当字符串过长时,mysql会做一个类似左前缀索引的处理,将前半部分的字符提取出来做索引。
显示索引的那一列被使用了,如果可能,是一个常量const。
这一列显示了在key列记录的索引中,表查找值所用到的列或常量,
常见的有:const(常量),func,NULL,字段名(例:film.id)
根据表统计信息及索引选用情况,大致估算出找到所需的记录所需要读取的行数
不适合在其他字段中显示,但是十分重要的额外信息
类型 | 说明 |
---|---|
Using filesort | (排序时无法使用到索引时,就会出现这个。常见于orderby和group by语句中。) MySQL有两种方式可以生成有序的结果,通过排序操作或者使用索引,当Extra中出现了Using filesort 说明MySQL使用了后者,但注意虽然叫filesort但并不是说明就是用了文件来进行排序,只要可能排序都是在内存里完成的。大部分情况下利用索引排序更快,所以一般这时也要考虑优化查询了。使用文件完成排序操作,这是可能是ordery by,group by语句的结果,这可能是一个CPU密集型的过程,可以通过选择合适的索引来改进性能,用索引来为查询结果排序。 |
Using temporary | 用临时表保存中间结果,常用于GROUP BY 和 ORDER BY操作中,一般看到它说明查询需要优化了,就算避免不了临时表的使用也要尽量避免硬盘临时表的使用。 |
Not exists | MYSQL优化了LEFT JOIN,一旦它找到了匹配LEFT JOIN标准的行, 就不再搜索了。 |
Using index | (查询时不需要回表查询,直接通过索引就可以获取查询的数据。) 说明查询是覆盖了索引的,不需要读取数据文件,从索引树(索引文件)中即可获得信息。如果同时出现using where,表明索引被用来执行索引键值的查找,没有using where,表明索引用来读取数据而非执行查找动作。这是MySQL服务层完成的,但无需再回表查询记录。 |
Using index condition | 这是MySQL 5.6出来的新特性,叫做“索引条件推送”。简单说一点就是MySQL原来在索引上是不能执行如like这样的操作的,但是现在可以了,这样减少了不必要的IO操作,但是只能用在二级索引上。 |
Using where | 使用了WHERE从句来限制哪些行将与下一张表匹配或者是返回给用户。注意:Extra列出现Using where表示MySQL服务器将存储引擎返回服务层以后再应用WHERE条件过滤。 |
Using join buffer | 使用了连接缓存:Block Nested Loop,连接算法是块嵌套循环连接;Batched Key Access,连接算法是批量索引连接 |
impossible where | where子句的值总是false,不能用来获取任何元组 |
select tables optimized away | 在没有GROUP BY子句的情况下,基于索引优化MIN/MAX操作,或者对于MyISAM存储引擎优化COUNT(*)操作,不必等到执行阶段再进行计算,查询执行计划生成的阶段即完成优化。 |
distinct | 在select部分使用了distinc关键字 |
notables used | 不带from字句的查询或者From dual查询。 |
using union | 表示使用or连接各个使用索引的条件时,该信息表示从处理结果获取并集 |
using intersect | 表示使用and的各个索引的条件时,该信息表示是从处理结果获取交集 |
usingsort_union和usingsort_intersection | 与前面两个对应的类似,只是他们是出现在用and和or查询信息量大时,先查询主键,然后进行排序合并后,才能读取记录并返回。 |
firstmatch(tb_name) | 5.6.x开始引入的优化子查询的新特性之一,常见于where字句含有in()类型的子查询。如果内表的数据量比较大,就可能出现这个 |
loosescan(m…n) | 5.6.x之后引入的优化子查询的新特性之一,在in()类型的子查询中,子查询返回的可能有重复记录时,就可能出现这个 |
filtered | 使用explain extended时会出现这个列,5.7之后的版本默认就有这个字段,不需要使用explain extended了。这个字段表示存储引擎返回的数据在server层过滤后,剩下多少满足查询的记录数量的比例,注意是百分比,不是具体记录数。 |
执行顺序
(id = 4)、【select id, name fromt2】:select_type 为union,说明id=4的select是union里面的第二个select。
(id = 3)、【select id, name from t1where address = ‘11’】:因为是在from语句中包含的子查询所以被标记为DERIVED(衍生),where address = ‘11’ 通过复合索引idx_name_email_address就能检索到,所以type为index。
(id = 2)、【select id from t3】:因为是在select中包含的子查询所以被标记为SUBQUERY。
(id = 1)、【select d1.name, … d2 from… d1】:select_type为PRIMARY表示该查询为最外层查询,table列被标记为 “derived3”表示查询结果来自于一个衍生表(id = 3 的select结果)。
(id = NULL)、【 … union … 】:代表从union的临时表中读取行的阶段,table列的 “union 1, 4”表示用id=1 和 id=4 的select结果进行union操作。