mysql的Explain的使用
在对某个 Query 优化过程中,须要不断地使用 Explain 来验证各种调整是否有效。所有的 Query 优化都应该充分利用它。
下面看一下在 MySQL Explain功能中展示各种信息的解释。
ID:MySQL Query Optimizer选定的执行计划中查询的序列号。
Select_type:所使用的查询类型,主要有以下这几种查询类型。
DEPENDENT SUBQUERY:子查询内层的第一个SELECT,依赖于外部查询的结果集。
DEPENDENT UNION:子查询中的UNION,且为UNION中从第二个SELECT开始的后面所有SELECT,同样依赖于外部查询的结果集。
PRIMARY:子查询中的最外层查询,注意并不是主键查询。
SIMPLE:除子查询或UNION之外的其他查询。
SUBQUERY:子查询内层查询的第一个SELECT,结果不依赖于外部查询结果集。
UNCACHEABLE SUBQUERY:结果集无法缓存的子查询。
UNION:UNION语句中第二个SELECT开始后面的所有SELECT,第一个SELECT为PRIMARY。
UNION RESULT:UNION 中的合并结果。
Table:显示这一步所访问的数据库中的表的名称。
Type:告诉我们对表使用的访问方式,主要包含如下集中类型。
all:全表扫描。
const:读常量,最多只会有一条记录匹配,由于是常量,实际上只须要读一次。
eq_ref:最多只会有一条匹配结果,一般是通过主键或唯一键索引来访问。
fulltext:进行全文索引检索。
index:全索引扫描。
index_merge:查询中同时使用两个(或更多)索引,然后对索引结果进行合并(merge),再读取表数据。
index_subquery:子查询中的返回结果字段组合是一个索引(或索引组合),但不是一个主键或唯一索引。
rang:索引范围扫描。
ref:Join语句中被驱动表索引引用的查询。
ref_or_null:与ref的唯一区别就是在使用索引引用的查询之外再增加一个空值的查询。
system:系统表,表中只有一行数据;
unique_subquery:子查询中的返回结果字段组合是主键或唯一约束。
Possible_keys:该查询可以利用的索引。如果没有任何索引可以使用,就会显示成null,这项内容对优化索引时的调整非常重要。
Key:MySQL Query Optimizer 从 possible_keys 中所选择使用的索引。
Key_len:被选中使用索引的索引键长度。
Ref:列出是通过常量(const),还是某个表的某个字段(如果是join)来过滤(通过key)的。
Rows:MySQL Query Optimizer 通过系统收集的统计信息估算出来的结果集记录条数。
Extra:查询中每一步实现的额外细节信息,主要会是以下内容。
Distinct:查找distinct 值,当mysql找到了第一条匹配的结果时,将停止该值的查询,转为后面其他值查询。
Full scan on NULL key:子查询中的一种优化方式,主要在遇到无法通过索引访问null值的使用。
Impossible WHERE noticed after reading const tables:MySQL Query Optimizer 通过收集到的统计信息判断出不可能存在结果。
No tables:Query 语句中使用 FROM DUAL或不包含任何 FROM子句。
Not exists:在某些左连接中,MySQL Query Optimizer通过改变原有 Query 的组成而使用的优化方法,可以部分减少数据访问次数。
Range checked for each record (index map: N):通过 MySQL 官方手册的描述,当 MySQL Query Optimizer 没有发现好的可以使用的索引时,如果发现前面表的列值已知,部分索引可以使用。对前面表的每个行组合,MySQL检查是否可以使用range或index_merge访问方法来索取行。
SELECT tables optimized away:当我们使用某些聚合函数来访问存在索引的某个字段时,MySQL Query Optimizer 会通过索引直接一次定位到所需的数据行完成整个查询。当然,前提是在 Query 中不能有 GROUP BY 操作。如使用MIN()或MAX()的时候。
Using filesort:当Query 中包含 ORDER BY 操作,而且无法利用索引完成排序操作的时候,MySQL Query Optimizer 不得不选择相应的排序算法来实现。
Using index:所需数据只需在 Index 即可全部获得,不须要再到表中取数据。
Using index for group-by:数据访问和 Using index 一样,所需数据只须要读取索引,当Query 中使用GROUP BY或DISTINCT 子句时,如果分组字段也在索引中,Extra中的信息就会是 Using index for group-by。
Using temporary:当 MySQL 在某些操作中必须使用临时表时,在 Extra 信息中就会出现Using temporary 。主要常见于 GROUP BY 和 ORDER BY 等操作中。
Using where:如果不读取表的所有数据,或不是仅仅通过索引就可以获取所有需要的数据,则会出现 Using where 信息。
Using where with pushed condition:这是一个仅仅在 NDBCluster存储引擎中才会出现的信息,而且还须要通过打开 Condition Pushdown 优化功能才可能被使用。控制参数为 engine_condition_pushdown 。
这里通过分析示例来看一下不同的 Query 语句通过 Explain 所显示的不同信息。
- > EXPLAIN SELECT COUNT(*),MAX(id),MIN(id) FROM user\G
- *************************** 1. row ***************************
- id: 1
- select_type: SIMPLE
- table: NULL
- type: NULL
- possible_keys: NULL
- key: NULL
- key_len: NULL
- ref: NULL
- rows: NULL
- Extra: SELECT tables optimized away
对user表的单表查询,查询类型为SIMPLE,因为既没有 UNION 也不是子查询。聚合函数 MAX、MIN及COUNT 三者需要的数据都可以通过索引直接定位得到,所以整个实现的 Extra 信息为
SELECT tables optimized away。
再来看一个稍微复杂一点的 Query,一个子查询
- > EXPLAIN SELECT name FROM groups WHERE id IN ( SELECT group_id FROM user_group WHERE user_id = 1)\G *************************** 1. row ***************************
- id: 1
- select_type: PRIMARY
- table: groups
- type: ALL
- possible_keys: NULL
- key: NULL
- key_len: NULL
- ref: NULL
- rows: 50000
- Extra: Using where
- *************************** 2. row ***************************
- id: 2
- select_type: DEPENDENT SUBQUERY
- table: user_group
- type: ref
- possible_keys: user_group_gid_ind,user_group_uid_ind
- key: user_group_uid_ind
- key_len: 4
- ref: const
- rows: 1
- Extra: Using where
通过 id 信息可以得知 MySQL Query Optimizer 给出的执行计划,首先是对 groups 进行全表扫描,第二步才访问 user_group 表,所使用的查询方式是DEPENDENT SUBQUERY,对所需数据的访问方式是索引扫描,由于过滤条件是一个整数,所以索引扫描的类型为 ref,过滤条件是 const。可以使用的索引有两个,一个是基于 user_id,另一个则是基于 group_id 的。为什么基于 group_id 的索引 user_group_gid_ind 也被列为可选索引了呢?是因为与子查询的外层查询所关联的条件是基于 group_id 的。当然,最后 MySQL Query Optimizer 还是选择了使用基于 user_id 的索引 user_group_uid_ind。