MySQL查询优化--Explain

Explain是我们平时使用最多的MySQL优化关键字了，了解它的使用是掌握MySQL优化的基础。当在查询语句前加上Explain关键字，MySQL会展示引擎优化后的sql执行计划，除此之外，还可以在Explain后面加上Extended关键字，它可以提供额外的一些信息，我们可以通过执行计划来优化sql的执行效率。

先来看个例子，我们执行一条简单的sql来看一下Explain的输出。

MySQL给我们返回了一个表格，了解每列所代表的含义是我们优化SQL的前提。让我们分别来介绍一下。

id

代表着查询的序列号。这个序列号代表着语句执行的顺序。id相同执行顺序从上到下；id不同id值越大，优先级越高，越先被执行。

select_type

在说它之前，先来了解一下MySQL的表连接算法，下面会用到，MySQL对于表连接使用nested-loop方法，该算法表示MySQL将会在第一个表中读取一条数据，然后在第二个表、第三个表等寻找匹配的记录。当所有的表都被处理，MySQL再从第一个表继续读取下一行，如此循环。类似于嵌套for循环。

foreach rowin t1 matching range {

foreach rowin t2 matching reference key {

foreach rowin t3 {

if row satisfies join conditions,

send to client

}

}

}

说回来，该列代表着查询类型，它的值有很多，这里挑几个重要的来讲。

SIMPLE：简单查询，不包含子查询与union操作

PEIMARY：主查询，即上面我们说的nested-loop最外层的for循环

UNION：SQL中含有union查询时nested-loop的内层循环

UNION RESULT：union的结果集

SUBQUERY：子查询中的第一个查询

DERIVED：查询产生的派生表

table

这个比较直接，代表着查询使用的表名

type

这一列比较重要，这一列的值代表着SQL的执行效率的好坏，我们把常见的结果值排个序，从好到坏依次是

system：表只有一行或者查询的是系统表

const：最多有一行匹配，通常在主键精确匹配时type会为该类型，例如SELECT * FROM tbl_name WHERE primary_key=1

eq_ref：唯一性索引扫描。当连接使用索引的所有部分并且索引是PRIMARY KEY或UNIQUE NOT NULL索引时使用它，例如SELECT * FROM ref_table,other_table WHERE ref_table.key_column=other_table.column;

ref：非唯一性索引扫描。ref可用于使用=或<=>运算符进行比较的索引列。例如SELECT * FROM ref_table WHERE key_column=expr

ref_or_null：类似于ref，但是MySQL对于为空值的列做了额外的搜索，常见于解析子查询，例如SELECT * FROM ref_table WHERE key_column=expr OR key_column IS NULL

range：使用索引检索指定范围内的数据

index：会扫描整个索引树

ALL：全表扫描

一般来说我们要保证大表得查询至少要达到range级别，最好达到ref

possible_keys

指出查询可能使用的索引，注意并不是真正使用的索引

key

查询真正使用的索引。查询中若使用了覆盖索引（select 后要查询的字段刚好和创建的索引字段完全相同），则该索引仅出现在key列表中（意味着possible_keys为null）

key_len

查询使用的索引的长度

ref

显示索引的被使用列（联合索引）

rows

MySQL预计会检索的行数

filtered

按条件筛选行数的百分比

Extra

包含MySQL解析查询的一些额外信息，该列可能的值有太多，不一一介绍，只说几个比较重要的。

Using filesort：order by关键字使用了文件排序，即在无索引的列上进行排序，出现它意味着可能需要进行SQL优化

Using temporary ：为满足查询需要创建临时表，同上

Using index：表示查询使用了覆盖索引，避免访问了表的数据行，效率还可以。

一些小tips

优化SQL时都需要查看执行计划，然后对SQL进行改写，直到得到满意的type。

这里写几个基本的查询时需要注意的地方，帮助大家少走弯路。

1.关联查询时关联列长度与类型要相同，例如一个为char(10)一个为char(15)则不能使用索引

2.如果order by和group by列名不同或者来自不同的表那么将会产生临时表

3.join语句，小表驱动大表，即小表在join前，大表在join后。

4.索引最佳左前缀原则：若索引了多列，则查询时从索引最左列开始是可以使用索引的。举个例子，比如有index_a_b_c,abc三列的联合索引，查询时条件= a，条件= ab，条件= abc均可使用索引，而条件=bc或ac则无法使用索引，总结一句话“带头大哥不能丢，中间兄弟不能断”（这是BTree索引的实现上导致的，具体见我的另一篇文章MySQL中的几种索引介绍）

5.不能在索引列上做函数计算，类型转换等操作，会导致索引失效

6.尽量使用覆盖索引，少使用select *

7.like以通配符“%”开头将无法使用索引

8.关于exists与in：

select from a where exists(select from b where a.id=b.id )先执行外查询

select from a where a.id in (select from b)，先执行内查询

由上面的nested-loop表连接算法可以得到如下结论，a表比b表大用in，a比b小用exists。

9.not in与not exists使用not exists，因为后者会使用索引。

10、尽量使用覆盖索引而非二级索引，二级索引会回表

11、对于select where x = aa group by y，不要分别对x和y建立索引，而是建立xy联合索引

Join 查询总结

接下来给大家一张福利图，SQL中所有的join情形都可以在这张图里体现，一图在手，天下我有！

注：由于mysql不支持full join，所以第6条和7条查询需要改写

6改写后: 1+union+2 （注：union自带去重）

7改写后: 4+union+5

最后

SQL的改写其实是很难的一件事情（自己总被diss SQL性能差），能够进行简单的索引优化只是基础，了解官方文档是熟练掌握SQL改写的前提，所以呢有时间啃啃文档是极好的MySQL5.7官方文档。

希望大家都能在实践中不断进步，写出不被DBA diss的SQL！！！

MySQL查询优化--Explain

你可能感兴趣的:(MySQL查询优化--Explain)