一、什么是Explain?
1.使用explain可以模拟优化器执行SQL查询语句,从而知道MySQL怎么处理你的SQL语句的,分析你的查询语句和表结构的性能瓶颈。
二、Explain能做什么?
- 读取表的顺序
- 哪些索引能够被使用
- 数据读取操作的操作类型
- 哪些索引能够被实际使用
- 表之间的引用
- 每张表有多少行被物理查询
三、Explain使用的表
1.blog_blog、blog_blogtype、user三个表,其中blog表使用外键一对一关联另外两个表,具体如下
四、Explain使用举例
1.执行语句1(查询博客类型为随笔且作者名称为老胡的博客)
EXPLAIN
SELECT * FROM blog_blog blog WHERE blog.blog_type_id IN (
SELECT id FROM blog_blogtype blogtype WHERE type_name = '随笔'
)
AND blog.author_id = (SELECT id FROM USER WHERE user_name = '老胡')
2.执行结果(部分截图)
3.id、table字段:通过这两个字段我们可以判断出你的每一条SQL语句的执行顺序和表的查询顺序。在截图中,id优先级更高,因此第一个查询的是user表;当id相同时,怎么看顺序呢?自上而下
,如这里的id都是1,则自上而下查询的第二个查询的表是blog,第三个表是blogtype
4.type字段(画重点)
:下面的代码从左到右,越靠近左边越优秀
NULL > system > const > eq_ref > ref > ref_or_null > index_merge > range > index > ALL
①NULL:MySQL能够在优化阶段分解查询语句,在执行阶段用不着再访问表或索引,比如我们知道MySQL底层是B+树,叶子节点的第一个就是最大的id值,那么我们很容易查询到最大的id(当id为主键时会默认创建主键索引),所以不用访问表或索引
//由于存在主键索引,则type为NULL
EXPLAIN SELECT MAX(id) FROM blog_blog
//由于该字段不存在索引,则type为All
EXPLAIN SELECT MAX(title) FROM blog_blog
因此我们得出结论:NULL的前提是已经建立了索引
②SYSTEM :只有一行记录(等于系统表),这是const类型的特列,平时不大会出现,可以忽略。
③const :表示通过索引一次就找到了,const用于比较primary key或uique索引,因为只匹配一行数据,所以很快,如主键置于where列表中,MySQL就能将该查询转换为一个常量。
//根据索引查询一次得到结构,type类型为const
//TODO:为啥id=1和id=2的时候type的类型为NULL?
EXPLAIN SELECT * FROM blog_blog WHERE id = 3
④eq_ref :用于联表查询的情况,按联表的主键或唯一键联合查询。
多表join时,对于来自前面表的每一行,在当前表中只能找到一行
。这可能是除了system和const之外最好的类型。当主键或唯一非NULL
索引的所有字段都被用作join联接时会使用此类型。
//blogtype中的id值是主键(不可重复),所以满足blogtype的表的类型为eq_ref
EXPLAIN SELECT * FROM blog_blog blog LEFT JOIN blog_blogtype blogtype ON blog.blog_type_id = blogtype.id
⑤ref :可以用于单表扫描或者连接。如果是连接的话,驱动表的一条记录能够在被驱动表中通过非唯一(主键)
属性所在索引中匹配多行数据
,或者是在单表查询的时候通过非唯一(主键)属性所在索引中查到一行数据。
//1.在连接中,不懂的同学可以和上面的eq_ref对比着看
//blogtype中的id值不是主键(可重复),一个blog_type_id可能对应着好几个blogtype.id
EXPLAIN SELECT * FROM blog_blog blog LEFT JOIN blog_blogtype blogtype ON blog.blog_type_id = blogtype.id
//2.在单表查询中,我们对blog中的title属性建立普通索引
CREATE INDEX index_title ON blog_blog (title(50))
//注意,这里的title是有索引的,且不是主键,且不唯一
EXPLAIN SELECT * FROM blog_blog WHERE title = "随笔2"
⑥ref_or_null 类似ref,但是可以搜索值为NULL的行
EXPLAIN SELECT * FROM blog_blog WHERE title = "随笔2" OR title IS NULL
⑦index_merge :表示查询使用了两个以上的索引,最后取交集或者并集,常见and ,or的条件使用了不同的索引,官方排序这个在ref_or_null之后,但是实际上由于要读取多个索引,性能可能大部分时间都不如range。
//这里同时使用了主键索引id和普通索引title
EXPLAIN SELECT * FROM blog_blog WHERE title = "随笔2" OR id = 2
⑧range :索引范围查询,常见于使用 =, <>, >, >=, <, <=, IS NULL, <=>, BETWEEN, IN()或者like等运算符的查询中。
//有索引且是范围查询
EXPLAIN SELECT * FROM blog_blog WHERE blog_type_id > 1
⑨index :index只遍历索引树,通常比All快。因为,索引文件通常比数据文件小,也就是虽然all和index都是读全表,但index是从索引中读取的,而all是从硬盘读的
//有索引但需要遍历索引树
EXPLAIN SELECT id FROM blog_blog
⑩ALL:如果一个查询的type是All,并且表的数据量很大,那么请解决它!
5.possible_keys:可能使用的索引
6.key:实际使用的索引
7.ref:显示哪些列被使用了
8.rows和filter:
- rows是根据表的统计信息和索引的选用情况,优化器大概帮你估算出你执行这行函数所需要查询的行数。
- Filter是查询的行数与总行数的比值。其实作用与rows差不多,都是数值越小,效率越高。
9.extra:很重要但是在其他列不适合显示的额外信息