官方文档:Understanding the Query Execution Plan
SQL优化的一般步骤:先查询mysql数据库运行状况,然后定位慢查询,再分析sql的执行过程,最后根据情况采取相应的优化措施。
一、定位慢查询
1.使用show status查询数据库的运行状况
//显示数据库运行状态 SHOW STATUS //显示数据库运行总时间 SHOW STATUS LIKE 'uptime' //显示连接的次数 SHOW STATUS LIKE 'connections' //显示执行CRUD的次数 SHOW STATUS LIKE 'com_select' SHOW STATUS LIKE 'com_insert' SHOW STATUS LIKE 'com_update' SHOW STATUS LIKE 'com_delete'
2.定位慢查询sql
我们可以通过mysql来记录慢查询,一旦有sql执行时间超过了设置的慢查询时间,就会被记录到慢查询日志中。这样我们就可以从慢查询日志中定位慢查询sql,然后进行分析优化。
查看慢查询相关信息
//显示慢查询次数 SHOW STATUS LIKE 'slow_queries' //显示慢查询时间,默认为10s SHOW VARIABLES LIKE 'long_query_time'
mysql的慢查询默认是关闭的,可以通过修改配置文件或通过命令来开启。
①修改配置文件方式
Linux下修改my.cnf,Windows下修改my.ini。修改后需要重启mysql才会生效。
#开启慢查询
slow-query-log=1
#慢查询的文件路径
slow_query_log_file="D:/Program Files/MySQL/Log/mysql-slow.log"
#慢查询时间。默认为10秒
long_query_time=10
②命令方式
也可以使用命令来修改。
【session级别】 #开启慢查询 SET slow_query_log='ON'; #设置慢查询日志存放位置 SET slow_query_log_file='/usr/local/mysql/data/slow.log'; #设置慢查询时间 SET long_query_time=3 【global级别】 SET global slow_query_log='ON'; SET global slow_query_log_file='/usr/local/mysql/data/slow.log'; SET global long_query_time=3
3.分析慢查询
在实际生产环境中,可能因为开发写了不正确的SQL语句,索引优化的不好,或其他查询操作而导致数据库整体性能下降。我们只需要分析一下慢查询日志就会知道问题出在哪。
//查看是否启用慢日志记录和状态 show variables like "%slow%"
如果慢查询日志中记录内容较多,则可以使用Mysql自带的慢查询日志分析工具mysqldumpslow工具来对慢查询日志进行分类汇总。该工具位于/mysql/bin目录下。mysqldumpslow将会自动将文本完全一致但变量不同的SQL语句视为同一个语句进行统计,变量值用N来代替。
mysqldumpslow -s r -t 10 /data/dbdata/frem-slow.log
另外,show processlist也是一个常用命令。
官方文档:13.7.5.29 SHOW PROCESSLIST Statement
show full processlist
show processlist 是显示用户正在运行的线程,需要注意的是,除了 root 用户能看到所有正在运行的线程外,其他用户都只能看到自己正在运行的线程,看不到其它用户正在运行的线程。除非单独个这个用户赋予了PROCESS 权限。
可以参考:show processlist 详解
二、使用explain分析sql执行过程
官方文档:Optimizing Queries with EXPLAIN
mysql会将慢查询记录到慢查询日志中,这时我们就可以针对这些慢查询的sql进行分析和优化,需要用到explain命令。
explain [要分析的sql]
分析结果中有如下几列:
+----+-------------+---------+------+---------------+------+---------+------+------+-------+-------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+---------+------+---------------+------+---------+------+------+-------+-------+
下面介绍各列的含义。可以参考官方文档说明:Explain Output Colums
id
表示select查询序列号。id值越大,越优先执行。如果id相同,执行顺序由上至下;
select_type
表示查询操作的类型。主要用于区分普通查询、子查询、联合查询等几种查询情况。有这些取值:simple,primary,subquery,derived,union,union result
①simple:表示简单查询,只有一个select操作,即不使用连接和union。
#只有一个select操作,所以都是简单查询 select id from emp; select id from emp join dept on emp.dept_id=dept.id;
②primary:表示主查询。子查询语句中的最外层select,或union操作的第一个select。
#子查询形式:第一个select操作为primary select * from app_school where id = (select id from app_school where id=100); #union形式:第一个select操作为primary select * from app_school where id=100 union select * from app_school where id=101;
③subquery:表示子查询。子查询语句中的内层select。
#第二个select操作为subquery select * from app_school where id = (select id from app_school where id=100);
④derived:表示FROM后跟着的select查询,会被标记为derived(导出表/衍生表)。
#第二个select操作为derived select * from (select id from app_school) t;
⑤union:表示UNION操作后面的select查询。
#第二个select操作为union select * from app_school where id=100 union select * from app_school where id=101;
⑥union result:表示获取UNION最后结果的查询。
#第一个select操作为primary #第二个select操作为union #获取最终结果的操作为union result select * from app_school where id=100 union select * from app_school where id=101;
table
表示查询用到的表。
type
表示找到匹配行用到的访问类型。最为常见的类型有system,const,eq_ref,ref,range,index,All,按照性能从高到低顺序如下:NULL-->system-->const-->eq-ref-->ref-->range-->index-->All 。一般来说,要让查询至少达到range级别,最好能达到ref级别。
②system:该表是最多仅有一行的系统表(这是const类型的一个特例)。系统表中的数据通常已经加载到了内存中,所以不需要磁盘IO。
例子1:查询系统表
例子2:内层嵌套(const)返回了一个临时表,外层嵌套从临时表中查询,其扫描类型也是system,也不需要磁盘IO。
③const:最多只有一个匹配行,所以该行中的其它列的值可以当作常量来处理。例如,根据主键primary key或唯一索引unique index进行查询。简单地说const就是直接按主键或唯一键取值。例如在②中介绍system时的举例中user表的访问类型就是const,其通过主键来取值。
④eq_ref:使用唯一索引,对于每个索引键值,表中只有一条记录匹配。简单说,就是多表连接中使用primary key或unique index作为关联条件。
注意const和eq_ref的区别:简单地说是const
是直接按主键或唯一键读取,eq_ref
用于联表查询的情况,按联表的主键或唯一键联合查询。
⑤ref:使用非唯一索引,或唯一索引的前缀扫描,返回匹配某个单独值的所有行(可能匹配多个行)。
ref还经常出现在join操作中
⑥ref_or_null:与ref类似,区别在于条件中包含对NULL的查询。
⑦index_merge:索引合并优化。
⑧unique_subquery:in的后面是一个查询主键字段的子查询。
⑨index_subquery:与unique subquery类似,区别在于in的后面是查询非唯一索引字段的子查询。
⑩range:只检索指定范围的行,使用一个索引来选择行。常见于<,<=,>,>=,between或者IN操作符。
key列显示使用了哪个索引。key_len包含所使用索引的最长关键元素。
11.index:索引全扫描。遍历整个索引来查询匹配的行。
12.ALL:全表扫描,性能最差。
possible_keys和key
possible_keys表示查询时可能使用到的索引,而key表示实际使用的索引
key_len
表示使用到的索引字段的长度
ref
表示该表的索引字段关联了哪张表的哪个字段
rows
表示扫描行的数量
Extra
表示执行情况的说明和描述。包含不适合在其它列中显示但对执行计划非常重要的额外信息。
可以参考:MySQL中explain执行计划中额外信息字段(Extra)详解
记录几个重要的:
Using index :使用覆盖索引的时候就会出现
Using where:在查找使用索引的情况下,需要回表去查询所需的数据 表示Mysql将对storage engine提取的结果进行过滤,过滤条件字段无索引;
Using index condition:查找使用了索引,但是需要回表查询数据 会先条件过滤索引,过滤完索引后找到所有符合索引条件的数据行,随后用 WHERE 子句中的其他条件去过滤这些数据行;
Using index & using where:查找使用了索引,但是需要的数据都在索引列中能找到,所以不需要回表查询数据
Using filesort:使用了文件排序。当查询语句包含ORDER BY时,如果无法使用索引来完成排序,则需要进行额外的排序操作。
Using temporary:使用临时表来保存中间结果,
三、使用show profile分析sql
官方文档:SHOW PROFILE Statement和SHOW PROFILES Statement
有时仅通过explain分析执行计划并不能很快地定位SQL的问题,这时就可以选择profile联合分析。Mysql从5.0.37开始增加了对show profiles和show profile语句的支持。
默认profile是关闭的,可以通过set开启session级别的profiling。
//查看是否支持profile SELECT @@have_profiling //开启profile(session级别) set profiling=1;
①执行select语句
②show profiles,查询该sql语句的Query ID.
③通过show profile for query语句能看到执行中线程的每个状态和消耗的时间。
show profile for query [上面的query id]
四、通过trace分析优化器如何选择执行计划
官方文档:Chapter 8 Tracing the Optimizer
Mysql5.6提供了对sql的跟踪trace,通过trace文件能够进一步了解为什么优化器选择A执行计划而不选择B执行计划,帮助我们更好地理解优化器的行为。
下面是典型的使用方式:
# 开启trace(默认关闭),设置json格式 SET OPTIMIZER_TRACE="enabled=on",END_MARKERS_IN_JSON=on; //设置内存,避免解析过程中因为默认内存过小而不能够完整显示。 SET OPTIMIZER_TRACE_MAX_MEM_SIZE=1000000; #执行sql SELECT ...; # your query here #检查INFORMATION_SCHEMA.OPTIMIZER_TRACE就知道mysql是如何执行sql的了 SELECT * FROM INFORMATION_SCHEMA.OPTIMIZER_TRACE; # 完成后,关闭trace SET optimizer_trace="enabled=off";
最后会输出一个跟踪文件。