继前篇博文看了这么多,终于理解了MySQL索引之后,给大家再来一篇日常开发需要用到的优化技巧。
一般有3个思考方向
1.根据慢日志定位慢查询sql
2.使用explain
等工具分析sql
执行计划
3.修改sql
或者尽量让sql
走索引
先给出步骤,后面说明
有3个步骤
1.开启慢查询日志
首先开启慢查询日志,由参数slow_query_log
决定是否开启,在MySQL
命令行下输入下面的命令:
set global slow_query_log=on;
默认环境下,慢查询日志是关闭的,所以这里开启。
2.设置慢查询阈值
set global long_query_time=1;
只要你的SQL
实际执行时间超过了这个阈值,就会被记录到慢查询日志里面。这个阈值默认是10s
,线上业务一般建议把long_query_time
设置为1s
,如果某个业务的MySQL
要求比较高的QPS
,可设置慢查询为0.1s
。发现慢查询及时优化或者提醒开发改写。一般测试环境建议long_query_time
设置的阀值比生产环境的小,比如生产环境是1s
,则测试环境建议配置成0.5s
。便于在测试环境及时发现一些效率的SQL
。
甚至某些重要业务测试环境long_query_time
可以设置为0
,以便记录所有语句。并留意慢查询日志的输出,上线前的功能测试完成后,分析慢查询日志每类语句的输出,重点关注Rows_examined
(语句执行期间从存储引擎读取的行数),提前优化。
3.确定慢查询日志的文件名和路径
show global variables like 'slow_query_log_file'
结果会发现慢日志默认路径就是MySQL
的数据目录,我们可以来看一下MySQL
数据目录
show global variables like 'datadir';
不用关注这里为什么不是MySQL 8.0
,这和版本没什么关系的。
来,直接上菜,干巴巴的定义我自己都看不下去
我们先来查看一下变量,我框出了需要注意的点
查询带有quer
的相关变量
show global variables like '%quer%';
这里设置慢查询阈值为1s
set global long_query_time=1;
可以看到已经修改过来了
但是重启mysql
客户端设置和统计慢查询日志条数就会清零,即所有配置修改会还原
命令修改配置之后,在命令行net stop mysql
关闭MySQL
服务,再net start mysql
开启MySQL
服务,接着执行show global variables like '%quer%';
会发现配置还原了。
在配置文件修改才能永久改变,否则重启数据库就还原了
数据表结构,偷懒没写comment
CREATE TABLE `person_info_large` (
`id` BIGINT UNSIGNED NOT NULL AUTO_INCREMENT,
`account` VARCHAR (10),
`name` VARCHAR (20),
`area` VARCHAR (20),
`title` VARCHAR (20),
`motto` VARCHAR (50),
PRIMARY KEY (`id`),
UNIQUE(`account`),
KEY `index_area_title`(`area`,`title`)
) ENGINE = INNODB AUTO_INCREMENT = 1 DEFAULT CHARSET = utf8
这里的数据是200W
条。请注意表结构,记住哪几个字段有索引即可,后续围绕这个表进行分析。
这个3.36s
并不是实际执行时间,实际执行时间得去慢查询日志去看Query_time
参数
可以看到Query_time: 6.337729s
,超过了1s
,所以会被记录,一个select
语句查询这么久,简直无法忍受。
图中其他的参数解释如下:
Time
:慢查询发生的时间
Query_time
:查询时间
Lock_time
:等待锁表的时间
Rows_sent
:语句返回的行数
Rows_exanined
:语句执行期间从存储引擎读取的行数
上面这种方式是用系统自带的慢查询日志查看的,如果觉得系统自带的慢查询日志不方便查看,可以使用pt-query-digest
或者mysqldumpslow
等工具对慢查询日志进行分析。
注意:有的慢查询正在执行,结果已经导致数据库负载过高,而由于慢查询还没执行完,因此慢查询日志看不到任何语句,此时可以使用show processlist
命令查看正在执行的慢查询。show processlist
显示哪些线程正在运行,如果有PROCESS权限,则可以看到所有线程。否则,只能看到当前会话线程。
根据上一节的表结构可以知道,account
是添加了唯一索引的字段。explain分析一下执行计划。
我们重点需要关注select_type
、type
、possible_keys
、key
、Extra
这些列,我们来一一说明,看到select_type
列,这里是SIMPLE
简单查询,其他值下面给大家列出。
type
列,这里是index
,表示全索引扫描
表格从上到下代表了sql
查询性能从最优到最差,如果是type
类型是all
,说明sql
语句需要优化。
possible_keys
代表可能用到的索引列,key
表示实际用到的索引列,以实际用到的索引列为准,这是查询优化器优化过后选择的,然后我们也可以根据实际情况强制使用我们自己的索引列来查询。
Extra
列,这里是Using index
一定要注意,Extra
中出现Using filesort
、Using temporary
代表MySQL
根本不能使用索引,效率会受到严重影响,应当尽可能的去优化。
出现Using filesort
说明MySQL
对结果使用一个外部索引排序,而不是从表里按索引次序读到相关内容,有索引就维护了B+
树,数据本来就已经排好序了,这说明根本没有用到索引,而是数据读完之后再排序,可能在内存或者磁盘上排序。也有人将MySQL
中无法利用索引的排序操作称为“文件排序”。
出现Using temporary
表示MySQL
在对查询结果排序时使用临时表,常见于order by
和分组查询group by
回到上一个话题,我们看到account
是添加了唯一索引的字段。explain
分析了执行计划后
直接按照account
降序来查
查看慢查询日志发现,使用索引之后,查询200W
条数据的速度快了2s
接着我们分析一下查询name
的sql
执行计划
然后给name
字段加上索引
加上索引之后,继续看看查询name
的sql
执行计划
对比一下前面name
不加索引时的执行计划就会发现,加了索引后,type
由ALL
全表扫描变成index
索引扫描。order by
并没有 using filesort
,而是using index
,这里B+
树已经将这个非聚集索引的索引字段的值排好序了,而不是等到查询的时候再去排序。
接着我们继续执行查询语句,此时name
已经是添加了索引的。
结果发现,name
添加索引之前,降序查询name
是花费6.337729s
,添加索引之后,降序查询name
花费了3.479827s
,原因就是B+
树的结果集已经是有序的了。
查询一下数据的条数,这里count(id)
,分析一下sql
执行计划
这里实际使用的索引是account
唯一索引。
分析一下:实际使用哪个索引是查询优化器决定的,B+
树的叶子结点就是链表结构,遍历链表就可以统计数量,但是这张表,有主键索引、唯一索引、普通索引,优化器选择了account
这个唯一索引,这肯定不会使用主键索引,因为主键索引是聚集索引,每个叶子包含具体的一个行记录(很多列的数据都在里面),而非聚集索引每个叶子只包含下一个主键索引的指针,很显然叶子结点包含的数据是越少越好,查询优化器就不会选择主键索引
我们可以用force index
强制指定索引,然后去分析执行计划看看哪个索引是更好的,因为查询优化器选择索引不一定是百分百准确的,具体情况可以根据实际场景分析来确定是否使用查询优化器选择的索引。