mysql实战(一) 一条SQL查询语句的执行过程

基础架构图
Mysql的逻辑架构图

大体来说,Mysql可以分为Server层和存储引擎层两部分。

Server层包括连接器、查询缓存、分析器、优化器、执行器等,涵盖Mysql的大多数核心服务功能,以及所有的内置函数(如时间、日期、数学和加密函数等),所有跨存储引擎的功能都在这一层实现,比如存储过程、触发器、视图等。

存储引擎层负责数据的存储和提取。其架构模式是插件式的,支持InnoDB、MyISAM、Memory等多个存储引擎。最常用的是InnoDB,MySQL 5.5.5 版本以后成为了默认存储引擎。可在建表时指定引擎类型。

从图中可以看出,不同的存储引擎层公用一个Server层,也就是从连接器到执行器的部分。

接下来,我们从一条sql语句的执行过程来看整体。如下:

mysql> select * from T where ID=10;

一、连接器

第一步,你会先连接到数据库上,这时候接待你的就是连接器,它负责跟客户端建立连接、获取权限、维持和管理连接。连接命令一般这么写:

mysql -h$ip -P$port -u$user -p

输完命令之后,需要在交互对话里输入密码。连接成功之后,若没有后续动作则这个连接就处于空闲状态,可以在 show processlist命令中看到它,下图中 Command 列显示为“Sleep”的这一行,就表示系统里有一个空闲连接。

show processlist

客户端如果长时间没动静,连接器会将其断开。这个时间由wait_timeout参数控制,默认八小时。

  • 长连接: 指客户端持续有请求,则一直使用同一连接。
  • 短连接: 指每次执行完很少的几次查询就断开连接,下次查询再重新建立。

为了减少建立连接,建议使用长连接。但是全部使用长连接之后,可能会发现MySQL内存占用涨幅迅速,这是因为MySQL在执行过程中,使用的内存是管理在连接对象里的,这些资源只有在断开连接时才会被释放。所以如果长连接累积下来,可能导致内存占用过大,被系统强杀(OOM),从先现象上看就是MySQL异常重启了。

考虑以下两种方案解决这个问题:

  1. 定期断开长连接,之后查询再重连。
  2. MySQL5.7 级以上版本,可以在每次执行一个较大操作后通过执行mysql_reset_connection来重新初始化连接资源,回到连接刚创建时的状态。

二、查询缓存

连接建立后,就可以执行select语句了。执行逻辑来到第二步,查询缓存。 MySQL拿到查询请求会先查看缓存,一般缓存key为查询语句,value为查询结果。若没有对应缓存,则继续后面的步骤。执行完成将结果存入查询缓存。

但是大多数情况不建议使用查询缓存,因为往往弊大于利。查询缓存的命中率非常低,只有有对一个表的更新,这个表所有查询缓存都会被清空。MySQL 5.8以后删掉了查询缓存的整块功能。

三、分析器

这条sql要做什么

如果没有命中缓存,就要开始真正执行语句了。MySQL需要对sql语句解析。
分析器首先会做“词法分析”, 例如识别“select”关键字,“ID”识别为“列ID”。
接着是“语法分析”, 语法分析器根据词法分析的结果判断是否满足MySQL语法。

错误示范:
mysql> elect * from t where ID=10;

ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'elect * from t where ID=10' at line 1

四、优化器

这条sql要怎么做

优化器是在表里有多个索引时,决定使用哪个索引;或者在一个语句有多表关联时,决定各个表的连接顺序。优化器选择最优方案。

五、执行器

真正的执行阶段

开始执行前,要先判断你对这个表是否具有执行查询的权限。如果没有,会返回没有权限的错误信息。如果有权限,执行器会根据表的引擎定义,去使用这个引擎提供的接口。比如这个例子中的表T中,ID字段没有索引,执行器的执行过程是这样的:

  1. 调用InnoDB引擎取表的第一行,判断ID是否是10, 不是则跳过,如果是则将这行存到结果集中。
  2. 调用引擎接口取表的“下一行”,重复1的逻辑,直到取到最后一行。
  3. 执行器将上述遍历过程中所有满足条件的行组成的结果集返回。

至此,这个select语句就执行完成了。
可以在数据库的慢查询日志中看到一个rows_examined的字段,表示这个语句执行过程中扫描了多少行。这个值是执行器每次调用引擎获取数据行的时候累加的。在有些场景下,执行器调用一次,在引擎内部扫描了很多行,因此引擎扫描行数与rows_examined不是完全相同的,后面的总结中会有说明。

本文是对极客时间中林晓斌老师的《Mysql实战45讲》的笔记总结,长期更新。
如有侵权,请联系我立刻删除。

你可能感兴趣的:(mysql实战(一) 一条SQL查询语句的执行过程)