1.mysql执行流程简介

文章目录

  • 一.mysql的逻辑架构图
  • 二.service层各个组件
      • 1.连接器
        • 自动断开连接
        • 长连接
      • 2.查询缓存(mysql 8.0之前)
      • 3.分析器
        • 词法分析
        • 语法分析
      • 4.优化器
      • 5.执行器

一.mysql的逻辑架构图

1.mysql执行流程简介_第1张图片
从图中可以看出mysql主要分为service层和引擎层
service层:Server 层包括连接器、查询缓存、分析器、优化器、执行器等,涵盖 MySQL 的大多数核
心服务功能,以及所有的内置函数(如日期、时间、数学和加密函数等),所有跨存储引擎
的功能都在这一层实现,比如存储过程、触发器、视图等。

不同的引擎共用一个service层,不同的引擎会采用相同的service层,即连接器到执行器的部分。

引擎层:而存储引擎层负责数据的存储和提取。其架构模式是插件式的,支持 InnoDB、MyISAM、
Memory 等多个存储引擎。现在最常用的存储引擎是 InnoDB,它从 MySQL 5.5.5 版本开
始成为了默认存储引擎。
在mysql5.5.5后,MySQL默认的存储引擎是innoDB,每张表可以使用不同的存储引擎,如何在建表的时候指定存储引擎?
在create table的末尾使用engine=memory,memory也是一种存储引擎。
以下对service中的每一个组件进行详细的介绍

二.service层各个组件

1.连接器

第一步,你会先连接到这个数据库上,这时候接待你的就是连接器。连接器负责跟客户端建
立连接、获取权限、维持和管理连接。连接命令一般是这么写的:

mysql -h$ip -P$post -u$user -p

注意这里密码可以直接跟在p后,但是不建议这样做,尤其是连接生产服务器时,有泄露密码的风险

连接命令中的 mysql 是客户端工具,用来跟服务端建立连接。在完成经典的 TCP 握手后,
连接器就要开始认证你的身份,这个时候用的就是你输入的用户名和密码。

如果用户名或密码不对,你就会收到一个"Access denied for user"的错误,然后客户端
程序结束执行

如果用户名密码认证通过,连接器会到权限表里面查出你拥有的权限。之后,这个连接里
面的权限判断逻辑,都将依赖于此时读到的权限。

这就意味着,一个用户成功建立连接后,即使你用管理员账号对这个用户的权限做了修改, 也不会影响已经存在连接的权限。修改完成后,只有再新建的连接才会使用新的权限设置

连接完成后,如果你没有后续的动作,这个连接就处于空闲状态,你可以在 show
processlist 命令中看到它。文本中这个图是 show processlist 的结果,其中的
Command 列显示为“Sleep”的这一行,就表示现在系统里面有一个空闲连接

1.mysql执行流程简介_第2张图片
其中可以看到5是一个空闲连接,因为其通过连接后什么事也没做。6就是我们当前的这个客户端,执行了一个show processlist命令,不是空闲接连。

自动断开连接

客户端如果太长时间没动静,连接器就会自动将它断开。这个时间是由参数 wait_timeout
控制的,默认值是 8 小时。
如果在连接被断开之后,客户端再次发送请求的话,就会收到一个错误提醒: Lost
connection to MySQL server during query。这时候如果你要继续,就需要重连,然后
再执行请求了。

长连接

数据库里面,长连接是指连接成功后,如果客户端持续有请求,则一直使用同一个连接。
连接
则是指每次执行完很少的几次查询就断开连接,下次查询再重新建立一个。

建立连接的过程通常是比较复杂的(大多数连接都是消耗性能时间的,因为其涉及到了tcp连接等操作),所以我建议你在使用中要尽量减少建立连接的动作,也就是尽量使用长连接。

但是全部使用长连接后,你可能会发现,有些时候 MySQL 占用内存涨得特别快,这是因
为 MySQL 在执行过程中临时使用的内存是管理在连接对象里面的。这些资源会在连接断
开的时候才释放。所以如果长连接累积下来,可能导致内存占用太大,被系统强行杀掉
(OOM),从现象看就是 MySQL 异常重启了。
那么如何解决mysql因长连接占用内存长得非常快呢?
一:定期断开长连接。使用一段时间,或者程序里面判断执行过一个占用内存的大查询后,
断开连接,之后要查询再重连(当然这个断开时间要衡量好,不然会退化为断连接)
二:如果使用是 MySQL 5.7 或更新版本,可以在每次执行一个比较大的操作后,通过执行
mysql_reset_connection 来重新初始化连接资源。这个过程不需要重连和重新做权限验
证,但是会将连接恢复到刚刚创建完时的状态。(即不需要通过连接器,优化了因网络连接等消耗的性能)

这里补充一下,mysql_reset_connection会造成哪些影响

  1. 回滚活跃的事务并重新设置自动提交模式
  2. 释放所有表锁
  3. 关闭或删除所有的临时表
  4. 重新初始化会话的系统变量值
  5. 丢失用户定义的设置变量
  6. 释放prepare语句
  7. 关闭handler变量
  8. 将last_insert_id()值设置为0
  9. 释放get_lock()获取的锁
  10. 清空通过mysql_bind_param()调用定义的当前查询属性

2.查询缓存(mysql 8.0之前)

连接建立完成后,你就可以执行 select 语句了。执行逻辑就会来到第二步:查询缓存。
MySQL 拿到一个查询请求后,会先到查询缓存看看,之前是不是执行过这条语句。之前执
行过的语句及其结果可能会以 key-value 对的形式,被直接缓存在内存中key 是查询的
语句,value 是查询的结果。如果你的查询能够直接在这个缓存中找到 key,那么这个
value 就会被
直接返回给客户端。

如果语句不在查询缓存中,就会继续后面的执行阶段。执行完成后,执行结果会被存入查询
缓存中。你可以看到,如果查询命中缓存,MySQL 不需要执行后面的复杂操作,就可以直
接返回结果,这个效率会很高

但是大多数情况下我会建议你不要使用查询缓存,为什么呢?因为查询缓存往往弊大于利。

查询缓存的失效非常频繁,只要有对一个表的更新,这个表上所有的查询缓存都会被清空。
因此很可能你费劲地把结果存起来,还没使用呢,就被一个更新全清空了。对于更新压力大
的数据库来说,查询缓存的命中率会非常低。除非你的业务就是有一张静态表(即很少进行增删改),很长时间才
会更新一次。比如,一个系统配置表,那这张表上的查询才适合使用查询缓存。

好在 MySQL 也提供了这种“按需使用”的方式。你可以将参数 query_cache_type 设置
成 DEMAND,这样对于默认的 SQL 语句都不使用查询缓存。而对于你确定要使用查询缓
存的语句,可以用 SQL_CACHE 显式指定,像下面这个语句一样:

 mysql> select SQL_CACHE * from T where ID=10;

注意:在MySQL 8.0 版本已经移除了查询缓存的功能,不能在使用了(若使用就会报语法错误)。

3.分析器

如果没有命中查询缓存,就要开始真正执行语句了。首先,MySQL 需要知道你要做什么,
因此需要对 SQL 语句做解析。

词法分析

分析器先会做“词法分析”。你输入的是由多个字符串和空格组成的一条 SQL 语句,
MySQL 需要识别出里面的字符串分别是什么,代表什么。
MySQL 从你输入的"select"这个关键字识别出来,这是一个查询语句。它也要把字符
串“T”识别成“表名 T”,把字符串“ID”识别成“列 ID”。
即词法分析阶段分析sql语句中每个词的含义,包括字段等。

语法分析

做完了这些识别以后,就要做“语法分析”。根据词法分析的结果,语法分析器会根据语法
规则,判断你输入的这个 SQL 语句是否满足 MySQL 语法。(将这些词语组合在一起是否会出现语法问题)
如果你的语句不对,就会收到“You have an error in your SQL syntax”的错误提醒,比
如下面这个语句 select 少打了开头的字母“s”。

一般语法错误会提示第一个出现错误的位置,所以只需要查看报错位置的前面就可以轻松地找出问题所在。

4.优化器

优化器是在表里面有多个索引的时候,决定使用哪个索引(暂不详讲);或者在一个语句有多表关联
(join)的时候,决定各个表的连接顺序

5.执行器

MySQL 通过分析器知道了你要做什么,通过优化器知道了该怎么做,于是就进入了执行器
阶段,开始执行语句。
开始执行的时候,要先判断一下你对这个表 T 有没有执行查询的权限,如果没有,就会返
回没有权限的错误,如下所示 (在工程实现上,如果命中查询缓存,会在查询缓存返回结果
的时候,做权限验证。查询也会在优化器之前调用 precheck 验证权限)

mysql> select * from T where ID=10;
ERROR 1142 (42000): SELECT command denied to user 'b'@'localhost' for table 'T'

如果有权限,就打开表继续执行。打开表的时候,执行器就会根据表的引擎定义,去使用这
个引擎提供的接口

比如我们这个例子中的表 T 中,ID 字段没有索引,那么执行器的执行流程是这样的:

  1. 调用 InnoDB 引擎接口取这个表的第一行,判断 ID 值是不是 10,如果不是则跳过,如
    果是则将这行存在结果集中;
  2. 调用引擎接口取“下一行”,重复相同的判断逻辑,直到取到这个表的最后一行。
  3. 执行器将上述遍历过程中所有满足条件的行组成的记录集作为结果集返回给客户端。
    至此,这个语句就执行完成了。

对于有索引的表,执行的逻辑也差不多。第一次调用的是“取满足条件的第一行”这个接
口,之后循环取“满足条件的下一行”这个接口,这些接口都是引擎中已经定义好的。
你会在数据库的慢查询日志中看到一个 rows_examined 的字段,表示这个语句执行过程中
扫描了多少行。这个值就是在执行器每次调用引擎获取数据行的时候累加的。
在有些场景下,执行器调用一次,在引擎内部则扫描了多行,因此引擎扫描行数跟
rows_examined 并不是完全相同的。

小问:
语句 select * from T where k=1,报“不存在这个列”的错误: “Unknown column ‘k’ in
‘where clause’”。你觉得这个错误是在我们上面提到的哪个阶段报出来的呢?

答案:
分析器的词法分析阶段


本文章参考极客时间mysql之45讲笔记。

你可能感兴趣的:(mysql之45讲,spring,boot,java,服务器,mysql)