MySQL 原理(1)之整体架构

一、开篇

本系列文章主要目的是为了个人学习总结。如果你正在学习,也欢迎阅读交流,指正不足。

本系列文章将介绍 MySQL 相关原理,将从 MySQL 的架构、日志、索引、锁、事务、高可用,以及客户端技术,如 JDBC 等方面进行介绍。本文是系列文章第一篇,将介绍 MySQL 的架构。

MySQL 原理思维导图

二、MySQL 整体架构

MySQL 的架构大致分为 Server 层和存储引擎层。Server 层包含了连接器、分析器、优化器、执行器等几部分,提供了所有跨存储引擎的功能。而存储引擎则负责实际的数据存储和查询功能。MySQL 存储引擎层是插件化设计,早期版本 MySQL 使用 MyISAM 作为默认存储引擎,从 5.5.5 版本开始,使用支持事务的 InnoDB 作为存储引擎。另外比较常用的存储引擎还有 Toku,用于提供高数据压缩比的场景,如数据归档。

MySQL 整体架构

图片来源:MySQL 实战45讲

三、MySQL 各组件功能

3.1 连接器

连接器负责跟客户端建立连接、获取权限、维持和管理连接。连接命令一般是这么写的:

mysql -h$ip -P$port -u$user -p

输完命令之后,你就需要在交互对话里面输入密码。

除了直接使用 mysql 客户端工具以外,应用服务尝试用相应语言的客户端工具,如 Java 的 JDBC。当使用 JDBC 时,连接 URL 示例如下:

jdbc:mysql://[host:port]/[database][?参数名1][=参数值1][&参数名2][=参数值2]...

这里列出一些重要的 JDBC 连接 MySQL 时的参数,以及建议的设置:

  1. useUnicode 建议设置为 true。
  2. characterEncoding 建议设置为 utf8(另外数据库默认字符最好配置为 utf8mb4)。
  3. autoReconnect 是否自动连接。建议设置为 true,避免因缓存等原因导致长时间未使用连接而导致需要重连。
  4. failOverReadOnly 重连后连接是否设置为只读。建议设置为 false。

在完成经典的 TCP 握手后,连接器就要开始认证你的身份,这个时候用的就是你输入的用户名和密码。

  • 如果用户名或密码不对,你就会收到一个 "Access denied for user" 的错误,然后客户端程序结束执行。
  • 如果用户名密码认证通过,连接器会到权限表里面查出你拥有的权限。之后,这个连接里面的权限判断逻辑,都将依赖于此时读到的权限。

这就意味着,一个用户成功建立连接后,即使你用管理员账号对这个用户的权限做了修改,也不会影响已经存在连接的权限。修改完成后,只有再新建的连接才会使用新的权限设置。

客户端如果太长时间没动静,连接器就会自动将它断开。这个时间是由 MySQL 的 wait_timeout 参数控制的,默认值是8小时。因此,对于一些批处理的应用,需要注意避免应用长时间没有动作导致连接断开。当使用 Java 开发应用时,一些数据库连接池框架也有超时配置,如 HikariCP 的 idleTimeout 参数,此参数需要配置的小于 MySQL 的 wait_timeout 参数。

如果在连接被断开之后,客户端再次发送请求的话,就会收到一个错误提醒:Lost connection to MySQL server during query。这时候如果你要继续,就需要重连,然后再执行请求了。

数据库里面,长连接是指连接成功后,如果客户端持续有请求,则一直使用同一个连接。短连接则是指每次执行完很少的几次查询就断开连接,下次查询再重新建立一个。

建立连接的过程通常是比较复杂的,所以建议在使用中要尽量减少建立连接的动作,也就是尽量使用长连接。Java 有很多连接池可以使用,如 HikariCP、阿里的 Druid。

3.2 分析器

分析器的作用是解析 SQL 语句、验证语法、找出语句中各元素含义,最终生成 SQL 语法树。简单来说,分析器的作用就是让 MySQL 知道做什么?

3.3 优化器

优化器的作用是制定最高效的 SQL 执行方案,比如当涉及多个索引时,要使用哪些索引、join 查询时各表关联顺序。简单来说,优化器的作用就是让 MySQL 知道如何做?

3.4 执行器

MySQL 在知道做什么以及如何做之后,就需要正式执行 SQL 语句了,这就是执行器的功能。

执行器首先会检查权限。在权限检查通过后,执行器就会根据表定义的存储引擎,调用相应接口,进行 SQL 语句实际执行。对于查询操作 select * from T where ID=10,如果 ID 不是索引列,流程大致如下:

  1. 调用 InnoDB 引擎接口取这个表的第一行,判断 ID 值是不是10,如果不是则跳过,如果是则将这行存在结果集中;
  2. 调用引擎接口取“下一行”,重复相同的判断逻辑,直到取到这个表的最后一行。
  3. 执行器将上述遍历过程中所有满足条件的行组成的记录集作为结果集返回给客户端。

对于 ID 是索引时的查询流程,将在后续介绍索引的文章中介绍。

对于更新操作,查找数据过程与 select 语句一样,但更新操作涉及到 MySQL 的多种日志结构,将在后续介绍日志的文章中详细介绍。

3.5 存储引擎

存储引擎的作用是向 Server 的执行器提供接口,满足相应查询、存储功能。本系列主要介绍 InnoDB 引擎,具体原理将分散在日志、索引、锁、事务等篇章内。

你可能感兴趣的:(MySQL 原理(1)之整体架构)