MySQL架构设计
下面是一张MySQL的架构图:
上方各个组件的含义如下:
Connectors
指的是不同语言中与SQL的交互
Management Serveices & Utilities:
系统管理和控制工具
Connection Pool:连接池
管理缓冲用户连接,线程处理等需要缓存的需求。
负责监听对 MySQL Server 的各种请求,接收连接请求,转发所有连接请求到线程管理模块。每一个连接上 MySQL Server
的客户端请求都会被分配(或创建)一个连接线程为其单独服务。而连接线程的主要工作就是负责 MySQL Server 与客户端的通信,
接受客户端的命令请求,传递 Server 端的结果信息等。线程管理模块则负责管理维护这些连接线程。包括线程的创建,线程的 cache 等
SQL Interface:SQL接口
接受用户的SQL命令,并且返回用户需要查询的结果。比如select from就是调用SQL Interface
Parser:命令解析器
SQL命令传递到解析器的时候会被解析器验证和解析。解析器是由Lex和YACC实现的,是一个很长的脚本。
在 MySQL中我们习惯将所有 Client 端发送给 Server 端的命令都称为 query ,在 MySQL Server
里面,连接线程接收到客户端的一个 Query 后,会直接将该 query 传递给专门负责将各种 Query
进行分类然后转发给各个对应的处理模块。
主要功能:
a . 将SQL语句进行语义和语法的分析,分解成数据结构,然后按照不同的操作类型进行分类,然后做出针对性的转发到后续步骤,以后SQL语句的传递和处理就是基于这个结构的。
b. 如果在分解构成中遇到错误,那么就说明这个sql语句是不合理的
Optimizer: 查询优化器
SQL语句在查询之前会使用查询优化器对查询进行优化。就是优化客户端请求的 query(sql语句) ,根据客户端请求的 query
语句,和数据库中的一些统计信息,在一系列算法的基础上进行分析,得出一个最优的策略,告诉后面的程序如何取得这个 query 语句的结果
他使用的是“选取-投影-联接”策略进行查询。
用一个例子就可以理解:
1
select uid,name fromuser where gender = 1;
这个select 查询先根据where 语句进行选取,而不是先将表全部查询出来以后再进行gender过滤
这个select查询先根据uid和name进行属性投影,而不是将属性全部取出以后再进行过滤
将这两个查询条件联接起来生成最终查询结果
Cache和Buffer: 查询缓存。
他的主要功能是将客户端提交 给MySQL 的 Select 类 query 请求的返回结果集 cache 到内存中,与该 query 的一个 hash 值 做
一个对应。该 Query 所取数据的基表发生任何数据的变化之后, MySQL 会自动使该 query 的Cache 失效。在读写比例非常高的应用系统中, Query Cache 对性能的提高是非常显著的。当然它对内存的消耗也是非常大的
如果查询缓存有命中的查询结果,查询语句就可以直接去查询缓存中取数据。这个缓存机制是由一系列小缓存组成的。比如表缓存,记录缓存,key缓存,权限缓存等
存储引擎接口
存储引擎接口模块可以说是 MySQL 数据库中最有特色的一点了。目前各种数据库产品中,基本上只有 MySQL
可以实现其底层数据存储引擎的插件式管理。这个模块实际上只是 一个抽象类,但正是因为它成功地将各种数据处理高度抽象化,才成就了今天 MySQL
可插拔存储引擎的特色。
注意:存储引擎是基于表的,而不是数据库。
SQL语句执行流程
连接
客户端发来一条SQL语句,监听客户端的‘连接管理模块’接收请求
将请求转发到‘连接进/线程模块’
调用‘用户模块’来进行授权检查
通过检查后,‘连接进/线程模块’从‘线程连接池’中取出空闲的被缓存的连接线程和客户端请求对接,如果失败则创建一个新的连接请求
处理
如果是查询语句则先查询缓存,检查语句是否完全匹配,接着再检查是否具有权限,都成功则直接取数据返回
上一步有失败则转交给‘命令解析器’,经过词法分析,语法分析后生成解析树
接下来是预处理阶段,处理解析器无法解决的语义,检查权限等,生成新的解析树
再转交给对应的模块处理
如果是查询还会经由‘查询优化器’做大量的优化,生成执行计划
模块收到请求后,通过‘访问控制模块’检查所连接的用户是否有访问目标表和目标字段的权限
有则调用‘表管理模块’,先是查看table cache中是否存在,有则直接对应的表和获取锁,否则重新打开表文件
根据表的meta数据,获取表的存储引擎类型等信息,通过接口调用对应的存储引擎处理
上述过程中产生数据变化的时候,若打开日志功能,则会记录到相应二进制日志文件中
结果
SQL执行完成后,将结果集返回给‘连接进/线程模块’
返回的也可以是相应的状态标识,如成功或失败等
连接进/线程模块’进行后续的清理工作,并继续等待请求或断开与客户端的连接