总的来说,MySQL可以看成是二层架构,第一层我们通常叫做SQL Layer,在MySQL数据库系统处理底层数据之前的所有工作都是在这一层完成的,包括权限判断,sql解析,执行计划优化,query cache的处理等等;第二层就是存储引擎层,通常叫做Storage Engine Layer,也就是底层数据存储操作实现部分,由多种存储引擎共同组成。所以,可以用如下图来MySQL的基础架构。
初始化模块就是在MySQL Server启动的时候,对整个系统做各种各样的初始化操作,比如各种buffer,cache结构的初始化和内存空间的申请,各种系统变量的初始化设定,各种存储引擎的初始化设置,等等。
核心API模块主要是为了提供一些非常高效的底层操作功能的优化实现,包括各种底层数据结构的实现,特殊算法的实现,字符串处理,数字处理等,小文件I/O,格式化输出,以及最重要的内存管理部分。
底层网络交互模块抽象出底层网络交互所使用的接口API,实现底层数据的接收与发送,以方便其他各个模块调用,以及对一部分的维护。
任何C/S结构的软件系统,都肯定贵有自己独有的信息交换协议,MySQL也不例外。MySQL的Client & Server交互协议模块部分,实现了客户端与MySQL交互过程中的所有协议。当然这些协议都是建立在现有的OS和网络协议基础上的。
用户模块所实现的功能,主要包括用户的登陆连接权限控制和用户的授权管理。他就像MySQL的大门守卫一样,决定是否给来访者“开门”。
造访客人进门了就可以想干嘛就干嘛么?为了安全考虑,这时候就需要访问控制模块实时监控客人的每一个动作,给不同的客人以不同的权限。访问控制模块实现的功能就是根据用户模块中各用户的授权信息,以及数据库自身特有的各种约束,来控制用户对数据的访问。用户模块和访问控制模块两者结合起来,组成了MySQL整个数据库系统的权限安全管理功能。
连接管理模块负责监听对MySQL Server的各种请求,接收连接请求,转发所有连接请求到线程管理模块,每一个连接上的MySQL Server的客户端请求都会被分配(或创建)一个连接线程为其单独服务。而连接线程的主要工作就是负责MySQL Server与客户端的通信,接收客户端的命令请求,传递Server端的结果信息等。线程管理模块则负责管理维护这些连接线程,包括线程的创建,线程的cache等。
简单的来说:连接模块负责监控和转发连接请求给线程管理模块,线程管理模块负责维护连接线程,连接线程负责与MySQL Server与客户端通信。
在MySQL中我们习惯将所有的Client端发送给Server端命令都成为query,在MySQL Server里面,连接线程接收到客户端的一个query后,会直接将该query传递给专门负责将各种query进行分类然后转发给各个对应的处理模块,这个模块就是query解析和转发模块。其主要工作就是将query语句进行语义和语法解析,然后按照不同的操作类型进行分类,然后做出针对性的转发。
Query Cache模块在MySQL中是一个非常重要的模块,他的主要功能是将客户端提交给MySQL的Select类query请求的返回结果集cache到内存中,与该query的一个hash值做一个对应。该Query所取数据的基表发生任何的数据变化后,MySQL会自动使该query的Cache失效。在读写比较高的应用系统中,Query Cache对性能的提高是非常显著的。当然它对内存的消耗也是非常大的。
Query优化器,就是优化客户端请求的query,根据客户端请求的query语句,和数据库中的一些统计信息,在一系列算法的基础上进行分析,得出一个最优的策略,告诉后面的程序如何取得这个query语句的结果。
表变更管理模块主要是负责完成一些DML和DLL的query,如:update,delete,insert,create table,alter table等语句的处理。
表的状态检查,错误修复,以及优化和分析等工作都是表维护模块需要做的事情。
系统状态管理模块负责在客户端请求系统状态的时候,将各种状态数据返回给用户,像DBA经常使用show status命令,show variables命令等,所得到的结果就是这个模块返回的。
这个模块从名字上看来很容易和上面的表变更和表维护模块相混淆,但是其功能与变更以及维护模块却完全不同,大家知道,每一个MySQL的表都有一个表的定义文件,也就是*.frm文件。表管理器的主要工作就是维护这些文件,以及一个cache,该cache中的主要内容时各个表的结构信息。此外还维护table级别的锁管理。
日志记录模块主要负责整个系统级别的逻辑层的日志的记录,包括err log,binary log,show query log等。
复制模块又可以分为Master模块和Slave模块两部分,Master模块主要负责在Relication环境中读取Master端的binary日志,以及与Slave端的I/O线程交互等工作。Slave模块比Master模块索要做的事情稍多一些,在系统中主要体现在两个线程上面。一个是负责从Master请求和接收binary日志,并写入本地relay log中的I/O线程。另外一个是负责从realy log中读取相关日志事件,然后解析成可以在Slave端正确执行并得到和Master端完全相同的结果的命令并再交给Slave执行的SQL线程。
存储引擎接口模块可以说是MySQL数据库中最具有特色的一点了。目前各种数据库产品中,基本上只有MySQL可以实现底层数据存储引擎的插件式管理。这个模块实际上只是一个抽象类,但正是因为它能成功地将各种数据高度抽象化,才成就了今天MySQL可插拔存储引擎的特色。
本文参考资料:《MySQL性能调优与架构设计》