简版(自画):
1.Connectors:
指的是不同语言中与SQL的交互,c 、java等连接mysql
2 Management Serveices & Utilities:
系统管理和控制工具,备份、容灾恢复、集群等
3 Connection Pool: 连接池:
管理缓冲用户连接,线程处理等需要缓存的需求。
负责监听对 MySQL Server 的各种请求,接收连接请求,转发所有连接请求到线程管理模块。每一个连接上 MySQL Server 的客户端请求都会被分配(或创建)一个连接线程为其单独服务。而连接线程的主要工作就是负责 MySQL Server 与客户端的通信,
接受客户端的命令请求,传递 Server 端的结果信息等。线程管理模块则负责管理维护这些连接线程。包括线程的创建,线程的 cache 等。
4 SQL Interface: SQL接口:
接受用户的SQL命令,并且返回用户需要查询的结果。比如select from就是调用SQL Interface
5 Parser: 解析器:
SQL命令传递到解析器的时候会被解析器验证和解析。解析器是由Lex和YACC实现的,是一个很长的脚本。
在 MySQL中我们习惯将所有 Client 端发送给 Server 端的命令都称为 query ,在 MySQL Server 里面,连接线程接收到客户端的一个 Query 后,会直接将该 query 传递给专门负责将各种 Query 进行分类然后转发给各个对应的处理模块。
主要功能:
a . 将SQL语句进行语义和语法的分析,分解成数据结构,然后按照不同的操作类型进行分类,然后做出针对性的转发到后续步骤,以后SQL语句的传递和处理就是基于这个结构的。
b. 如果在分解构成中遇到错误,那么就说明这个sql语句是不合理的
6 Optimizer: 查询优化器:
SQL语句在查询之前会使用查询优化器对查询进行优化。就是优化客户端请求的 query(sql语句) ,根据客户端请求的 query 语句,和数据库中的一些统计信息,在一系列算法的基础上进行分析,得出一个最优的策略,告诉后面的程序如何取得这个 query 语句的结果
他使用的是“选取-投影-联接”策略进行查询。
用一个例子就可以理解: select uid,name from user where gender = 1;
这个select 查询先根据where 语句进行选取,而不是先将表全部查询出来以后再进行gender过滤
这个select查询先根据uid和name进行属性投影,而不是将属性全部取出以后再进行过滤
将这两个查询条件联接起来生成最终查询结果
7 Cache和Buffer: 查询缓存:
主要功能是将客户端提交 给MySQL 的 Select 类 query 请求的返回结果集 cache 到内存中,与该 query 的一个 hash 值 做
一个对应。该 Query 所取数据的基表发生任何数据的变化之后, MySQL 会自动使该 query 的Cache 失效。在读写比例非常高的应用系统中, Query Cache 对性能的提高是非常显著的。当然它对内存的消耗也是非常大的。
如果查询缓存有命中的查询结果,查询语句就可以直接去查询缓存中取数据。这个缓存机制是由一系列小缓存组成的。比如表缓存,记录缓存,key缓存,权限缓存等
8 、存储引擎接口:
存储引擎接口模块可以说是 MySQL 数据库中最有特色的一点了。目前各种数据库产品中,基本上只有 MySQL 可以实现其底层数据存储引擎的插件式管理。这个模块实际上只是 一个抽象类,但正是因为它成功地将各种数据处理高度抽象化,才成就了今天 MySQL 可插拔存储引擎的特色。
从图中还可以看出,MySQL区别于其他数据库的最重要的特点就是其插件式的表存储引擎。MySQL插件式的存储引擎架构提供了一系列标准的管理和服务支持,这些标准与存储引擎本身无关,可能是每个数据库系统本身都必需的,如SQL分析器和优化器等,而存储引擎是底层物理结构的实现,每个存储引擎开发者都可以按照自己的意愿来进行开发。
MySQL是通过文件系统对数据进行存储管理
MySQL从物理结构上可以分为日志文件和数据文件
1.日志文件(顺序IO):
MySQL通过日志记录了数据库操作信息和错误信息。常用的日志文件包括错误日志、二进制日志、查询日志、慢查询日志和事物Redo日志、中继日志等。
可以通过命令查看当前数据库中的日志使用信息
show variables like ‘log_%’;
错误日志(err log):
默认是开启的,而且从5.5.7以后无法关闭错误日志
记录了运行过程中遇到的所有有严重的错误的信息,以及MySQL每次启动和关闭的详细信息。
默认的错误日志名称:hostname.err
错误日志所记录的信息是可以通过log-error和log-warnings来定义的。
二进制日志:
默认是关闭的,需要通过配置:log-bin=mysql-bin进行开启。其中mysql-bin是binlog日志文件的basename,binlog 日志文件的名称:mysql-bin-000001.log
binlog记录了数据库所有的ddl语句和dml语句,但不包括select语句内容,语句以事件的形式保存,描述了数据的变更数据,binlog还包括了每个更新语句的执行时间信息,binlog主要作用是用于恢复数据,因此binlog对于灾难恢复和备份恢复来说至关重要。
如果是ddl语句,则直接记录到binlog日志,而dml语句,必须通过事物提交才能记录到binlog日志中。
binlog还用于实现mysql的主从复制
通用查询日志(general query log):
默认情况下是关闭的
由于通用查询日志会记录用户的所有操作,其中还包含增删改查等信息,在并发操作大的环境下会产生大量的信息从而导致不必要的磁盘IO,会影响mysql的性能,如若不是为了调试数据库的目的建议不要开启查询日志
慢查询日志(slow query log):
默认是关闭的。需要通过设置:slow_query_log=ON进行开启。
记录执行时间超时long_query_time秒所有的查询,便于收集查询时间较长的SQL语句
事物日志(redo/undo log):
事物日志(InnoDB特有的日志)也叫redo日志。
文件名为“ib_logfile0”和"ib_logfile1",默认存放在表空间所在目录
还有一个日志文件叫undo日志,默认存储在ib_data目录下
中继日志(relay log):
是在主从复制环境中产生的日志
主要作用是为了从机可以从中继日志中获取到主机同步过来的SQL语句,然后执行到从机中
2.数据文件(随机IO):
InnoDB数据文件:
.frm文件:主要存放与表相关的数据信息,主要包括表结构的定义信息
.idb文件:使用独享表空间存储表数据和索引信息,一张表对应一个idb文件
.idbdata文件:使用共享表空间存储表数据和索引信息,所有表共同使用一个或者多个idbdata文件。如:系统表数据
MyIsam数据文件:
.frm文件:主要存储与表相关的数据信息,主要包括表结构定义的信息
.myd文件:主要用来存储表数据信息
.myi文件:主要用来存储表数据文件中任何索引的数据树
MySQL的二进制日志比较重要,所以单拿出来讲一下他的三种格式
1.row 行
数据只要更改 就把更改的数据记录下来,基于行级别,每一行数据的变化都会记录到Binlog里面,但是并不记住原始SQL语句,因此它会记录的非常详细,日志量也比statement格式记录的多得多。在主从复制中,这样的Binlog格式不会因存储过程或触发器原因造成主从数据不一致的问题。
2.Statement 语句
记录你执行过的语句,基于SQL语句级别的Binlog,每条修改数据的SQL都会保存到Binlog里面。
3. mixed
根据更改,只能选择使用row或者statement
4.MySQL的三种复制技术:
binlog_format=Statement:基于SQL语句的复制,在MySQL5.1.4之前的版本都是基于SQL语句的复制
binlog_format=ROW:基于行的复制
binlog_Mixed:混合复制模式,基于行的复制和基于SQL语句的复制。
看你的 mysql 现在已提供什么存储引擎 :
mysql> show engines;
看你的 mysql 当前默认的存储引擎 :
mysql> show variables like ‘%storage_engine%’;
InnoDB 默认的,支持事物支持外键,且是行锁
重要引擎简介:
1、InnoDB存储引擎
InnoDB是MySQL的默认 事务型引擎 ,它被设计用来处理大量的短期(short-lived)事务。除非有非常特别的原因需要使用其他的存储引擎,否则应该优先考虑InnoDB引擎。 行级锁,适合高并发情况
2、MyISAM存储引擎
MyISAM提供了大量的特性,包括全文索引、压缩、空间函数(GIS)等,但MyISAM 不支持事务和行级锁(myisam改表时会将整个表全锁住) ,有一个毫无疑问的缺陷就是崩溃后无法安全恢复。
文章部分参考自:
https://blog.csdn.net/sinat_34385109/article/details/95894801
https://blog.csdn.net/dataiyangu/article/details/89111130