MySQL实战45讲 学习笔记 01 | 基础架构:一条SQL查询语句是如何执行的?

MySQL逻辑架构图

MySQL逻辑架构图(出自极客时间-MySQL实战45讲)

从图中就可以看出来MySQL大体架构分了两层,server层和存储引擎。

server层有管理数据库连接,控制客户端权限的连接器、提高查询性能的查询缓存、对SQL语句进行解析的分析器、执行SQL计划生成的优化器、根据计划操作存储引擎接口取数据的执行器。

存储引擎则负责数据的存储和提取。存储引擎是插件式的架构模式,支持InnoDB,MyISAM、Memory等多个引擎。



server层

连接器

我们访问数据库首先接触的是连接器,连接器负责跟客户端建立连接、获取权限、维持、管理连接。连接命令如下:

mysql -h连接地址 -P端口 -u用户名 -p密码

如用户名或密码不对,会返回错误"Access denied for user"的错误。如正确的话,连接器会在权限表里查出你所拥有的权限。之后,这个连接里面的权限判断逻辑,都将依赖与此时读到的权限。(注意:也就是说,当一个用户成功建立连接后,权限的变更不会影响已经存在连接的权限,只有建立新的连接才会使用新的权限设置。)

查看连接的信息

show processlist

结果:sleep为空闲的连接

show processlist

客户端如长时间没有动静,连接器会自动断开,默认为8小时,有系统变量 wait_timeout 控制。

客户端连接在断开后进行请求,会返回错误:Lost connection to MySQL server during query。要继续执行请求必须重连。

在数据库中有长连接和短连接之分,因建立连接的过程比较复杂,所以应当减少建立连接的动作,也就是尽量使用长连接。

但长连接一直运行,资源会占用越来越多,内存会涨得特别快。只有断开连接资源才能释放。

对于这个问题,作者给出了两种方案。

1. 定期断开长连接,要查询再重连。

2. 如果MySQL版本是 5.7或更新,可使用mysql_reset_connection函数来重新初始化连接资源。

查询缓存

连接建立成功后,第二步就是:查询缓存。

当我们执行查询SQL语句时,会把SQL语句作为key,结果集作为value,存入缓存,等下次来请求直接取缓存,就不用后面的复杂操作了,从而提高性能。但在MySQL8.0之后会彻底删除这个功能。

为什么要删除?因为这个功能弊大于利。

1. 要命中缓存,SQL语句必须一模一样,例如 SELECT id FROM user 与 select id from user就不行,特别是用now()时间函数,就更加不行了。

2. 当一个表的数据有更新时,关于这个表所有的缓存都会被清除,对于更新频繁的系统关掉这个功能,性能还比开启要好些,这样就不会去查询判断是否有缓存。

一般来说查询缓存用在长时间不变的静态表里面会比较好。

#MySQL查询缓存参数 0关闭 1打开 2按需求来 表示只要select中明确指定SQL_CACHE才缓存

select SQL_CACHE * from T where ID=10;

show global VARIABLES like 'query_cache_type';

#与查询缓存相关的系统变量

#have_query_cache 表示这个MySQL版本是否支持查询缓存

#query_cache_limit 表示单个结果集所被允许缓存的最大值

#query_cache_min_res_unit 每个被缓存的结果集要占用的最小内存

#query_cache_size 用于查询缓存的内存大小

show global variables like 'have_query_cache';

show global variables like 'query_cache_limit';

show global variables like 'query_cache_min_res_unit';

show global variables like 'query_cache_size';

#如何监控查询缓存的命中率

#查询缓存目前剩余空间大小

show status like 'qcache_free_memory';

#查询缓存命中次数

show status like 'qcache_hits';

#查询未命中时插入缓存的次数

show status like 'qcache_inserts';

分析器

分析器做了两件事情,一件是词法分析、一件是语法分析。

词法分析,分析的是每个字符串是什么意思,比如 select id from T;"select"代表是一个查询语句、"id"为一个列,"T"是一个表名。

语法分析,分析的是看你的说SQL语句是否符合MySQL的语法,如不符合返回 “You have an error in your SQL syntax” ,一般语法错误会提示第一个出现错误的位置,所有只要关注"use near"后面的内容。

优化器

优化器做的是传过来的SQL语句应该怎样执行,以什么样的顺序执行,索引怎么选择。举一个栗子:

select * from t1 join t2 using(ID) where t1.c=10 and t2.d=20;

像这个SQL语句就有两种运行模式,一种是从t1表取c列等于10,再关联t2表,再去d列等于20的数据,还有一种是从t2表d列等于20,再关联t1表,再去取c列等于10的数据,虽然结果是一样的,但效率有所不同。包括表里有多个索引,索引会怎么选择,会不会选择错误等后面的章节都会介绍。

执行器

MySQL通过分析器知道你要做什么,优化器知道怎么做,接下来就是执行了,在执行之前会check一下你有没有权限查询这张表(包括查询缓存的时候也会验证你的权限),这里有个问题就是为什么检查权限要放在执行器来做,而不在分析器的时候就check掉?作者的回答是:有些时候,SQL语句要操作的表不只是SQL字面上那些。比如如果有个触发器(触发器是由某个事件激活调用程序,比如insert、update、delete,可以用来做数据同步),得在执行器阶段(过程中)才能确定。优化器阶段前是无能为力的。

检查完权限后,执行器会调用引擎里面定义好的接口,去获取符合条件的数据,判断条件从第一行到最后一行(题外话,当你获取的数据确定只有一行的时候,可加上limit 1,这样就不会进行后面的判断)。

在数据库的慢查询日志(记录超过规定时间的查询SQL语句)中有一个字段叫 rows_examined ,表示在执行过程中扫描了多少行,但作者说在有些场景下扫描行数与这个字段并不是完全相同的。后面的篇章会讲。

show variables like 'slow_query%';

#是否开启慢查询日志

slow_query_log

#慢查询日志文件地址

slow_query_log_file

#超过多少秒日志才记录

show variables like 'long_query_time';

小结

对于小编说的不对的地方请读者多理解,多包涵,还是推荐大家去看看原文章(极客时间-MySQL实战45讲),作者是前阿里资深技术专家,还是有点东西的。

你可能感兴趣的:(MySQL实战45讲 学习笔记 01 | 基础架构:一条SQL查询语句是如何执行的?)