MySQL系列 - 初步认识InnoDB存储引擎

1.InnoDB引擎简单介绍

InnoDB存储引擎 支持事务,其设计目标主要面向在线事务处理(OLTP)的应用。其特点是 行锁设计、支持外键,并支持类似于Oracle的非锁定读,即默认读取操作不会产生锁。从MySQL数据库5.5.8版本开始,InnoDB存储引擎是MySql默认的存储引擎。
 
InnoDB通过使用 多版本并发控制(MVCC)来获得高并发性,并且实现了SQL标准的4种隔离级别, 默认为REPEATABLE(不可重复读)级别。
 
引出第一个问题:什么是MVVC ? (后面回答,埋下伏笔)
 
MyISAM存储引擎不支持事务、表锁设计,支持全文索引,主要面向一些OLAP数据库应用。在MySQL 5.5.8版本之前MyISAM存储引擎是默认的存储引擎。
 

2.InnoDB体系架构

体系结构内会涉及到undo和redo日志,补充undo以及redo日志,参考: https://www.cnblogs.com/xinysu/p/6555082.html

MySQL系列 - 初步认识InnoDB存储引擎_第1张图片

1.Master ThreadMaster Thread是一个非常核心的后台线程,主要负责将缓冲池中的数据异步刷新到磁盘,保证数据的一致性,包括脏页的刷新、合并插入缓冲(INSERT BUFFER)、UNDO页的回收等。

2.Io Thread 在InnoDB存储引擎中大量使用了AIO(Async IO)来处理写IO请求,这样可以极大提高数据库的性能。而IO Thread的工作主要是负责这些IO请求的回调(call back)处理。从InnoDB 1.0.x版本开始,read thread和writethread分别增大到了4个。

3. Purge Thread,事务被提交后,其所使用的undolog可能不再需要,因此需要PurgeThread来回收已经使用并分配的undo页。从InnoDB 1.2版本开始,InnoDB支持多个Purge Thread,这样做的目的是为了进一步加快undo页的回收。

3.InnoDB内的缓存池

InnoDB存储引擎是基于磁盘存储的,并将其中的记录按照的方式进行管理。在数据库系统中,由于CPU速度与磁盘速度之间的鸿沟,基于磁盘的数据库系统通常使用缓冲池技术来提高数据库的整体性能。

缓存池工作流程:

在数据库中进行读取页的操作,首先将从磁盘读到的页存放在缓冲池中,这个过程称为将页“FIX”在缓冲池中。下一次再读相同的页时,首先判断该页是否在缓冲池中。若在缓冲池中,称该页在缓冲池中被命中,直接读取该页。否则,读取磁盘上的页。对于数据库中页的修改操作,则首先修改在缓冲池中的页,然后再以一定的频率刷新到磁盘上。这里需要注意的是,页从缓冲池刷新回磁盘的操作并不是在每次页发生更新时触发,而是通过一种称为Checkpoint的机制刷新回磁盘。同样,这也是为了提高数据库的整体性能

缓冲池中缓存的数据页类型有:索引页、数据页、undo页、插入缓冲(insertbuffer)、自适应哈希索引(adaptive hash index)、InnoDB存储的锁信息(lock info)、数据字典信息(data dictionary)等。

MySQL系列 - 初步认识InnoDB存储引擎_第2张图片

查看缓存池大小:

show variables like 'innodb_buffer_pool_size'

innodb_buffer_pool_size:6442450944(6GB)

从InnoDB 1.0.x版本开始,允许有多个缓冲池实例。每个页根据哈希值平均分配到不同缓冲池实例中。这样做的好处是减少数据库内部的资源竞争,增加数据库的并发处理能力

查看缓存池个数:

show variables like 'innodb_buffer_pool_instances'

innodb_buffer_pool_instances:8

4.Checkpoint

checkpoint出现的背景:

1.缓冲池的设计目的为了协调CPU速度与磁盘速度的鸿沟。因此页的操作首先都是在缓冲池中完成的。如果一条DML语句,如Update或Delete改变了页中的记录,那么此时页是脏的,即缓冲池中的页的版本要比磁盘的新。数据库需要将新版本的页从缓冲池刷新到磁盘

2.为了避免发生数据丢失的问题,当前事务数据库系统普遍都采用了Write Ahead Log策略,即当事务提交时,先写重做日志,再修改页当由于发生宕机而导致数据丢失时,通过重做日志来完成数据的恢复。这也是事务ACID中D(Durability持久性)的要求

3.当数据库发生宕机时,数据库不需要重做所有的日志,因为Checkpoint之前的页都已经刷新回磁盘。故数据库只需对Checkpoint后的重做日志进行恢复。这样就大大缩短了恢复的时间

checkpoint触发的时机:

Checkpoint发生的时间、条件及脏页的选择等都非常复杂。而Checkpoint所做的事情无外乎是将缓冲池中的脏页刷回到磁盘。不同之处在于每次刷新多少页到磁盘,每次从哪里取脏页,以及什么时间触发Checkpoint。在InnoDB存储引擎内部,有两种Checkpoint:1)Sharp Checkpoint  2)Fuzzy Checkpoint (模糊checkpoint)

Sharp Checkpoint发生在数据库关闭时将所有的脏页都刷新回磁盘,这是默认的工作方式,即参数innodb_fast_shutdown=1。

Fuzzy CheckPoint,这里目前只看master thread这种:

Master Thread中发生的Checkpoint,差不多以每秒或每十秒的速度从缓冲池的脏页列表中刷新一定比例的页回磁盘。这个过程是异步的,即此时InnoDB存储引擎可以进行其他的操作,用户查询线程不会阻塞。

5.总结

内容从《MySQL技术内幕》整理汇总而来,下一篇文章开始梳理MySQL的索引体系。

你可能感兴趣的:(MySQL)