mysql MVCC事务实现原理

作者:朱庆林

大家知道MySQL中的事务是基于MVCC版本链实现的,但是MySQL对于我们来说是一个黑盒,对于底层的实现了解的不是很多。本文主要介绍MySQL中的InnoDB引擎的MVCC的实现原理,由浅到深带领大家从根上理解MySQL

InnoDB行格式

InnoDB存储引擎中记录是以行的形式存储的,这就意味着数据页(page)中保存的是一行行的数据,我们把记录在磁盘上的存放方式被称为行格式或者记录格式。到目前为止设计了4种不同类型的行格式,分别为CompactRedundantDynamicCompressed。本文只简单的介绍Compact行格式(其他的行格式大同小异,暂不做介绍)。可以通过下列命令修改、查看行格式

## 创建表设置行格式
CREATE TABLE 表名 (列的信息) ROW_FORMAT=行格式名称

## 修改行格式
ALTER TABLE 表名 ROW_FORMAT=行格式名称

##查看表行格式
SHOW TABLE STATUS LIKE "表名"
COMPACT行格式

image.png
上图为compact行格式的结构示意图,其中跟事务(MVCC)有关联的是隐藏列的内容

变长字段长度列表

mysql支持一些变长字段类型比如:VARCHAR、TEXT、BLOB等。变长字段中存储多少字节的数据是不固定的,所以我们在存储真实数据的时候需要顺便把这些数据占用的字节数也存起来。

null值列表

表中的某些列可能存储NULL值,如果把这些NULL值都放到记录的真实数据中存储会很占地方,所以Compact行格式把这些值为NULL的列统一管理起来,存储到NULL值列表

记录头信息

mysql MVCC事务实现原理_第1张图片

隐藏列
名称 描述
row_id 列id(如果表没有指定主键,该列为隐藏主键)
trx_id 事务id
roll_pointer 回滚指针、指向undo日志

SQL标准中的四种隔离级别

  • READ UNCOMMITTED:未提交读。
  • READ COMMITTED:已提交读。
  • REPEATABLE READ:可重复读。
  • SERIALIZABLE:可串行化。
事务隔离级别 脏读 不可重复读 幻读
READ UNCOMMITTED
READ COMMITTED
REPEATABLE READ
REPEATABLE READ

MVCC原理

版本链

上面介绍过行格式中有个隐藏的列(row_idtrx_idroll_pointer),其中row_id不是必须的。

  • trx_id:每次一个事务对某条聚簇索引记录进行改动时,都会把该事务的事务id赋值给trx_id隐藏列。
  • roll_pointer:每次对某条聚簇索引记录进行改动时,都会把旧的版本写入到undo日志中,然后这个隐藏列就相当于一个指针,可以通过它来找到该记录修改前的信息。
备注事务执行过程中,只有在第一次真正修改记录时(比如使用INSERT、DELETE、UPDATE语句),才会被分配一个单独的事务id,这个事务id是递增的

当前有个hero的表,查询结果下图:
mysql MVCC事务实现原理_第2张图片

假设插入该记录的事务id为80,那么此刻该条记录的示意图如下所示
mysql MVCC事务实现原理_第3张图片

之后两个事务id分别为100、200的事务对这条记录进行UPDATE操作,操作流程如下:

事务trx_id 100 事务trx_id 200
begin
begin
UPDATE hero set name="关羽"
UPDATE hero set name="张飞"
commit
UPDATE hero set name="赵云"
UPDATE hero set name="诸葛亮"
commit

此时的版本链就如下图所示,可以看到记录的修改组成了一个链表,链表中每个节点都记录了当前记录的事务id(trx_id),MVCC也是基于这些链表去实现的事务级别的4种隔离级别,也就是下面介绍的ReadView
mysql MVCC事务实现原理_第4张图片

ReadView

对于使用READ UNCOMMITTED隔离级别的事务来说,由于可以读到未提交事务修改过的记录,所以直接读取记录的最新版本就好了;对于使用SERIALIZABLE隔离级别的事务来说,规定使用加锁的方式来访问记录;对于使用READ COMMITTEDREPEATABLE READ隔离级别的事务来说,都必须保证读到已经提交了的事务修改过的记录,也就是说假如另一个事务已经修改了记录但是尚未提交,是不能直接读取最新版本的记录的,核心问题就是:需要判断一下版本链中的哪个版本是当前事务可见的。为此mysql设计出了ReadView的概念,ReadView中有4个比较重要的属性:

  • m_ids:表示在生成ReadView时当前系统中活跃的读写事务的事务id列表。
  • min_trx_id:表示在生成ReadView时当前系统中活跃的读写事务中最小的事务id,也就是m_ids中的最小值。
  • max_trx_id:表示生成ReadView时系统中应该分配给下一个事务的id值。
  • creator_trx_id:表示生成该ReadView的事务的事务id。

有了这个ReadView,这样在访问某条记录时,只需要按照下边的步骤判断记录的某个版本是否可见:

  • 如果被访问版本的trx_id属性值与ReadView中的creator_trx_id值相同,意味着当前事务在访问它自己修改过的记录,所以该版本可以被当前事务访问。
  • 如果被访问版本的trx_id属性值小于ReadView中的min_trx_id值,表明生成该版本的事务在当前事务生成ReadView前已经提交,所以该版本可以被当前事务访问。
  • 如果被访问版本的trx_id属性值大于或等于ReadView中的max_trx_id值,表明生成该版本的事务在当前事务生成ReadView后才开启,所以该版本不可以被当前事务访问。
  • 如果被访问版本的trx_id属性值在ReadView的min_trx_idmax_trx_id之间,那就需要判断一下trx_id属性值是不是在m_ids列表中,如果在,说明创建ReadView时生成该版本的事务还是活跃的,该版本不可以被访问;如果不在,说明创建ReadView时生成该版本的事务已经被提交,该版本可以被访问。

基于上面的ReadView的规则,READ COMMITTEDREPEATABLE READ有什么不同呢?

  • READ COMMITTED —— 每次读取数据前都生成一个ReadView
  • READ COMMITTED —— 在第一次读取数据时生成一个ReadView
参考资料:

MySQL技术内幕
MySQL是怎样运行的

mysql MVCC事务实现原理_第5张图片

你可能感兴趣的:(mysql MVCC事务实现原理)