再也不怕面试官问MVCC原理了

定义

MVCC即多版本并发控制,指的是在使用READ COMCOMMITTED 与 REPEATREPEATABLE READ隔离级别的事务执行普通的SELECT操作时,访问记录的版本链的过程。

它是一种用来解决读-写冲突的无锁并发控制,通俗的讲就是MVCC通过数据保存在undo日志中的历史版本,根据比较版本号来处理数据是否显示,显示哪一个版本,使得事务的读写、写读操作并发执行,从而提升系统性能

实现原理

MVCC模型在mysql中的具体实现主要是由隐藏字段,UndoLog,ReadView等去完成的。

隐藏字段

roll_pointer

每次对某条聚簇索引记录进行改动时,都会把旧的版本写入undo日志中。这个隐藏列就相当于一个指针,可以通过它找到该记录修改前的信息

trx_id

一个事务每次对某条聚簇索引进行改动时,都会把该事务的id赋值给 trx_id

记录操作该数据事务的事务ID,也可以叫它版本号,用于版本比较,从而找到快照

row_id

当创建表没有合适的索引作为聚簇索引时,会用该隐藏ID作为聚簇索引

Undo Log

Undo Log 主要用于记录数据被修改之前的日志,在表信息修改之前先会把数据拷贝到Undo Log 里,当事务进行回滚时可以通过Undo Log 里的日志进行数据还原。在MVCC多版本控制中,通过读取Undo Log的历史版本数据可以实现不同事务版本号都拥有自己独立的快照数据版本

版本链

每次更新某一条记录,都会将旧值放到一条Undo Log中(即该记录的旧版本),随着更新次数增多,所有的版本都会通过roll_pointer属性连接成一个链表,这个链表就是版本链。版本链的头节点就是当前记录的最新值。每个版本中还包含了生成该版本时对应的事务id。

ReadView

为了判断版本链中哪个版本是当前事务可见而提出的设计。

Read view 的几个重要属性:

m_ids:在生成ReadView时,当前系统中活跃的(未提交)读写事务的事务id列表

min_trx_id:在生成ReadView时,当前系统中活跃的读写事务中最小的事务id,即m_ids中的最小值

max_trx_id:在生成ReadView时,系统应该分配给下一个事务的事务id

creator_trx_id:生成该ReadView的事务的事务id

根据 Read view 的匹配规则:

1. trx_id = creator_trx_id 则显示

当前事务在访问它自己修改过的记录

2. trx_id < min_trx_id 则显示

被访问版本的trx_id小于read view中的最小活跃事务ID,表明生成该版本的事务在当前事务生成ReadView前就已经提交,所以该版本可以被当前事务访问

3. trx_id >= max_trx_id 则不显示

表明生成该版本的事务在当前事物生成ReadView后才开启,所以不能被访问

4. min_trx_id < trx_id < max_trx_id 则与活跃事务集合m_ids匹配

这种情况就说明这个数据有可能是在当前事务开始的时候还没有提交的。 所以这时候我们需要把数据的事务ID与当前ReadView 中的活跃事务集合trx_ids 匹配:

不存在: 创建ReadView时生成该版本的事务已经提交,该版本可见

存在: 创建ReadView时生成该版本的事务还是活跃的,该版本不可见

如果某个版本的数据对当前事务不可见,就会顺着版本链找到下一个版本的数据,并继续上面的判断,直到最后一个版本,如果记录的最后一个版本也不可见,那该条记录就对当前事务完全不可见,查询结果就不应该包含该条记录。

不同隔离级别的区别

在MySql中,READ COMCOMMITTED 与 REPEATREPEATABLE READ隔离级别下生成ReadView的时机是不同的。

READ COMCOMMITTED中,每次读取数据前都会生成一个ReadView

REPEATREPEATABLE READ中,只会在第一次查询时,生成一个ReadView(如果使用 START TRANSACTION WITH CONSISTENT SNAPSHOT语句开始事务,会在执行语句后立即生成一个ReadView)

二级索引如何判断

二级索引页面的Page Head有一个PAGE_MAX_TRX_ID的属性,每当对该页面中的数据进行修改时,如果执行该操作的事务的trx_id大于PAGE_MAX_TRX_ID,则会将trx_id赋值给PAGE_MAX_TRX_ID。当select语句访问某个二级索引时,先判断ReadView中的min_trx_id是否大于该页面的PAGE_MAX_TRX_ID,如果是,则该页面的所有记录对该ReadView可见,否则就需要回表找到对应的聚簇索引,再按之前的过程找到ReadView中第一个可见版本,然后判断该版本中对应的二级索引列的值是否与利用该二级索引查询时的值相同,如果相同则可见,如果不同则跳过这条记录。

你可能感兴趣的:(再也不怕面试官问MVCC原理了)