MVCC
MVCC(Multi-Version Concurrency Control),即多版本并发控制。是 innodb 实现事务并发与回滚的重要功能。锁机制可以控制并发操作,但是其系统开销较大,而MVCC可以在大多数情况下代替行级锁,使用MVCC,能降低其系统开销.
具体实现是在数据库的每一行中,额外添加三个字段:
DB_TRX_ID
: 记录插入或更新该行的最后一个事务的事务ID
DB_ROLL_PTR
: 指向改行对应undolog
的指针
DB_ROW_ID
: 单调递增的ID,他就是AUTO_INCREMENT
的主键ID
快照读
像不加锁的select
操作就是快照读,快照读的出现是基于提高并发性能的考虑,快照读的实现是基于多版本并发控制,即MVCC。可以认为 MVCC 是行锁的一个变种,在很多情况下,避免了加锁操作,降低了开销;既然是基于多版本,即快照读可能读到的并不一定是数据的最新版本,而有可能是之前的历史版本
当前读
读取的是当前的数据,不需要通过undo log
回溯到事务开启前的状态。读取的是记录的最新版本,读取时还要保证其他并发事务不能修改当前记录,会对读取的记录进行加锁。
数据库并发场景有三种,分别为:
读-读
:不存在任何问题,也不需要并发控制读-写
:有线程安全问题,可能会造成事务隔离性问题,可能遇到脏读,幻读,不可重复读写-写
:有线程安全问题,可能会存在更新丢失问题,比如第一类更新丢失,第二类更新丢失
说白了 MVCC 就是为了实现读-写冲突不加锁,而这个读指的就是快照读
, 而非当前读,当前读实际上是一种加锁的操作,是悲观锁的实现
MVCC
的出现就是大佬们不满意用悲观锁去解决读-写冲突问题,所以有两个方案:
MVCC + 悲观锁
MVCC解决读写冲突,悲观锁解决写写冲突MVCC + 乐观锁
MVCC 解决读写冲突,乐观锁解决写写冲突
MVCC实现原理
- 三个隐藏字段
DB_TRX_ID
6 字节,最近修改(修改/插入)事务 ID:记录创建这条记录/最后一次修改该记录的事务 ID
DB_ROLL_PTR
7 字节,回滚指针,指向这条记录的上一个版本(存储于 rollback segment 里)
DB_ROW_ID
6 字节,隐含的自增 ID(隐藏主键),如果数据表没有主键,InnoDB 会自动以DB_ROW_ID
产生一个聚簇索引
- 版本链 / undo log
因为undo log
会记录事务前老版本数据,然后行记录中回滚指针会指向老版本位置,如此形成一条版本链。Read View 会一直遍历链表的DB_TRX_ID
,直到找到满足特定条件的 DB_TRX_ID
。那么这个DB_TRX_ID
所在的旧记录就是当前事务能看见的最新”老版本“
- Read View
是事务开启时,当前所有活跃事务(还未提交的事务)的一个集合。或者说Read View
就是事务进行快照读
操作的时候生产的读视图
(Read View),在该事务执行的快照读的那一刻,会生成数据库系统当前的一个快照,记录并维护系统当前活跃事务的 ID
三个Read View重要结构:
trx_list(名称我随意取的)
一个数值列表
用于维护 Read View 生成时刻系统 正活跃的事务 ID 列表up_limit_id
是 trx_list 列表中事务 ID 最小的 ID
low_limit_id
ReadView 生成时刻系统尚未分配的下一个事务 ID ,也就是 目前已出现过的事务 ID 的最大值 + 1
为什么是 low_limit ? 因为它也是系统此刻可分配的事务 ID 的最小值
MVCC实现的整体流程:
总结
- 应对高并发事务, MVCC比
单纯的加锁
更高效 - MVCC只在
读已提交
和可重复读
两个隔离级别下工作 - 读已提交隔离级别下,会在每次快照读(查询)都生成一个
Read View
,可重复读只在事务开始时生成一个Read View
,以后每次查询都用这个Read View
,以此实现不同隔离级别。
参考:
【MySQL笔记】正确的理解MySQL的MVCC及实现原理_(推荐)
MySQL · 引擎特性 · InnoDB 事务系统 (taobao.org)
mvcc详解 - 简书 (jianshu.com)# MVCC
MVCC(Multi-Version Concurrency Control),即多版本并发控制。是 innodb 实现事务并发与回滚的重要功能。锁机制可以控制并发操作,但是其系统开销较大,而MVCC可以在大多数情况下代替行级锁,使用MVCC,能降低其系统开销.
具体实现是在数据库的每一行中,额外添加三个字段:
DB_TRX_ID
: 记录插入或更新该行的最后一个事务的事务ID
DB_ROLL_PTR
: 指向改行对应undolog
的指针
DB_ROW_ID
: 单调递增的ID,他就是AUTO_INCREMENT
的主键ID
快照读
像不加锁的select
操作就是快照读,快照读的出现是基于提高并发性能的考虑,快照读的实现是基于多版本并发控制,即MVCC。可以认为 MVCC 是行锁的一个变种,在很多情况下,避免了加锁操作,降低了开销;既然是基于多版本,即快照读可能读到的并不一定是数据的最新版本,而有可能是之前的历史版本
当前读
读取的是当前的数据,不需要通过undo log
回溯到事务开启前的状态。读取的是记录的最新版本,读取时还要保证其他并发事务不能修改当前记录,会对读取的记录进行加锁。
数据库并发场景有三种,分别为:
读-读
:不存在任何问题,也不需要并发控制读-写
:有线程安全问题,可能会造成事务隔离性问题,可能遇到脏读,幻读,不可重复读写-写
:有线程安全问题,可能会存在更新丢失问题,比如第一类更新丢失,第二类更新丢失
说白了 MVCC 就是为了实现读-写冲突不加锁,而这个读指的就是快照读
, 而非当前读,当前读实际上是一种加锁的操作,是悲观锁的实现
MVCC
的出现就是大佬们不满意用悲观锁去解决读-写冲突问题,所以有两个方案:
MVCC + 悲观锁
MVCC解决读写冲突,悲观锁解决写写冲突MVCC + 乐观锁
MVCC 解决读写冲突,乐观锁解决写写冲突
MVCC实现原理
- 三个隐藏字段
DB_TRX_ID
6 字节,最近修改(修改/插入)事务 ID:记录创建这条记录/最后一次修改该记录的事务 ID
DB_ROLL_PTR
7 字节,回滚指针,指向这条记录的上一个版本(存储于 rollback segment 里)
DB_ROW_ID
6 字节,隐含的自增 ID(隐藏主键),如果数据表没有主键,InnoDB 会自动以DB_ROW_ID
产生一个聚簇索引
- 版本链 / undo log
因为undo log
会记录事务前老版本数据,然后行记录中回滚指针会指向老版本位置,如此形成一条版本链。Read View 会一直遍历链表的DB_TRX_ID
,直到找到满足特定条件的 DB_TRX_ID
。那么这个DB_TRX_ID
所在的旧记录就是当前事务能看见的最新”老版本“
- Read View
是事务开启时,当前所有活跃事务(还未提交的事务)的一个集合。或者说Read View
就是事务进行快照读
操作的时候生产的读视图
(Read View),在该事务执行的快照读的那一刻,会生成数据库系统当前的一个快照,记录并维护系统当前活跃事务的 ID
三个Read View重要结构:
trx_list(名称我随意取的)
一个数值列表
用于维护 Read View 生成时刻系统 正活跃的事务 ID 列表up_limit_id
是 trx_list 列表中事务 ID 最小的 ID
low_limit_id
ReadView 生成时刻系统尚未分配的下一个事务 ID ,也就是 目前已出现过的事务 ID 的最大值 + 1
为什么是 low_limit ? 因为它也是系统此刻可分配的事务 ID 的最小值
MVCC实现的整体流程:
总结
- 应对高并发事务, MVCC比
单纯的加锁
更高效 - MVCC只在
读已提交
和可重复读
两个隔离级别下工作 - 读已提交隔离级别下,会在每次快照读(查询)都生成一个
Read View
,可重复读只在事务开始时生成一个Read View
,以后每次查询都用这个Read View
,以此实现不同隔离级别。
参考:
【MySQL笔记】正确的理解MySQL的MVCC及实现原理_(推荐)
MySQL · 引擎特性 · InnoDB 事务系统 (taobao.org)
mvcc详解 - 简书 (jianshu.com)