简单描述什么是MVCC?
MVCC也叫做多版本并发控制。在mysql innodb中可以提高数据库的并发性能,实现了读写冲突不加锁。这里面的读是非阻塞并发读(也可以叫做快照读)。
MVCC解决的是什么问题?
数据库的并发情况有三种:
读-读:不存在问题,不需要并发控制。
读-写:可能会造成脏读,幻读,不可重复读。
写-写:可能会产生更新丢失的问题。
在并发读写操作时可以做到非阻塞执行,提高mysql的读写并发性能。同时还可以解决事务脏读,幻读,不可重复的问题。
MVCC不能解决写-写更新丢失的问题,那如何解决更新丢失的问题?
可以使用悲观锁的方式来解决这个问题。
上面提到了mysql innodb的快照读,那么什么是快照读?
mysql innodb在事务并发的情况有二种读方式,一种是当前读,一种是快照读。
什么是当前读?简单来说就是读取数据的最新记录。
那如何保障当前读读的就是最新记录呢?像select语句使用共享锁,update,insert,delete使用排它锁来保持当前读的是最新的数据记录。mysql的可串行化隔离级别使用的就是当前读。
什么是快照读?简单来说就是不加锁的select,也就是不加锁的非阻塞读。
mysql非串行化隔离级别使用的是快照读。快照读是基于多版本并发控制(MVCC),也就是说快照读读取的数据不一定是最新的数据记录,也可能是历史某一时刻的数据记录。
MVCC的实现原理?
MVCC的实现原理主要依赖记录中的三个隐性字段,undo log和Read View来实现的。
隐性字段
mysql数据表内每行记录除了我们自定义的字段外还有数据库隐性字段DB_ROW_ID,DB_TRX_ID,DB_ROLL_PTR。
DB_ROW_ID:隐性的自增ID,如果数据表内没有主键ID则innodb会自动以DB_ROW_ID产生一个聚簇索引。
DB_TRX_ID:记录创建这条记录或最后一次修改这条记录的事务ID。
DB_ROLL_PTR:回滚指针,用于配合undo log指向上一个旧版本。
undo log
当mysql的表引擎是innodb时,每当我们对数据记录进行新增,更改,删除操作时会往undo log内添加一条记录。
undo log可以分为2类:insert undo log和update undo log
insert undo log:在事务insert的时候产生,只在事务回滚的时候需要,事务提交后可以立即丢弃。
update undo log:在事务update和delete的时候产生,不光在事务回滚的时候需要,当使用快照读的时候也需要,不可随意删除。
Read View
Read View就是事务开启时,当前所有活跃事务(未提交事务,当然也包含当前事务)的集合。每个事务开启时,都会生成一个属于该事务的Read View。
Read View也可以理解为由集合内的一个列表,三个变量组成。
Read View->trx_ids(列表):用来记录维护当前活跃事务id。
Read View->creator_trx_id:当前事务id。
Read View->min_trx_id:当前活跃事务列表内的最小事务id。
Read View->max_trx_id:当前活跃事务列表分配给下一个事务的id值(也就是当前活跃事务列表内最大事务id值加1)。
Read View事务版本号的匹配规则是什么?
数据事务id:指的是查询的这条数据记录的隐性字段DB_TRX_ID(这个数据事务id如果当前事务对这条数据记录进行修改DB_TRX_ID存储的就是当前事务id,如果当前事务没有对其修改,则是其他事务对该数据记录修改所留在DB_TRX_ID的事务id)。
当前事务id:指的是去执行这次查询的事务的id。
1.数据事务id < Read View->min_trx_id说明这条数据记录在当前事务创建id的时都已经提交了。则可以看见数据事务id所在的数据记录。
2.数据事务id >= Read View->max_trx_id则说明数据事务id所在的数据记录是在当前事务Read View生成之后才出现的,所以看不见数据事务id所在的数据记录。
3.Read View->min_trx_id < 数据事务id < Read View->max_trx_id
情况1.数据事务id不在Read View->trx_ids列表内,则说明当前事务的Read View生成之前数据事务已经提交,所以数据事务id不在Read View->trx_ids列表内,则可以看见数据事务id所在的数据记录。
情况2.数据事务id在Read View->trx_ids列表内,则说明数据事务还未提交,所以看不见数据事务id所在的数据记录,还有另一种情况,如果数据事务id = Read View->creator_trx_id,那么说明这条数据记录就是当前事务自己生成的,自己生成的数据自己当然能看见。
什么时候生成read view?
只有在RU,RC,RR等几个mysql的隔离级别在才会用到read view,当然在不同的隔离级别下生成read view的时机也是不同的。
RU(读未提交):在sql语句开始时候生成read view,不论这个sql语句是否是select语句。
RC(读已提交):事务中每次SELECT请求都会重新创建read view;(RC隔离级别下,是每次发起SELECT都会创建read view,也就是每次SELECT都能读取到已经COMMIT的数据,所以才存在不可重复读、幻读 现象。)
RR(不可重复读):RR中第一个SELECT已经创建好read view,之后不会再发生变化;
MVCC的整体流程是什么样的?
我们在了解了各个相关解释和含义后就可以看看MVCC的整体流程到底是什么样的。