详解MVCC相关知识点

前言:学习前,先叙述mysql相关基础知识,一步步了解mysql底层机制。

1.Mysql的隔离级别:

数据库事务的隔离级别有4个,由低到高依次为Read uncommitted 、Read committed、Repeatable read 、Serializable ,这四个级别可以逐个解决脏读 、不可重复读 、幻读 这几类问题。

√: 可能出现    ×: 不会出现

脏读

不可重复读

幻读

Read uncommitted

Read committed

×

Repeatable read

×

×

Serializable

×

×

×

注意:我们讨论隔离级别的场景,主要是在多个事务并发 的情况下,因此,接下来的讲解都围绕事务并发。

Read uncommitted 读未提交

公司发工资了,领导把5000元打到singo的账号上,但是该事务并未提交,而singo正好去查看账户,发现工资已经到账,是5000元整,非常高 兴。可是不幸的是,领导发现发给singo的工资金额不对,是2000元,于是迅速回滚了事务,修改金额后,将事务提交,最后singo实际的工资只有 2000元,singo空欢喜一场。

详解MVCC相关知识点_第1张图片

出现上述情况,即我们所说的脏读 ,两个并发的事务,“事务A:领导给singo发工资”、“事务B:singo查询工资账户”,事务B读取了事务A尚未提交的数据。

当隔离级别设置为Read uncommitted 时,就可能出现脏读,如何避免脏读,请看下一个隔离级别。

脏读:可读取到其他事务未提交的数据,这样是脏读。

Read committed 读提交

singo拿着工资卡去消费,系统读取到卡里确实有2000元,而此时她的老婆也正好在网上转账,把singo工资卡的2000元转到另一账户,并在 singo之前提交了事务,当singo扣款时,系统检查到singo的工资卡已经没有钱,扣款失败,singo十分纳闷,明明卡里有钱,为 何......

出现上述情况,即我们所说的不可重复读 ,两个并发的事务,“事务A:singo消费”、“事务B:singo的老婆网上转账”,事务A事先读取了数据,事务B紧接了更新了数据,并提交了事务,而事务A再次读取该数据时,数据已经发生了改变。

当隔离级别设置为Read committed 时,避免了脏读,但是可能会造成不可重复读。

大多数数据库的默认级别就是Read committed,比如Sql Server , Oracle。如何解决不可重复读这一问题,请看下一个隔离级别。

不可重复读:在一个事务中,相同两次读取的数据结果不相同。

Repeatable read 重复读

当隔离级别设置为Repeatable read 时,可以避免不可重复读。当singo拿着工资卡去消费时,一旦系统开始读取工资卡信息(即事务开始),singo的老婆就不可能对该记录进行修改,也就是singo的老婆不能在此时转账。

虽然Repeatable read避免了不可重复读,但还有可能出现幻读 。

singo的老婆工作在银行部门,她时常通过银行内部系统查看singo的信用卡消费记录。有一天,她正在查询到singo当月信用卡的总消费金额 (select sum(amount) from transaction where month = 本月)为80元,而singo此时正好在外面胡吃海塞后在收银台买单,消费1000元,即新增了一条1000元的消费记录(insert transaction ... ),并提交了事务,随后singo的老婆将singo当月信用卡消费的明细打印到A4纸上,却发现消费总额为1080元,singo的老婆很诧异,以为出 现了幻觉,幻读就这样产生了。

幻读:事务A读取与搜索条件相匹配的若干行。事务B以插入或删除行等方式来修改事务A的结果集,然后再提交。幻读是指当事务不是独立执行时发生的一种现象,例如第一个事务对一个表中的数据进行了修改,比如这种修改涉及到表中的“全部数据行”。同时,第二个事务也修改这个表中的数据,这种修改是向表中插入“一行新数据”。那么,以后就会发生操作第一个事务的用户发现表中还存在没有修改的数据行,就好象发生了幻觉一样.一般解决幻读的方法是增加范围锁RangeS,锁定检索范围为只读,这样就避免了幻读。

注:Mysql的默认隔离级别就是Repeatable read。

Serializable 序列化

Serializable 是最高的事务隔离级别,同时代价也花费最高,性能很低,一般很少使用,在该级别下,事务顺序执行,不仅可以避免脏读、不可重复读,还避免了幻像读。

 

2. 两种读数据方式

2.1当前读

当前读,读取的是最新版本,并且对读取的记录加锁,阻塞其他事务同时改动相同记录,避免出现安全问题。

1.1哪些形式的SQL属于当前读:

  • select...lock in share mode (共享读锁)
  • select...for update
  • update , delete , insert

例如,假设要update一条记录,但是另一个事务已经delete这条数据并且commit了,如果不加锁就会产生冲突。
所以update的时候肯定要是当前读,得到最新的信息并且锁定相应的记录。

2.2 快照读

单纯的select操作,不包括上述 select ... lock in share mode, select ... for update。    
Read Committed隔离级别:每次select都生成一个快照读
Read Repeatable隔离级别:开启事务后第一个select语句才是快照读的地方,而不是一开启事务就快照读

快照读的实现方式:undolog和多版本并发控制MVCC

InnoDB 的MVCC 实现基于undo log,通过回滚段保存 undo log 记录版本快照数据,通过readview机制来确定数据的可见性,通过 purge 线程基于 readview 来清理旧数据版本

2.2.1 undolog

  • mysql 事务未提交前,会将事务修改前的旧版本数据存放到 undo 日志里,用于事务回滚或者数据库奔溃对数据库数据的影响,来保证数据的原子性。
  • undo 日志会存储在回滚段中,分为: insert undo logupdate undo log

 三个隐式字段

字段 含义 存储位置 大小
DB_TRX_ID 最后更新的事务 id(update,delete,insert) 表数据行和聚簇索引上 占 6字节
DB_ROLL_PTR 回滚指针,指向前一个版本的 undolog 记录,组成 undo 链表 表数据行和聚簇索引上 占 7字节
DB_ROW_ID 数据行 id,单调递增 表数据行和聚簇索引上

占 6字节

在多次更新后,undolog会形成一个链表

同时 undolog 日志会通过 purge 线程查询比当前活跃的最老的事务 id 的回滚日志进行删除操作

详解MVCC相关知识点_第2张图片

读视图如下

  • readview 结构体包含如下几个属性
字段 含义
creator_trx_id 创建该视图的事务 ID
trx_ids 创建 ReadView 时,活跃的读写事务 ID 数组,有序存储
low_limit_id 设置为当前最大事务 ID
up_limit_id m_ids 集合中的最小值

进行读取数据时,会依据规则进行匹配对应的记录行。

详解MVCC相关知识点_第3张图片

在快照读时,会形成读视图,其中包含:trx_list当前行对应的未提交的事物及最小事务id和当前行对应的最新的事务id+1

你可能感兴趣的:(mysql,数据库,sql)