提到MySQL的事务,我相信对MySQL有了解的同学都能聊上几句,无论是面试求职,还是日常开发,MySQL的事务都跟我们息息相关。
而事务的ACID(即原子性Atomicity、一致性Consistency、隔离性Isolation、持久性Durability)可以说涵盖了事务的全部知识点,所以,我们不仅要知道ACID是什么,还要了解ACID背后的实现,只有这样,无论在日常开发还是面试求职,都能无往而不利。
为了大家更好的阅读体验,对ACID的深入分析将分为上下两篇。
本篇为上篇,主要围绕ACID中的I,也就是“隔离性”展开,从基本概念,到隔离性的实现,最后以一个实战案例进行融会贯通。
嗯,看完你都能理解,那跟面试官侃半小时隔离性就没问题了。
Isolation,隔离性,也有人称之为并发控制(concurrency control)。事务的隔离性要求每个事务读写的对象对其他事务都是相互隔离的,也就是这个事务提交前,这个事务的修改内容对其他事务都是不可见的。事务的隔离性,主要是解决不同事物之间的相互读写影响。
所谓的读写影响注意分为三种:
为了解决事务隔离性的问题,数据库一般会有不同的隔离级别来解决相应的读写影响。
不同隔离级别能够解决不同的隔离性问题。
需要注意的是,这是标准事务隔离级别的定义。在MySQL的innodb引擎中,在可重复读级别下,通过mvcc解决了幻读的问题,具体实现我们后面再讲。
同时,需要注意的是,到目前为止,我们说的读,都是”快照读”,普通的select。后面我们还会提到“当前读”,是不一样的哦。
要实现事务的隔离性,需要了解两个方面的内容,一个是锁,一个是多版本并发控制(MVCC)。
InnoDB中,实现了两种标准的 行级锁:
普通select语句不会有任何锁,那么如何获得共享锁和排它锁呢?
当一个事务A已经获得了行r的共享锁,那么另一个事务B可以立刻获得行r的共享锁,因为不会改变r的数值,这种叫做锁兼容。
如果这时候有事务C希望获得行r的排它锁,那么就必须等待事务A和事务B释放行r的共享锁之后,才能获得排它锁,这种叫做锁不兼容。
普通的select不会对行上锁,而select…lock in share mode会上共享锁,select…for update会上排它锁。
如果在update、insert的时候,不能进行select,那么服务的并发访问性能就太差了。因此,我们日常的查询,都是“快照读”,不会上锁,只有在update\insert\“当前读”的时候,才会上锁。而为了解决“快照读”的并发访问问题,就引入了MVCC。
如果说上面的行锁是一种悲观锁,那么MVCC就是一种乐观锁的实现方式,而且是一种很常用的乐观锁实现方式。
所谓多版本,就是一行记录在数据库中存储了多个版本,每个版本以事务ID作为版本号。InnoDB 里面每个事务有一个唯一的事务 ID,是在事务开始的时候向InnoDB的事务系统申请的,并且按照申请顺序严格递增的。假如一行记录被多个事务更新,那么,就会产生多个版本的记录。
以某一行数据作为例子:
经过两次事务的操作,value从22变成了19,同时,保留了三个事务id,15、25、30。
在每个记录多版本的基础上,需要利用“一致性视图”,来做版本的可见性判断。
这里,我们要区分MySQL里面的两个”视图”概念:
我们全文提到的“视图”都是第二种,主要是支持InnoDB在“读已提交”和“可重复读”级别的并发访问问题。
下面,我们简单介绍一下创建一致性视图的逻辑。
以“可重复读”级别为例。
有了一致性视图后,我们就可以判断一行数据的多版本可见性了,无论是“读已提交”还是“可重复读”级别,可见性判断规则是一样的,区别在于创建快照(一致性视图)的时间。
在当前事务中,读取其他某一行的记录,对其中的版本号的可见性判断有五种情况(建议自己跟着捋一捋,挺重要的):
可以看看下面这个例子,更容易理解。
系统创建过的事务id:1,2,3,4,5,6,7,8,9,10,11,12,13,14,15
事务A启动,拍个快照
此时未提交的事务id有:7,8,9
一致性视图:数组array[7,8,9] + 高水位16(15+1)
对于任意一行数据的可见性判断如下。
两个重要结论:
下面,我们来两个实战案例,将上面的基础概念与实现融会贯通吧。
id=1 的value初始为1。
我们看下,在不同隔离级别,Time5、Time7、Time9事务A查询到的value 分布为多少。
id=1 的value初始为1,在可重复读级别:
你猜猜事务A和事务B读取的value是多少?
答案是:1 和 3
可能会产生困惑,事务A在启动后快照,所以读到了1是正常的,但是事务2在启动的时候快照了,然后在自己的事务中+1,怎么会读到3而不是2呢?
原因很简单,即使是在可重复读的级别,事务 更新数据 的时候,只能用当前读(想想也能理解,不然update就出现数据不一致了)。
如果当前的记录的行锁被其他事务占用的话,就需要进入锁等待。而读提交的逻辑和可重复读的逻辑类似,它们最主要的区别是:在可重复读隔离级别下,只需要在事务开始的时候创建一致性视图,之后事务里的其他查询都共用这个一致性视图;在读提交隔离级别下,每一个语句执行前都会重新算出一个新的视图。
这里,我们需要注意的是事务的启动时机。
首先明确一下,什么是幻读?开篇介绍了什么是幻读,这里再申明一下幻读出现的场景
前文已经提到了,对于普通数据库,需要到可串行化的隔离级别才能解决幻读问题。
而对于InnoDB存储引擎来说,在可重复读级别下就能解决幻读问题。
InnoDB存储引擎有三种行锁算法:
InnoDB就是通过Next-Key Lock解决了幻读的问题,具体内容可以看我之前的文章: 说透MySQL里的各种锁(下篇)
看到这里了,原创不易,点个赞吧,你最好看了~
知识碎片重新梳理,构建Java知识图谱:https://github.com/saigu/JavaKnowledgeGraph (历史文章查阅非常方便)