JAVA面试系列 - Mysql InnoDB 锁机制介绍

概述

在mysql中，锁机制看起来很复杂，一堆名词：排他锁、共享锁、表锁、间隙锁、意向锁等等，搞的初学者云里雾里。同时锁的相关知识又跟事务隔离级别、索引等概念有千丝万缕的关系，是面试中的常规问题。

上面的脑图是对mysql锁相关知识的一个梳理，希望能够帮到大家，让大家能够：

能让我们在特定的场景下派得上用场
更好把控自己写的程序
在跟别人聊数据库技术的时候可以搭上几句话
构建自己的知识库体系！在面试的时候不虚

读、写锁

按锁的应用场景来看，分为读锁和写锁，读锁又可称为S锁和共享锁；写锁又可称为X锁和排他锁。简单来说，读锁 = S锁 = 共享锁，同样，写锁 = X锁 = 排他锁。
正如他们的取名，只要碰到排他锁，那么就会阻塞，具体阻塞情况如下表：

	读锁	写锁
读锁	否	是
写锁	是	是

读读不阻塞：当前用户在读数据，其他的用户也在读数据，不会加锁
读写阻塞：当前用户在读数据，其他的用户不能修改当前用户读的数据，会加锁！
写写阻塞：当前用户在修改数据，其他的用户不能修改当前用户正在修改的数据，会加锁！

读锁和写锁是互斥的，读写操作是串行

行锁

我们使用Mysql一般是使用InnoDB存储引擎的。InnoDB和MyISAM有两个本质的区别：

InnoDB支持行锁
InnoDB支持事务

对于行锁来说，也分2种类型的锁

共享锁（S锁），允许一个事务去读一行，阻止其他事务获得相同数据集的排他锁。也叫做读锁，读锁是共享的，多个客户可以同时读取同一个资源，但不允许其他客户修改。
排他锁（X锁)，允许获得排他锁的事务更新数据，阻止其他事务取得相同数据集的共享读锁和排他写锁。也叫做写锁，写锁是排他的，写锁会阻塞其他的写锁和读锁。

其实事务隔离级别就是通过锁机制来实现的，只不过隐藏了加锁的细节，下面来看看两者的关系。

事务隔离级别

大家都知道，innodb的事务隔离级别有4种

Read uncommitted，会出现脏读、不可重复读、幻读

脏读就是一个事务读取到另一个事务未提交的数据。出现脏读的本质就是因为操作(修改)完该数据就立马释放掉锁，导致读的数据就变成了无用的或者是错误的数据。

Read committed，会出现不可重复读、幻读

避免脏读的做法很简单：就是把释放锁的位置调整到事务提交之后，此时在事务提交前，其他进程是无法对该行数据进行读取的。即读写是串行的。
但Read committed会出现不可重复读，即一个事务读取到另外一个事务已经提交的数据，也就是说一个事务可以看到其他事务所做的修改。多次查询数据库的结果都不一样。

Repeatable read，会出现幻读

和不可重复读类似，但虚读(幻读)会读到其他事务的插入的数据，导致前后读取不一致。可以把不可重复读理解为数据更新，幻读是数据插入。
innodb通过MVCC解决了不可重复读的问题，MVCC的具体原理下面介绍。同时结合间隙锁，避免了幻读。即innodb的Repeatable read其实不会出现幻读的问题，innodb的事务默认级别就是Repeatable read

Serializable，串行，避免以上所有问题

那么MVCC究竟是一种什么机制，能够解决不可重复读的问题？

MVCC

MVCC即多版本并发控制，可以简单认为 是行级锁的一个升级版。前面提到，只有读-读场景是不阻塞的，其他只有要写（排他锁）场景，都是阻塞的，一定程度上影响了读写效率。基于提升并发性能的考虑，MVCC一般读写是不阻塞的，所以说MVCC很多情况下避免了加锁的操作。

InnoDB中的MVCC，是通过在每行记录后面保存两个隐藏的列来实现的。这两个列，一个保存了行的创建时间，一个保存行的删除时间。当然存储的并不是实际的时间值，而是系统版本号。没开始一个新的事务，系统版本号都会自动递增。事务开始时刻的系统版本号会作为此事务的版本号，用来和查询到的每行记录的版本号进行比较。

举个select的例子，InnoDB会根据以下两个条件检查每行记录：

InnoDB只查找版本早于当前事务版本的数据行，这样可以确保事务读取的行，要么是在事务开始前已经存在的，要么是事务自身插入或者修改过的
行的删除版本要么未定义，要么大于当前事务版本号，这可以确保事务读取到的行，在事务开始之前未被删除。

简单总结下，多版本并发控制（MVCC）是一种用来解决读-写冲突的无锁并发控制，也就是为事务分配单向增长的时间戳，为每个修改保存一个版本，版本与事务时间戳关联，读操作只读该事务开始前的数据库的快照。这样在读操作不用阻塞写操作，写操作不用阻塞读操作的同时，避免了脏读和不可重复读。

MVCC虽然解决了不可重复读问题，但是无法解决幻读，需要配合间隙锁。

间隙锁（解决幻读）

首先我们看个例子，初始表如下：

id	x	y	创建时间	删除时间
1	30	10	1	undefined

很简单，一个自增id，一列x，一列y，假设有个限制条件：x+y <= 100。然后两个事务同时并发执行：

T2（事务id=2）：set y=60，事务隔离级别是不可重复度，所以此事务内，x=30, y=10，更新y后，x+y=30+60 = 90，满足条件
T3（事务id=3）：set x=50，事务隔离级别是不可重复度，所以此事务内，x=50, y=10，更新y后，x+y=50+10 = 60，满足条件

T2和T3提交后，x+y=50+60=110 不符合小于100的要求。

Update的本质是 read --> write，MySQL（innodb）为了解决这个问题，强行把 read 分成了 snapshot read（快照读）和 locking read （当前读）。在 UPDATE 或者 SELECT ... FOR UPDATE 的时候，innodb 引擎实际执行的是当前读。
在一个支持MVCC的并发系统中，我们需要支持两种读，一个是快照读，一个是当前读。
快照读：简单的select操作，属于快照读，不加锁。
当前读：特殊的读操作，插入/更新/删除操作，属于当前读，需要加锁，读取的是最新数据。

给一个幻读的例子：

事务A种执行修改

update user set col1='new_val' where id=1;
结果: 
Query OK, 0 rows affected (0.00 sec)
Rows matched: 0  Changed: 0  Warnings: 0

事务B插入一条数据，并提交

begin;
insert into user values('A');
commit;

事务A种再次执行修改

update user set col1='new_val' where id=1;
结果:
Query OK, 1 rows affected (0.00 sec)
Rows matched: 1  Changed: 1  Warnings: 0

问题的本质是因为 update语句的查找阶段相当于select ... for update，这会更新事务A的 ReadView，从而可以读到「其他事务已提交的修改」。即出现了幻读

把上面的例子用事务版本号来解释：

事务A（事务版本号=1）种执行修改，此时是空表，所以update的select结果是0
事务B（事务版本号=2）插入一条数据，并提交

id	col1	创建时间	删除时间
1	A	2	undefined

此时如果事务A进行快照读（snapshot select），那么按照刚才mvcc的解释，由于库中id=1的记录的创建时间（事务版本号）为2，大于当前事务的版本号1，所以不会被查找出来，符合Repeatable read。但是如果此时执行的是update操作，执行的读是当前读（select for update）（InnoDB执行UPDATE，实际上是新插入了一行记录，并保存其创建时间为当前事务的ID，同时保存当前事务ID到要UPDATE的行的删除时间），成功更新id=1的记录，即幻读

id	col1	创建时间	删除时间
1	A	2	1
1	A	1	undefined

InnoDB 通过加间隙锁的方式，解决幻读。innodb对于键值在条件范围内但并不存在的记录（叫做『间隙』）加锁，这种锁机制就是所谓的间隙锁。 相对的，可以把上面不同的行锁称为记录锁。
间隙锁产生的条件分唯一索引和普通索引：

唯一索引

对于指定查询某一条记录的加锁语句，如果该记录不存在，会产生记录锁和间隙锁，如果记录存在，则只会产生记录锁
对于查找某一范围内的查询语句，会产生间隙锁，如：WHERE id BETWEEN 5 AND 7 FOR UPDATE

普通索引

在普通索引列上，不管是何种查询，只要加锁，都会产生间隙锁，这跟唯一索引不一样
在普通索引跟唯一索引中，数据间隙的分析，数据行是优先根据普通索引排序，再根据唯一索引排序。

具体实验例子可以参考 MySQL的锁机制 - 记录锁、间隙锁、临键锁，非常详细。

针对以上幻读的例子，update语句select * from user where id=1 for update，id是唯一索引，但是由于id=1的记录不存在，于是产生了间隙锁（排他），可以阻塞其他事务的insert操作。

MySQL（innodb）的选择是允许在快照读之后执行当前读，并且更新 snapshot 镜像的版本。严格来说，这个结果违反了 repeatable read 隔离级别，，但是 who cares 呢，毕竟官方都说了：“This is not a bug but an intended and documented behavior.”

表锁

表锁相对来说就很简单了，表锁顾名思义，就是锁针对的范围是整张表。表锁开销小，加锁快，不会出现死锁；锁定力度大，发生锁冲突概率高，并发度最低。现在考虑这样一个情景：

事务A获取了某一行的排他锁，并未提交：

SELECT * FROM users WHERE id = 6 FOR UPDATE;

事务B想要获取users表的表锁：

LOCK TABLES users READ;

因为共享锁与排他锁互斥，所以事务B得确保：

当前没有其他事务持有 users 表的排他锁。
当前没有其他事务持有 users 表中任意一行的排他锁。

为了检测是否满足第二个条件，事务 B 必须在确保 users表不存在任何排他锁的前提下，去检测表中的每一行是否存在排他锁。扫描所有行这明显是一个效率很差的做法，于是提出了意向锁。

意向锁

事务在获取行锁（包括读锁和写锁）的同时会获取表的意向锁（包括读锁和写锁）。
意向锁之间是相互兼容的：

	意向共享锁	意向排他锁
意向共享锁	兼容	兼容
意向排他锁	兼容	兼容

意向锁和表级锁之间存在互斥情况

	意向共享锁	意向排他锁
表级共享锁	兼容	互斥
表级排他锁	互斥	互斥

这里再次强调下：
这里的排他 / 共享锁指的都是表锁！！！意向锁不会与行级的共享 / 排他锁互斥！！！
意向锁不会与行级的共享 / 排他锁互斥！！！
现在再回过头来看刚才的例子：
事务A获取了某一行的排他锁，并未提交：

SELECT * FROM users WHERE id = 6 FOR UPDATE;

此时，事务A也获取了users表的意向排他锁，