事务的隔离性
由这章讲述的锁
来实现。
锁
是计算机协调多个进程或线程并发访问某一资源
的机制。在程序开发中会存在多线程同步的问题,当多个线程并发访问某个数据的时候,尤其是针对一些敏感的数据(比如订单、金额等),我们就需要保证这个数据在任何时刻最多只有一个线程
在访问,保证数据的完整性
和一致性
。在开发过程中加锁是为了保证数据的一致性,这个思想在数据库领域中同样很重要。
在数据库中,除传统的计算资源(如CPU、RAM、I/O等)的争用以外,数据也是一种供许多用户共享的资源。为保证数据的一致性,需要对并发操作进行控制
,因此产生了锁
。同时锁机制也为实现MySQL的各个隔离级别
提供了保证。锁冲突也是影响数据库并发访问性能
的一个重要因素。所以锁对数据库而言显得尤其重要,也更加复杂。
并发事务访问相同记录的情况大致可以划分为3种:
读-读
情况,即并发事务相继读取相同的记录
。读取操作本身不会对记录有任何影响,并不会引起什么问题,所以允许这种情况的发生。
写-写
情况,即并发事务相继对相同的记录做出改动。
在这种情况下会发生脏写
(丢失修改)的问题,任何一种隔离级别都不允许这种问题的发生。所以在多个未提交事务相继对一条记录做改动时,需要让它们排队执行
,这个排队的过程其实是通过锁
来实现的。这个所谓的锁其实是一个内存中的结构
,在事务执行前本来是没有锁的,也就是说一开始是没有锁结构
和记录进行关联的,如图所示:
当一个事务想对这条记录做改动时,首先会看看内存中有没有与这条记录关联的锁结构
,当没有的时候
就会在内存中生成一个锁结构
与之关联。比如,事务 T1 要对这条记录做改动,就需要生成一个 锁结构
与之关联:
在锁结构
里有很多信息,为了简化理解,只把两个比较重要的属性拿了出来:
trx信息
:代表这个锁结构是哪个事务生成的。is_waiting
:代表当前事务是否在等待。当事务T1
改动了这条记录后,就生成了一个锁结构
与该记录关联,因为之前没有别的事务为这条记录加锁,所以is_waiting
属性就是false
,我们把这个场景就称之为获取锁成功
,或者加锁成功
,然后就可以继续执行操作了。
在事务T1
提交之前,另一个事务T2
也想对该记录做改动,那么先看看有没有锁结构
与这条记录关联,发现有一个锁结构
与之关联后,然后也生成了一个锁结构与这条记录关联,不过锁结构的is_waiting
属性值为true
,表示当前事务需要等待,我们把这个场景就称之为获取锁失败
,或者加锁失败
,图示:
在事务T1
提交之后,就会把该事务生成的锁结构
释放掉,然后看看还有没有别的事务在等待获取锁,发现了事务T2
还在等待获取锁,所以把事务T2
对应的锁结构
的is_waiting
属性设置为false,然后把该事务对应的线程唤醒,让它继续执行,此时事务T2
就算获取到锁了。效果图就是这样:(我感觉有点像阻塞队列)
小结几种说法:
不加锁
意思就是不需要在内存中生成对应的锁结构
,可以直接执行操作。
获取锁成功,或者加锁成功
意思就是在内存中生成了对应的锁结构
,而且锁结构的is_waiting
属性为false
,也就是事务
可以继续执行操作。
获取锁失败,或者加锁失败,或者没有获取到锁
意思就是在内存中生成了对应的锁结构
,不过锁结构的is_waiting
属性为true
,也就是事务
需要等待,不可以继续执行操作。
读-写
或写-读
,即一个事务进行读取操作,另一个进行改动操作。这种情况下可能发生脏读
、不可重复读
、幻读
的问题。
各个数据库厂商对SQL标准
的支持都可能不一样。比如MySQL在REPEATABLE READ
隔离级别上就已经
解决了幻读
问题。
怎么解决脏读
、不可重复读
、幻读
这些问题呢?其实有两种可选的解决方案:
MVCC
,下章讲),写操作加锁
。所谓的MVCC
,就是生成一个ReadView
,通过ReadView
找到符合条件的记录版本(历史版本由undo日志
构建)。查询语句只能读
到在生成ReadView
之前已提交事务所做的更改,在生成ReadView之前未提交的事务或者之后才开启的事务所做的更改是看不到的。而写操作肯定针对的是最新版本的记录,读记录的历史版本和改动记录的最新版本本身并不冲突,也就是采用MVCC时,读-写操作并不冲突。
普通的SELECT语句在
READ COMMITTED
和REPEATABLE READ
隔离级别下会使用到MVCC
读取记录。
- 在
READ COMMITTED
隔离级别下,一个事务在执行过程中每次执行SELECT操作时都会生成一
个ReadView,ReadView的存在本身就保证了事务不可以读取到未提交的事务所做的更改
,也就
是避免了脏读现象;- 在
REPEATABLE READ
隔离级别下,一个事务在执行过程中只有第一次执行SELECT操作
才会
生成一个ReadView,之后的SELECT操作都复用
这个ReadView,这样也就避免了不可重复读
和幻读的问题。
加锁
的方式。如果我们的一些业务场景不允许读取记录的旧版本,而是每次都必须去读取记录的最新版本
。比如,在银行存款的事务中,你需要先把账户的余额读出来,然后将其加上本次存款的数额,最后再写到数据库中。在将账户余额读取出来后,就不想让别的事务再访问该余额,直到本次存款事务执行完成,其他事务才可以访问账户的余额。这样在读取记录的时候就需要对其进行加锁
操作,这样也就意味着读
操作和写
操作也像写-写
操作那样排队
执行。
脏读的产生是因为当前事务读取了另一个未提交事务写的一条记录,如果另一个事务在写记录的时候就给这条记录加锁,那么当前事务就无法继续读取该记录了,所以也就不会有脏读问题的产生了。
不可重复读的产生是因为当前事务先读取一条记录,另外一个事务对该记录做了改动之后并提交之后,当前事务再次读取时会获得不同的值,如果在当前事务读取记录时就给该记录加锁,那么另一个事务就无法修改该记录,自然也不会发生不可重复读了。
幻读问题的产生是因为当前事务读取了一个范围的记录,然后另外的事务向该范围内插入了新记录,当前事务再次读取该范围的记录时发现了新插入的新记录。采用加锁的方式解决幻读问题就有一些麻烦,因为当前事务在第一次读取记录时幻影记录并不存在,所以读取的时候加锁就有点尴尬(因为你并不知道给谁加锁)。
小结对比发现
MVCC
方式的话,读-写
操作彼此并不会冲突,性能更高
。读-写
操作彼此需要排队执行
,影响性能一般情况下我们当然更愿意采用MVCC
来解决读-写
操作解决并发执行的问题,但是业务在某些特殊情况下,要求采用加锁
的方式执行。下面就来讲一下MySQL中不同类别的锁。
锁的分类图,如下:
对于数据库中并发事务的读-读
情况并不会引起什么问题。对于写-写
、读-写
或写-读
这些情况可能会引起一些问题,需要使用MVCC
或者加锁
的方式来解决它们。在使用加锁
的方式解决问题时,由于既要允许读-读
情况不受影响,又要使写-写
、读-写
或写-读
情况中的操作相互阻塞
,所以MySQL实现一个由两种类型的锁组成的锁系统来解决。这两种类型的锁通常被称为共享锁(Shared Lock,SLock)和排他锁(Exclusive Lock,XLock),也叫读锁(readlock)和写锁(write lock)。
读锁
:也称为共享锁
、英文用S
表示。针对同一份数据,多个事务的读操作可以同时进行而不会写锁
:也称为排他锁
、英文用X
表示。当前写操作没有完成前,它会阻断
其他写锁和读锁。这样需要注意的是对于InnoDB引擎来说,读锁和写锁可以加在表上,也可以加在行上。
**举例(行级读写锁)**∶如果一个事务T1已经获得了某个行r的读锁,那么此时另外的一个事务T2是可以去获得这个行r的读锁的,因为读取操作并没有改变行r的数据;但是,如果某个事务T3想获得行r的写锁,则它必须等待事务T1、T2释放掉行r上的读锁才行。
总结:这里的兼容是指对同一张表或记录的锁的兼容性情况。
X锁 | S锁 | |
---|---|---|
X锁 | 不兼容 | 不兼容 |
S锁 | 不兼容 | 兼容 |
在采用加锁
方式解决脏读
、不可重复读
、幻读
这些问题时,读取一条记录时需要获取该记录的S锁
,其实是不严谨的,有时候需要在读取记录时就获取记录的X锁
,来禁止别的事务读写该记录,为此MySQL提出了两种比较特殊的SELECT
语句格式:
S锁
:SELECT ... LOCK IN SHARE MODE
# 或
SELECT ... FOR SHARE; # (mysql8.0新增语法)
在普通的SELECT
语句后边加LOCK IN SHARE MODE
,如果当前事务执行了该语句,那么它会为读取到的记录加S锁
,这样允许别的事务继续获取这些记录的S锁
(比方说别的事务也使用SELECT ... LOCK IN SHARE MODE
语句来读取这些记录),但是不能获取这些记录的X锁
(比如使用SELECT ... FOR UPDATE
语句来读取这些记录,或者直接修改这些记录)。如果别的事务想要获取这些记录的X锁
,那么它们会阻塞,直到当前事务提交之后将这些记录上的S锁
释放掉。
X锁
:SELECT ... FOR UPDATE;
在普通的SELECT
语句后边加FOR UPDATE
,如果当前事务执行了该语句,那么它会为读取到的记录加X锁
,这样既不允许别的事务获取这些记录的S锁
(比方说别的事务使用SELECT ... LOCK IN SHARE MODE
语句来读取这些记录),也不允许获取这些记录的X锁
(比如使用SELECT ... FOR UPDATE
语句来读取这些记录,或者直接修改这些记录)。如果别的事务想要获取这些记录的S锁
或者X锁
,那么它们会阻塞,直到当前事务提交之后将这些记录上的X锁
释放掉。
演示:使用atguigudb3下面的account表,就是对上面的文字表述转换成操作了。
举例1:
再添加X锁
举例2:
MySQL8.0新特性:
在5.7及之前的版本,SELECT ... FOR UPDATE
,如果获取不到锁,会一直等待,直到
innodb_lock_wait_timeout
超时。在8.0版本中,SELECT...FOR UPDATE
,SELECT.…FOR SHARE
添加NOWAIT
、SKIP LOCKED
语法,跳过锁等待,或者跳过锁定。
mysql> select * from account for update nowait;
ERROR 3572 (HY000): Statement aborted because lock(s) could not be acquired immediately and NOWAIT is set.
mysql> select * from account for update skip locked;
Empty set (0.00 sec)
平常所用到的写操作
无非是 DELETE
、UPDATE
、INSERT
这三种:
DELETE
:
对一条记录做DELETE
操作的过程其实是先在B+树
中定位到这条记录的位置,然后获取这条记录的X锁
,再执行delete mark
操作(将delete mark
由0改成1)。我们也可以把这个定位待删除记录在B+
树中位置的过程看成是一个获取X锁
的锁定读。
UPDATE
:在对一条记录做UPDATE操作时分为三种情况:
情况1∶未修改该记录的键值
(主键值),并且被更新的列占用的存储空间在修改前后未发生变化。
则先在B+树
中定位到这条记录的位置,然后再获取一下记录的X锁
,最后在原记录的位置进行修改操作。我们也可以把这个定位待修改记录在B+树
中位置的过程看成是一个获取X锁
的锁定读。
情况2∶未修改该记录的键值
(主键值),并且至少有一个被更新的列占用的存储空间在修改前后发生变化。
则先在B+树
中定位到这条记录的位置,然后获取一下记录的X锁
,将该记录彻底删除掉(就是把记录彻底移入垃圾链表),最后再插入一条新记录。这个定位待修改记录在B+树
中位置的过程看成是一个获取X锁
的锁定读
,新插入的记录由INSERT
操作提供的隐式锁
进行保护。
情况3:修改了该记录的键值,则相当于在原记录上做DELETE操作
之后再来一次INSERT操作,加锁操作就需要按照 DELETE
和INSERT
的规则进行了。
INSERT
:
一般情况下,新插入一条记录的操作并不加锁,通过一种称之为隐式锁
的结构来保护这条新插入的记录在本事务提交前不被别的事务访问。
为了尽可能提高数据库的并发度,每次锁定的数据范围越小越好
,理论上每次只锁定当前操作的数据的方案会得到最大的并发度,但是管理锁是很耗资源
的事情(涉及获取、检查、释放锁等动作)。因此数据库系统需要在高并发响应
和系统性能
两方面进行平衡,这样就产生了“锁粒度〈Lock granularity)”
的概念。
对一条记录加锁影响的也只是这条记录而已,我们就说这个锁的粒度比较细;其实一个事务也可以在表级别
进行加锁,自然就被称之为表级锁
或者表锁
,对一个表加锁影响整个表中的记录,我们就说这个锁的粒度比较粗。锁的粒度主要分为表级锁
、页级锁
和行锁
。
该锁会锁定整张表,它是MySQL中最基本的锁策略,并不依赖于存储引擎
(不管你是MySQL的什么存储引擎,对于表锁的策略都是一样的),并且表锁是开销最小
的策略(因为粒度比较大)。由于表级锁一次会将整个表锁定,所以可以很好的避免死锁
问题。当然,锁的粒度大所带来最大的负面影响就是出现锁资源争用的概率也会最高,导致并发率大打折扣
。
在对某个表执行SELECT、INSERT、DELETE、UPDATE语句时,InnoDB存储引擎是不会为这个表添加表级别的S锁
或者X锁
的。在对某个表执行一些诸如ALTER TABLE
、DROP TABLE
这类的DDL
语句时,其他事务对这个表并发执行诸如SELECT、INSERT、DELETE、UPDATE的语句会发生阻塞。同理,某个事务中对某个表执行SELECT、INSERT、DELETE、UPDATE语句时,在其他会话中对这个表执行DDL语句也会发生阻塞。这个过程其实是通过在server层
使用一种称之为元数据锁
(英文名: Metadata Locks
,简称MDL
)结构来实现的。
一般情况下,不会使用InnoDB存储引擎提供的表级别的S锁
和X锁
。只会在一些特殊情况下,比方说崩溃恢复
,过程中用到。比如,在系统变量autocommit=0,innodb_table_locks = 1时
,手动获取InnoDB存储引擎提供的表t的S锁
或者X锁
可以这么写:
LOCK TABLES t READ
: InnoDB存储引擎会对表t
加表级别的S锁
。LOCK TABLES t WRITE
: InnoDB存储引擎会对表t
加表级别的X锁
。不过尽量避免在使用InnoDB存储引擎的表上使用LOCK TABLES
这样的手动锁表语句,它们并不会提供什么额外的保护,只是会降低并发能力而已。InnoDB的厉害之处还是实现了更细粒度的行锁
,关于InnoDB表级别的S锁
和X锁
大家了解一下就可以了。
**举例:**下面我们讲解MylSAM引擎下的表锁。
步骤1:创建表并添加数据
CREATE TABLE mylock(
id INT NOT NULL PRIMARY KEY auto_increment,
NAME VARCHAR(20)
)ENGINE myisam;#存储引擎使用InnoDB也可以,只是不建议
# 插入一条数据
INSERT INTO mylock(NAME) VALUES ( 'a' );
步骤2:给mylock表添加S锁
lock tables mylock read;
步骤3:查看添加表锁的表
show open tables where in_use>0;
步骤4:释放锁
unlock tables ;
再进行查看就可以看到没有in_use>0的表了
mysql> show open tables where in_use > 0;
Empty set (0.00 sec)
步骤5:加读锁
lock tables mylock read;
lock tables mylock write;
我们为mylock表加read锁(读阻塞写),观察阻塞的情况,流程如下:
加读锁和写锁的演示就省略了
总结:
MyISAM在执行查询语句(SELECT)前,会给涉及的所有表加读锁,在执行增删改操作前,会给涉及的表加写锁。InnoDB存储引擎
是不会为这个表添加表级别的读锁
或者写锁
的。
MySQL的表级锁有两种模式:(以MylSAM表进行操作的演示)
表共享读锁(Table Read Lock)
表独占写锁(Table Write Lock)
锁类型 | 自己可读 | 自己可写 | 自己可操作其他表 | 他人可读 | 他人可写 |
---|---|---|---|---|---|
读锁 | 是 | 否 | 否 | 是 | 否,等 |
写锁 | 是 | 是 | 否 | 否,等 | 否,等 |
InnoDB 支持多粒度锁(multiple granularity locking)
,它允许行级锁
与 表级锁
共存,而意向
锁就是其中的一种表锁
。
意向锁的存在是为了协调行锁和表锁的关系,支持多粒度(表锁与行锁)的锁并存。
意向锁是一种不与行级锁冲突表级锁
,这一点非常重要。
表明“某个事务正在某些行持有了锁或该事务准备去持有锁”
意向锁分为两种:
-- 事务要获取某些行的 S 锁,必须先获得表的 IS 锁。
SELECT column FROM table ... LOCK IN SHARE MODE;
-- 事务要获取某些行的 X 锁,必须先获得表的 IX 锁。
SELECT column FROM table ... FOR UPDATE;
即:意向锁是由存储引擎自己维护的
,用户无法手动操作意向锁,在为数据行加共享/排他锁之前,InnoDB会先获取该数据行所在数据表的对应意向锁
。
1.意向锁要解决的问题
现在有两个事务,分别是T1和T2,其中T2试图在该表级别上应用共享或排它锁
,如果没有意向锁存在
,那么T2就需要去检查各个页或行是否存在锁;如果存在意向锁
,那么此时就会受到由T1控制的表级别意向锁的阻塞。T2在锁定该表前不必检查各个页或行锁,而只需检查表上的意向锁。简单来说就是给更大一级别的空间示意里面是否已经上过锁。
在数据表的场景中,如果我们给某一行数据加上了排它锁,数据库会自动给更大一级的空间,比如数据页或数据表加上意向锁,告诉其他人这个数据页或数据表已经有人上过排它锁了,这样当其他人想要获取数据表排它锁
的时候,只需要了解是否有人已经获取了这个数据表的意向排他锁
即可。
添加意向共享锁
。添加意向排他锁
。这时,意向锁会告诉其他事务已经有人锁定了表的某些记录。
**举例:**创建表teacher,插入6条数据,事务的隔离级别默认为Repeatable-Read
,如下所示。
CREATE TABLE `teacher` (
`id` int NOT NULL AUTO_INCREMENT,
`name` varchar(255) NOT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci;
INSERT INTO `teacher`
VALUES ('1','zhangsan'),
('2','lisi'),
('3','wangwu'),
('4','zhaoliu'),
('5','pzx'),
('6','hhh');
mysql> select @@transaction_isolation;
+-------------------------+
| @@transaction_isolation |
+-------------------------+
| REPEATABLE-READ |
+-------------------------+
1 row in set (0.00 sec)
假设事务A获取了某一行的排他锁,并未提交,语句如下所示。
在id为6的行上加上X锁。
begin;
# 针对这一条记录机上X锁
SELECT * FROM teacher WHERE id = 6 FOR UPDATE;
然后到另外一个事务中开启事务,去加S锁,发现被阻塞
意向锁是怎么解决这个问题的呢?首先,我们需要知道意向锁之间的兼容互斥性,如下所示。
意向共享锁(IS) | 意向排他锁(IX) | |
---|---|---|
意向共享锁(IS) | 兼容 | 兼容 |
意向排他锁(IX) | 兼容 | 兼容 |
即意向锁之间是互相兼容的,虽然意向锁和自家兄弟互相兼容,但是它会与普通的排他/共享锁互斥。
意向共享锁(IS) | 意向排他锁(IX) | |
---|---|---|
共享锁(S) | 兼容(读跟读兼容) | 互斥 |
排他锁(X) | 互斥 | 互斥 |
这里为id为6的添加X锁。
begin;
SELECT *FROM teacher WHERE id = 6 FOR UPDATE;
+----+------+
| id | name |
+----+------+
| 6 | hhh |
+----+------+
1 row in set (0.00 sec)
开启事务,再为id为6的去开启X锁发现被阻塞了,因为排他锁和排他锁是互斥的。
而为5加上X锁可以加上,因为意向排他锁和意向排他锁兼容
mysql> begin;
Query OK, 0 rows affected (0.00 sec)
mysql> SELECT *FROM teacher WHERE id = 6 FOR UPDATE;
^C^C -- query aborted
ERROR 1317 (70100): Query execution was interrupted
mysql> SELECT *FROM teacher WHERE id = 5 FOR UPDATE;
+----+------+
| id | name |
+----+------+
| 5 | pzx |
+----+------+
1 row in set (0.00 sec)
从上面的结论可以得到如下的结论:
多粒度锁
,特定场景下,行级锁可以与表级锁共存。IS
与S
兼容外,意向锁会与共享锁/排他锁
互斥。表级锁
,不会和行级
的X,S锁发生冲突。只会和表级的X,S发生冲突。行锁和表锁共存
且满足事务隔离性
的要求。在使用MySQL过程中,我们可以为表的某个列添加AUTO_INCREMENT
属性。举例:
CREATE TABLE `teacher` (
`id` int NOT NULL AUTO_INCREMENT,
`name` varchar ( 255)NOT NULL,
PRIMARY KEY ( `id`)
);
由于这个表的id字段声明了AUTO_INCREMENT
,意味着在书写插入语句时不需要为其赋值,SQL语句修改如下所示。
INSERT INTO `teacher` (name) VALUES ( 'zhangsan'),( 'lisi' );
上边的插入语句并没有为id列显式赋值,所以系统会自动为它赋上递增的值,结果如下所示。
mysql> select * from teacher;
+----+----------+
| id | name |
+----+----------+
| 1 | zhangsan |
| 2 | lisi |
+----+----------+
2 rows in set (0.00 sec)
现在我们看到的上面插入数据只是一种简单的插入模式,所有插入数据的方式总共分为三类,分别是“Simpleinserts”
(简单插入),“Bulk inserts”
(批量插入)和“Mixed-mode inserts ”
(混合插入)。
可以预先确定要插入的行数
(当语句被初始处理时)的语句。包括没有嵌套子查询的单行和多行
INSERT...VALUES()
和REPLACE
语句。比如我们上面举的例子就属于该类插入,已经确定要插入的行数。
事先不知道要插入的行数
(和所需自动递增值的数量)的语句。比如INSERT ... SELECT,REPLACE ... SELECT
(基于现有的表进行插入)和LOAD DATA
语句,但不包括纯INSERT
。InnoDB在每处理一行,为AUTO_INCREMENT
列分配一个新值。
这些是“Simple inserts”语句但是指定部分新行的自动递增值。例如INSERT INTO teacher (id, name) VALUES(1 , ' a'),(NULL, ' b'),(5, ' c'),(NULL, 'd');
只是指定了部分id的值。另一种类型的“混合模式插入”是INSERT ... ON DUPLICATE KEY UPDATE
。
对于上面数据插入的案例,MySQL中采用了自增锁
的方式来实现,AUTO-INC锁是当向使用含有AUTO_INCREMENT列的表中插入数据时需要获取的一种特殊的表级锁,在执行插入语句时就在表级别加一个AUTO-INC锁,然后为每条待插入记录的AUTO_INCREMENT修饰的列分配递增的值,在该语句执行结束后,再把AUTO-INC锁释放掉。一个事务在持有AUTO-INC锁的过程中,其他事务的插入语句都要被阻塞,可以保证一个语句中分配的递增值是连续的。也正因为此,其并发性显然并不高,当我们向一个有AUTO_INCREMENT关键字的主键插入值的时候,每条语句都要对这个表锁进行竞争,这样的并发潜力其实是很低下的,所以innodb通过innodb_autoinc_lock_mode
的不同取值来提供不同的锁定机制,来显著提高SQL语句的可伸缩性和性能。
innodb_autoinc_lock_mode
有三种值,分别对应不同锁定模式
(1) innodb_autoinc_lock_mode = 0("传统"锁定模式)
在此锁定模式下,所有类型的insert语句都会获得一个特殊的表级AUTO-INC锁用于插入具有AUTO_INCREMENT列的表。这种模式其实就如我们上面的例子,即每当执行insert的时候,都会得到一个表级锁(AUTO-INC锁),使得语句中生成的auto_increment
为顺序,且在binlog
中重放的时候,可以保证master与slave中数据的auto_increment
是相同的。因为是表级锁
,当在同一时间多个事务中执行insert的时候,对于AUTO-INC锁的争夺会限制并发能力。
(2) innodb_autoinc_lock_mode = 1("连续"锁定模式)
在MySQL 8.0之前,连续锁定模式是默认的。
在这个模式下,"bulk inserts"仍然使用AUTO-INC表级锁,并保持到语句结束。这适用于所有INSERT ...SELECT
,REPLACE ...SELECT
和LOAD DATA
语句。同一时刻只有一个语句可以持有AUTO-INC锁。
对于"Simple inserts"
(要插入的行数事先已知),则通过在mutex(轻量锁)
的控制下获得所需数量的自动递增值来避免表级AUTO-INC锁,它只在分配过程的持续时间内保持,而不是直到语句完成。不使用表级AUTO-INC锁,除非AUTO-INC锁由另一个事务保持。如果另一个事务保持AUTO-INC锁,则"simple inserts"等待AUTO-INC锁,如同它是一个“bulk inserts"。
(3) innodb_autoinc_lock_mode = 2("交错"锁定模式)
从MySQL 8.0开始,交错锁模式是默认
设置。
在这种锁定模式下,所有类INSERT语句都不会使用表级AUTO-INC锁,并且可以同时执行多个语句。这是最快和最可扩展的锁定模式,但是当使用基于语句的复制或恢复方案时,从二进制日志重播SQL语句时,这是不安全的。
在此锁定模式下,自动递增值保证
在所有并发执行的所有类型的insert语句中是唯一
且单调递增
的。但是,由于多个语句可以同时生成数字(即,跨语句交叉编号),为任何给定语句插入的行生成的值可能不是连续的。
如果执行的语句是"simple inserts",其中要插入的行数已提前知道,除了“Mixed-mode inserts"之外,为单个语句生成的数字不会有间隙。然而,当执行"bulk inserts"时,在由任何给定语句分配的自动递增值中可能存在间隙。
MySQL5.5引入了meta data lock,简称MDL锁,属于表锁范畴。MDL的作用是,保证读写的正确性。比如,如果一个查询正在遍历一个表中的数据,而执行期间另一个线程对这个表结构做变更
,增加了一列,那么查询线程拿到的结果跟表结构对不上,肯定是不行的。
因此,当对一个表做增删改查操作的时候,加MDL读锁;当要对表做结构变更操作的时候,加 MDL写锁。
读锁之间不互斥,因此你可以有多个线程同时对一张表增删改查。读写锁之间、写锁之间是互斥的,用来保证变更表结构操作的安全性,解决了DML和DDL操作之间的一致性问题。不需要显式使用
,在访问一个表的时候会被自动加上。
举例:元数据锁的使用模拟
show processlist;
行锁(Row Lock)也称为记录锁,顾名思义,就是锁住某一行(某条记录row)。需要的注意的是,MySQL服务器层并没有实现行锁机制,行级锁只在存储引擎层实现。
**优点:**锁定粒度小,发生锁冲突概率低
,可以实现的并发度高
。
**缺点:**对于锁的开销比较大
,加锁会比较慢,容易出现死锁
情况。
InnoDB与MylSAM的最大不同有两点:一是支持事务(TRANSACTION)﹔二是采用了行级锁。
首先我们创建表如下:
CREATE TABLE student (
id INT,
name VARCHAR(20),class varchar( 10),PRIMARY KEY (id)
) Engine=InnoDB CHARSET=utf8 ;
向这个表中添加几条记录:
INSERT INTO student VALUES( 1,'张三','一班'),
( 3,'李四','一班'),( 8,'王五','二班'),( 15,'赵六','二班'),(20,'钱七','三班');
查看表中的数据
mysql> select * from student;
+----+--------+--------+
| id | name | class |
+----+--------+--------+
| 1 | 张三 | 一班 |
| 3 | 李四 | 一班 |
| 8 | 王五 | 二班 |
| 15 | 赵六 | 二班 |
| 20 | 钱七 | 三班 |
+----+--------+--------+
5 rows in set (0.00 sec)
student表中的聚簇索引的简图如下所示。
这里把B+树的索引结构做了一个超级简化,只把索引中的记录给拿了出来,下面看看都有哪些常用的行锁类型。
记录锁也就是仅仅把一条记录锁上,官方的类型名称为:LOCK_REC_NOT_GAP
。比如我们把id值为8的
那条记录加一个记录锁的示意图如图所示。仅仅是锁住了id值为8的记录,对周围的数据没有影响。
记录锁是有S锁
和X锁
之分的,称之为S型记录锁
和X型记录锁
。
S型记录锁
后,其他事务也可以继续获取该记录的S型记录锁,但不可X型记录锁
后,其他事务既不可以继续获取该记录的S型记录锁,也不MySQL
在REPEATABLE READ
隔离级别下是可以解决幻读问题
的,解决方案有两种,可以使用MVCC方案
解决,也可以采用加锁方案
解决。但是在使用加锁方案解决时有个大问题,就是事务在第一次执行读取操作时,那些幻影记录尚不存在,我们无法给这些幻影记录加上记录锁。InnoDB提出了一种称之为Gap Locks
的锁,官方的类型名称为:LOCK_GAP
,我们可以简称为gap锁
。比如,把id值为8的那条记录加一个gap锁的示意图如下。
图中id值为8的记录加了gap锁
,意味着不允许别的事务在id值为8的记录前边的间隙插入新记录
,其实就是id列的值(3, 8)这个区间的新记录是不允许立即插入的。比如,有另外一个事务再想插入一条id值为4的新
记录,它定位到该条新记录的下一条记录的id值为8,而这条记录上又有一个gap锁,所以就会阻塞插入
操作,直到拥有这个gap锁的事务提交了之后,id列的值在区间(3, 8)中的新记录才可以被插入。
gap锁的提出仅仅是为了防止插入幻影记录而提出的。 虽然有共享gap锁
和独占gap锁
这样的说法,但是它们起到的作用是相同的。而且如果对一条记录加了gap锁(不论是共享gap锁还是独占gap锁),并不会限制其他事务对这条记录加记录锁或者继续加gap锁。
举例:
这里session 2并不会被堵住。因为表里并没有id=5这个记录,因此session 1加的是间隙锁(3,8)(这是开区间)。而session 2也是在这个间隙加的间隙锁。它们有共同的目标,即:保护这个间隙,不允许插入值。但,它们之间是不冲突的。
注意,给一条记录加了gap锁
只是不允许
其他事务往这条记录前边的间隙插入新记录
,那对于最后一条记录之后的间隙,也就是student 表中id值为20
的记录之后的间隙该咋办呢?也就是说给哪条记录加gap锁
才能阻止其他事务插入id
值在(20,+∞)
这个区间的新记录呢?这时候我们在讲数据页时介绍的两条伪记录派上用场了:
Infimum
记录,表示该页面中最小的记录。Supremum
记录,表示该页面中最大的记录。为了实现阻止其他事务插入id值在(20, +∞)这个区间的新记录,我们可以给索引中的最后一条记录,也就是id值为20的那条记录所在页面的Supremum记录加上一个gap锁,如图所示。
mysql> SELECT *FROM performance_schema .data_locks\G
*************************** 1. row ***************************
ENGINE: INNODB
ENGINE_LOCK_ID: 139823931194584:1156:139823935464448
ENGINE_TRANSACTION_ID: 421298907905240
THREAD_ID: 123
EVENT_ID: 32
OBJECT_SCHEMA: atguigudb3
OBJECT_NAME: student
PARTITION_NAME: NULL
SUBPARTITION_NAME: NULL
INDEX_NAME: NULL
OBJECT_INSTANCE_BEGIN: 139823935464448
LOCK_TYPE: TABLE
LOCK_MODE: IS
LOCK_STATUS: GRANTED
LOCK_DATA: NULL
*************************** 2. row ***************************
ENGINE: INNODB
ENGINE_LOCK_ID: 139823931194584:95:4:1:139823935461392
ENGINE_TRANSACTION_ID: 421298907905240
THREAD_ID: 123
EVENT_ID: 32
OBJECT_SCHEMA: atguigudb3
OBJECT_NAME: student
PARTITION_NAME: NULL
SUBPARTITION_NAME: NULL
INDEX_NAME: PRIMARY
OBJECT_INSTANCE_BEGIN: 139823935461392
LOCK_TYPE: RECORD
LOCK_MODE: S
LOCK_STATUS: GRANTED
LOCK_DATA: supremum pseudo-record
2 rows in set (0.00 sec)
mysql> COMMIT;
Query OK, 0 rows affected (0.00 sec)
间隙锁的引入,可能会导致同样的语句,锁住更大的范围,这其实是影响了并发度的。下面的例子会产生死锁
有时候我们既想锁住某条记录
,又想阻止
其他事务在该记录前边的间隙插入新记录
,所以InnoDB就提出了一种称之为Next-Key Locks
的锁,官方的类型名称为:LOCK_ORDINARY
,我们也可以简称为next-key锁
。Next-Key Locks是在存储引擎innodb
、事务级别在可重复读
的情况下使用的数据库锁,innodb默认的锁就是Next-Key locks。比如,我们把id值为8的那条记录加一个next-key锁的示意图如下:
next-key锁
的本质就是一个记录锁
和一个gap锁
的合体,它既能保护该条记录,又能阻止别的事务将新记录插入被保护记录前边的间隙
。
begin;
select * from student where id <=8 and id > 3 for update;
我们说一个事务在插入
一条记录时需要判断一下插入位置是不是被别的事务加了 gap锁
( next-key锁
也包含gap锁
),如果有的话,插入操作需要等待,直到拥有gap锁
的那个事务提交。但是InnoDB规
定事务在等待的时候也需要在内存中生成一个锁结构,表明有事务想在某个间隙
中插入
新记录,但是
现在在等待。InnoDB就把这种类型的锁命名为Insert Intention Locks
,官方的类型名称为:
LOCK_INSERT_INTENTION
,我们称为插入意向锁
。插入意向锁是一种Gap锁
,不是意向锁,在insert
操作时产生。
插入意向锁是在插入一条记录行前,由INSERT操作产生的一种间隙锁
。该锁用以表示插入意向,当多个事务在同一区间(gap)插入位置不同的多条数据时,事务之间不需要互相等待。假设存在两条值分别为4和7的记录,两个不同的事务分别试图插入值为5和6的两条记录,每个事务在获取插入行上独占的(排他)锁前,都会获取(4,7)之间的间隙锁,但是因为数据行之间并不冲突,所以两个事务之间并不会产生冲突(阻塞等待)。总结来说,插入意向锁的特性可以分成两部分:
特殊的间隙锁
——间隙锁可以锁定开区间内的部分记录。注意,虽然插入意向锁中含有意向锁三个字,但是它并不属于意向锁而属于间隙锁,因为意向锁是表锁而插入意向锁是行锁。
比如,把id值为8的那条记录加一个插入意向锁的示意图如下:
比如,现在T1为id值为8的记录加了一个gap锁,然后T2和T3分别想向student表中插入id值分别为4、5的两条记录,所以现在为id值为8的记录加的锁的示意图就如下所示:
从图中可以看到,由于T1持有gap锁
,所以T2和T3需要生成一个插入意向锁
的锁结构并且处于等待状态。当T1提交后会把它获取到的锁都释放掉,这样T2和T3就能获取到对应的插入意向锁
了(本质上就是把意向锁
对应锁结构
的is_waiting
属性改为false
). T2和T3之间也并不会相互阻塞,它们可以同时获取到id值为8的插入意向锁
,然后执行插入操作。事实上插入意向锁
并不会阻止别的事务继续获取该记录上任何类型的锁。
页锁就是在页的粒度
上进行锁定,锁定的数据资源比行锁要多,因为一个页中可以有多个行记录。当我们使用页锁的时候,会出现数据浪费的现象,但这样的浪费最多也就是一个页上的数据行。页锁的开销介于表锁和行锁之间,会出现死锁。锁定粒度介于表锁和行锁之间,并发度一般。
每个层级的锁数量是有限制的,因为锁会占用内存空间, 锁空间的大小是有限的
。当某个层级的锁数量
超过了这个层级的阈值时,就会进行锁升级
。锁升级就是用更大粒度的锁替代多个更小粒度的锁,比如
InnoDB 中行锁升级为表锁
,这样做的好处是占用的锁空间降低了,但同时数据的并发度也下降了。
从对待锁的态度来看锁的话,可以将锁分成乐观锁和悲观锁,从名字中也可以看出这两种锁是两种看待数据并发的思维方式
。需要注意的是,乐观锁和悲观锁并不是锁,而是锁的设计思想
。
悲观锁是一种思想,顾名思义,就是很悲观,对数据被其他事务的修改持保守态度,会通过数据库自身
的锁机制来实现,从而保证数据操作的排它性。
悲观锁总是假设最坏的情况,每次去拿数据的时候都认为别人会修改,所以每次在拿数据的时候都会上
锁,这样别人想拿这个数据就会阻塞
直到它拿到锁(共享资源每次只给一个线程使用,其它线程阻塞,
用完后再把资源转让给其它线程)。比如行锁,表锁等,读锁,写锁等,都是在做操作之前先上锁,当
其他线程想要访问数据时,都需要阻塞挂起。Java中synchronized
和ReentrantLock
等独占锁就是
悲观锁思想的实现。
秒杀案例1:
商品秒杀过程中,库存数量的减少,避免出现超卖
的情况。比如,商品表中有一个字段为quantity表示当前该商品的库存量。假设商品为华为mate40,id为1001,quantity=100个。如果不使用锁的情况下,操作方法如下所示
#第1步:查出商品库存
select quantity from items where id = 1001;
#第2步:如果库存大于日,则根据商品信息生产订单
insert into orders (item_id)values ( 1001 ) ;
#第3步:修改商品的库存,num表示购买数量
update items set quantity = quantity-num where id = 1001 ;
这样写的话,在并发量小的公司没有大的问题I但是如果在高并发环境
下可能出现以下问题
其中线程B此时已经下单并且减完库存,这个时候线程A依然去执行step3,就造成了超卖。
我们使用悲观锁可以解决这个问题,商品信息从查询出来到修改,中间有一个生成订单的过程,使用悲观锁的原理就是,当我们在查询items信息后就把当前的数据锁定,直到我们修改完毕后再解锁。那么整个过程中,因为数据被锁定了,就不会出现有第三者来对其进行修改了。而这样做的前提是需要将要执行的SQL语句放在同一个事务中,否则达不到锁定数据行的目的。
修改如下:
#第1步:查出商品库存
select quantity from items where id = 1001 for update; # 加上X锁
#第2步:如果库存大于日,则根据商品信息生产订单
insert into orders (item_id) values( 1001)
;#第3步:修改商品的库存,num表示购买数量
update items set quantity = quantity-num where id = 1001;
select .... for update
是MySQL中悲观锁。此时在items表中,id为1001的那条数据就被我们锁定了,其他的要执行select quantity from items where id = 1001 for update;
语句的事务必须等本次事务提交之后才能执行。这样我们可以保证当前的数据不会被其它事务修改。
注意,当执行select quantity from items where id = 1001 for update;
语句之后,如果在其他事务中执行select quantity from items where id = 1001;语句,并不会受第一个事务的影响,仍然可以正常查询出数据。
注意: select ... for update
语句执行过程中所有扫描的行都会被锁上,因此在MySQL中用悲观锁必须确定使用了索引,而不是全表扫描,否则将会把整个表锁住。
悲观锁不适用的场景较多,它存在一些不足,因为悲观锁大多数情况下依靠数据库的锁机制来实现,以保证程序的并发访问性,同时这样对数据库性能开销影响也很大,特别是长事务
而言,这样的开销往往无法承受
,这时就需要乐观锁。
乐观锁认为对同一数据的并发操作不会总发生,属于小概率事件,不用每次都对数据上锁,但是在更新
的时候会判断一下在此期间别人有没有去更新这个数据,也就是不采用数据库自身的锁机制,而是通过
程序来实现。在程序上,我们可以采用版本号机制
或者CAS机制
实现。乐观锁适用于多读的应用类型,
**这样可以提高吞吐量。**在Java中java.util.concurrent.atomic
包下的原子变量类就是使用了乐观锁的一种实现方式:CAS实现的。
在表中设计一个版本字段 version
,第一次读的时候,会获取 version 字段的取值。然后对数据进行更
新或删除操作时,会执行UPDATE ... SET version=version+1 WHERE version=version
。此时
如果已经有事务对这条数据进行了更改,修改就不会成功。
这种方式类似我们熟悉的SVN、CVS版本管理系统,当我们修改了代码进行提交时,首先会检查当前版本号与服务器上的版本号是否一致,如果一致就可以直接提交,如果不一致就需要更新服务器上的最新代码,然后再进行提交。
时间戳和版本号机制一样,也是在更新提交的时候,将当前数据的时间戳和更新之前取得的时间戳进行
比较,如果两者一致则更新成功,否则就是版本冲突。
你能看到乐观锁就是程序员自己控制数据并发操作的权限,基本是通过给数据行增加一个戳(版本号或
者时间戳),从而证明当前拿到的数据是否最新。
秒杀案例2:
依然使用上面秒杀的案例,执行流程如下
#第1步:查出商品库存
select quantity from items where id = 1001;
#第2步:如果库存大于0,则根据商品信息生产订单
insert into orders (item_id)values(1001);
#第3步:修改商品的库存,num表示购买数量
update items set quantity = quantity - num , version = version+1 where id = 1001 and version = #{version};
注意,如果数据表是读写分离
的表,当matser表
中写入的数据没有及时同步到slave表
中时,会造成更新一直失败的问题。此时需要强制读取master表
中的数据(即将select语句放到事务中即可,这时候查询的就是master主库
了。)
如果我们对通一条数据进行频繁的修改
的话,那么就会出现这么一种场景,每次修改都只有一个事务能更新成功,在业务感知上面就有大量的失败操作。我们把代码修改如下:
#第1步:查出商品库存
select quantity from items where id = 1001;
#第2步:如果库存大于8,则根据商品信息生产订单
insert into orders (item_id)values ( 1001 );
#第3步:修改商品的库存,num表示购买数量
update items set quantity = quantity-num where id = 1001 and quantity-num>0;
这样就会使每次修改都能成功,而且不会出现超卖的现象。
从这两种锁的设计思想中,我们总结一下乐观锁和悲观锁的适用场景:
乐观锁
适合读操作多
的场景,相对来说写的操作比较少。它的优点在于程序实现
, 不存在死锁 问题
,不过适用场景也会相对乐观,因为它阻止不了除了程序以外的数据库操作。悲观锁
适合写操作多
的场景,因为写的操作具有排它性
。采用悲观锁的方式,可以在数据库层读 - 写
和写 - 写
的冲突。我们把乐观锁和悲观锁总结如下图所示。
一个事务在执行INSERT
操作时,如果即将插入的间隙已经被其他事务加了gap锁
,那么本次INSERT操作会阻塞,并且当前事务会在该间隙上加一个插入意向锁
,否则一般情况下INSERT
操作是不加锁的。那如果一个事务首先插入了一条记录(此时并没有在内存生产与该记录关联的锁结构),然后另一个事务:
立即使用SELECT ... LOCK IN SHARE MODE
语句读取这条记录,也就是要获取这条记录的S锁
,或者使用SELECT ... FOR UPDATE
语句读取这条记录,也就是要获取这条记录的X锁
,怎么办?
如果允许这种情况的发生,那么可能产生脏读
问题。
立即修改这条记录,也就是要获取这条记录的X锁
,怎么办?
如果允许这种情况的发生,那么可能产生脏写
问题。
这时候我们前边提过的事务id
又要起作用了。我们把聚簇索引和二级索引中的记录分开看一下:
trx_id
隐藏列,该隐藏列记录着最后改动该记录的事务id。那么如果在当前事务中新插入一条聚簇索引记录后,该记录的trx_id
隐藏列代表的的就是当前事务的事务id,如果其他事务此时想对该记录添加S锁或者X锁时,首先会看一下该记录的trx_id
隐藏列代表的事务是否是当前的活跃事务
,如果是的话,那么就帮助当前事务创建一个X锁(也就是为当前事务创建一个锁结构
,is_waiting
属性是false
),然后自己进入等待状态
(也就是为自己也创建一个锁结构
, is_waiting
属性是true
) 。trx_id
隐藏列,但是在二级索引页面的Page Header部分有一个PAGE_MAX_TRX_ID
属性,该属性代表对该页面做改动的最大的事务id,如果PAGE_NAX_TRX_ID
属性值小于当前最小的活跃事务id
,那么说明对该页面做修改的事务都已经提交
了,否则就需要在页面中定位到对应的二级索引
记录,然后回表
找到它对应的聚簇索引
记录,然后再重复情景一
的做法。即:一个事务对新插入的记录可以不显式的加锁(生成一个锁结构),但是由于事务id
的存在,相当于加了一个隐式锁
。别的事务在对这条记录加S锁
或者X锁
时,由于隐式锁
的存在,会先帮助当前事务生成一个锁结构
,然后自己再生成一个锁结构
后进入等待状态。隐式锁
是一种延迟加锁的机制,从而来减少加锁的数量。
隐式锁在实际内存对象中并不含有这个锁信息。只有当产生锁等待时,隐式锁转化为显式锁。
InnoDB的insert操作,对插入的记录不加锁,但是此时如果另一个线程进行当前读,类似以下的用例,session 2会锁等待session 1,那么这是如何实现的呢?
session1:
mysql> begin;
Query OK, 0 rows affected (0.00 sec)
mysql> SELECT
-> *^C
mysql> ^C
mysql> SELECT * from student;
+----+-----------+--------+
| id | name | class |
+----+-----------+--------+
| 1 | 张三3 | 一班 |
| 3 | 李四 1 | 一班 |
| 8 | 王五 | 二班 |
| 15 | 赵六 | 二班 |
| 17 | tom | 三班 |
| 20 | 钱七 | 三班 |
+----+-----------+--------+
6 rows in set (0.00 sec)
mysql> insert into student(id,name,class) values(2,'tom','一班');
Query OK, 1 row affected (0.00 sec)
session 2:
mysql> SELECT * FROM student lock in share mode;
ERROR 1205 (HY000): Lock wait timeout exceeded; try restarting transaction
mysql>
执行完成之后:(隐式锁现身,变成显示锁)
mysql> SELECT * FROM performance_schema.data_lock_waits\G;
Empty set (0.00 sec)
ERROR:
No query specified
mysql> SELECT * FROM performance_schema.data_lock_waits\G;
*************************** 1. row ***************************
ENGINE: INNODB
REQUESTING_ENGINE_LOCK_ID: 139823931196200:95:4:2:139823935473784
REQUESTING_ENGINE_TRANSACTION_ID: 421298907906856
REQUESTING_THREAD_ID: 136
REQUESTING_EVENT_ID: 23
REQUESTING_OBJECT_INSTANCE_BEGIN: 139823935473784
BLOCKING_ENGINE_LOCK_ID: 139823931194584:95:4:2:139823935461392
BLOCKING_ENGINE_TRANSACTION_ID: 1037298
BLOCKING_THREAD_ID: 136
BLOCKING_EVENT_ID: 23
BLOCKING_OBJECT_INSTANCE_BEGIN: 139823935461392
1 row in set (0.00 sec)
ERROR:
No query specified
通过特定的语句进行加锁,我们一般称之为显示加锁,例如:
显示加共享锁:
select ... lock in share mode
显示加排他锁
select ... for update
全局锁就是对整个数据库实例加锁
。当你需要让整个库处于只读状态
的时候,可以使用这个命令,之后其他线程的以下语句会被阻塞:数据更新语句(数据的增删改)、数据定义语句(包括建表、修改表结构等)和更新类事务的提交语句。全局锁的典型使用场景
是:做全库逻辑备份
。
全局锁的命令:
FLUSH TABLE WITH READ LOCK;
两个事务都持有对方需要的锁,并且在等待对方释放,并且双方都不会释放自己的锁。
举例1:
解释一下下面的过程,事务1开始开始事务,更新id为1的记录获得id=1的记录的排他锁,事务2再开始事务,更新id=2获得id=2的记录的排他锁,再接着事务1去获取id为2的记录的排他锁,等待。事务2去获取id为1记录的排他锁,也是等待。
举例2:
用户A给用户B转账100,在此同时,用户B也给用户A转账100。这个过程,可能导致死锁。
#事务1
update account set balance = balance - 100 where name = 'A';#操作1
update account set balance = balance + 100 where name = 'B';#操作3
#事务2
update account set balance = balance - 100 where name = 'B';#操作2
update account set balance = balance + 100 where name = 'A';#操作4
死锁的关键在于:两个(或以上)的Session加锁的顺序不一致。
**方式1:**等待,知道超时
即当两个事务互相等待时,当一个事务等待时间超过设置的阈值时,就将其回滚
,另外事务继续进行
。这种方法简单有效,在innodb中,参数innodb_lock_wait_timeout
用来设置超时时间
。
mysql> show variables like 'innodb_lock_wait_timeout';
+--------------------------+-------+
| Variable_name | Value |
+--------------------------+-------+
| innodb_lock_wait_timeout | 50 |
+--------------------------+-------+
1 row in set (0.00 sec)
缺点:对于在线服务来说,这个等待时间往往是无法接受的。
那将此值修改短一些,比如1s,0.1s是否合适?不合适,容易误伤到普通的锁等待。
**方式2:**使用死锁检测进行死锁处理
方式1检测死锁太过被动,innodb还提供了wait-for graph算法
来主动进行死锁检测,每当加锁请求无法立即满足需要并进入等待时,wait-for graph算法
都会被触发。
这是一种较为主动的死锁检测机制
,要求数据库保存锁的信息链表
和事务等待链表
两部分信息。
基于这两个信息,可以绘制wait-for graph(等待图),就是将上面的等待链表转换成下面的等待图,那个row是是按照事务开始的先后顺序来的。
死锁检测的原理是构建一个以事务为顶点、锁为边的有向图,判断有向图是否存在环,存在即有死锁。
一旦检测到回路、有死锁,这时候InnoDB存储引擎会选择回滚undo量最小的事务
,让其他事务继续执行( innodb_deadlock_detect=on
表示开启这个逻辑)。
mysql> show variables like 'innodb_deadlock_detect';
+------------------------+-------+
| Variable_name | Value |
+------------------------+-------+
| innodb_deadlock_detect | ON |
+------------------------+-------+
1 row in set (0.00 sec)
缺点:每个新的被阻塞的线程,都要判断是不是由于自己的加入导致了死锁,这个操作时间复杂度是O(n)。如果100个并发线程同时更新同一行,意味着要检测100*100= 1万次,1万个线程就会有1千万次检测。
如何解决?
进一步的思路:
可以考虑通过将一行改成逻辑上的多行来减少锁冲突
。比如,连锁超市账户总额的记录,可以考虑放到多条记录上。账户总额等于这多个记录的值的总和。
select ... for update
语句,如果是在事务里运行了start transaction
或设置了autocommit
等于0,那么就会锁定所查找到的记录。我们前边说对一条记录加锁的本质就是在内存中创建一个锁结构
与之关联,那么是不是一个事务对多条记录加锁,就要创建多个锁结构
呢?比如:
#事务T1
SELECT * FROM user LOCK IN SHARE MODE;
理论上创建多个锁结构
没问题,但是如果一个事务要获取10000条记录的锁,生成10000个锁结构也太崩溃了!所以决定在对不同记录加锁时,如果符合下边这些条件的记录会放到一个锁结构
中。
InnoDB
存储引擎中的锁结构
如下:
结构解析:
不论是表锁
还是行锁
,都是在事务执行过程中生成的,哪个事务生成了这个表结构
,这里就记录这个事务的信息。
此锁所在的事务信息
在内存结构中只是一个指针,通过指针可以找到内存中关于该事务的更多信息,比方说事务id等。
对于行锁来说,需要记录一下加锁的记录是属于哪个索引的。这里也是一个指针。
表锁结构
和行锁结构
在这个位置的内容是不同的:
表锁:
记载的是对哪个表加的锁,还有其他的一些信息。
行锁
记录三个重要的信息
Space ID
:记录所在的表空间。Page Number
:记录所在的页。n_bits
:对于行锁来说,一条记录就对应着一个比特位,一个页面中包含很多记录,用不同的比特位来区分到底是哪一条记录加了锁。为此在行锁结构的末尾放置了一堆比特位,这个n_bits
属性代表使用了多少比特位。n_bits的值一般都比页面中记录条数多一些。主要是为了之后在页面中插入了新记录后也不至于重新分配锁结构
这是一个32位
的数,被分成了lock_mode
、lock_type
和rec_lock_type
三个部分,如图所示:
锁的模式(lock_mode
),占用低4位,可选的值如下:
LOCK_IS
(十进制的0
)︰表示共享意向锁,也就是IS锁
。LOCK_IX
(十进制的1
)︰表示独占意向锁,也就是IX锁
。LOCK_S
(十进制的2
)∶表示共享锁,也就是S锁
。LOCK_X
(十进制的3
)∶表示独占锁,也就是X锁
。LOCK_AUTO_INC
(十进制的4
)︰表示AUTO-INC锁
。在InnoDB存储引擎中,LOCK_IS
,LOCK_IX
,LOCK_AUTO_INC
都算是表级锁的模式,LOCK_S
和LOCK_X
既可以算是表级锁的模式,也可以是行级锁的模式。
锁的类型(lock_type
),占用第5~8位,不过现阶段只有第5位和第6位被使用:
LOCK_TABLE
(十进制的16
),也就是当第5个比特位置为1时,表示表级锁
。LOCK_GAP
(十进制的512
):也就是当第10个比特位置为1时,表示gap锁
。LOCK_REC_NOT_GAP
(十进制的1024
):也就是当第11个比特位置为1时,表示正经记录锁
。LOCK_INSERT_INTENTION
(十进制的2848
)︰也就是当第12个比特位置为1时,表示插入意向锁
。其他的类型:还有一些不常用的类型我们就不多说了。is_waiting
属性呢?基于内存空间的节省,所以把is_waiting
属性放到了type_mode
这个32位的数字中:
LOCK_WAIT
(十进制的256
))︰当第9个比特位置为1
时,表示is_waiting
为true
,也就是当前事务尚未获取到锁,处在等待状态;当这个比特位为0
时,表示is_waiting
为false
,也就是当前事务获取锁成功。为了更好的管理系统运行过程中生成的各种锁结构而设计了各种哈希表和链表。
如果是行锁结构
的话,在该结构末尾还放置了一堆比特位,比特位的数量是由上边提到的n_bits
属性表示的。InnoDB数据页中的每条记录在记录头信息中都包含一个heap_no
属性,伪记录Infimum
的heap_no
值为0
,Supremum
的heap_no
值为1
,之后每插入一条记录,heap_no
值就增1。锁结构最后的一堆比特位就对应着一个页面中的记录,一个比特位映射一个heap_no
,即一个比特位映射到页内的一条记录。
关于MySQL锁的监控,我们一般可以通过检查InnoDB_row_lock
等状态变量来分析系统上的行锁的争夺情况
show status like 'innodb_row_lock%';
+-------------------------------+--------+
| Variable_name | Value |
+-------------------------------+--------+
| Innodb_row_lock_current_waits | 0 | # 表示当前正在等待的锁定的数量
| Innodb_row_lock_time | 317735 | # 从机器启动到现在锁定的总时长
| Innodb_row_lock_time_avg | 16722 | # 从机器启动到现在锁定的平均花费时长
| Innodb_row_lock_time_max | 50133 | # 锁等待最多花费时长
| Innodb_row_lock_waits | 19 | # 锁等待的次数
+-------------------------------+--------+
5 rows in set (0.00 sec)
对各个状态量的说明如下:
Innodb_row_lock_current_waits
:当前正在等待锁定的数量;Innodb_row_lock_time
:从系统启动到现在锁定总时间长度;(等待总时长)Innodb_row_lock_time_max
:从系统启动到现在等待最常的一次所花的时间;Innodb_row_lock_waits
:系统启动后到现在总共等待的次数;(等待总次数)对于这5个状态变量,比较重要的3个见上面(橙色)。
尤其是当等待次数很高,而且每次等待时长也不小的时候,我们就需要分析系统中为什么会有如此多的等待,然后根据分析结果着手指定优化计划。
其他监控方法:
MySQL把事务和锁的信息记录在了information_schema
库中,涉及到的三张表分别是INNODB_TRX
、INNODB_LOCKS
和INNODB_LOCK_WAITS
。
MySQL5.7及之前
,可以通过information_schema.INNODB_LOCKS
查看事务的锁情况,但只能看到阻塞事务的锁;如果事务并未被阻塞,则在该表中看不到该事务的锁情况。
select * from information_schema.InnoDB_TRX\G
*************************** 1. row ***************************
trx_id: 1037326
trx_state: LOCK WAIT
trx_started: 2022-04-09 23:03:30
trx_requested_lock_id: 139823931196200:95:4:7:139823935473784
trx_wait_started: 2022-04-09 23:05:11
trx_weight: 2
trx_mysql_thread_id: 77
trx_query: SELECT * FROM student for update
trx_operation_state: starting index read
trx_tables_in_use: 1
trx_tables_locked: 1
trx_lock_structs: 2
trx_lock_memory_bytes: 1128
trx_rows_locked: 2
trx_rows_modified: 0
trx_concurrency_tickets: 0
trx_isolation_level: REPEATABLE READ
trx_unique_checks: 1
trx_foreign_key_checks: 1
trx_last_foreign_key_error: NULL
trx_adaptive_hash_latched: 0
trx_adaptive_hash_timeout: 0
trx_is_read_only: 0
trx_autocommit_non_locking: 0
trx_schedule_weight: 1
*************************** 2. row ***************************
trx_id: 1037325
trx_state: RUNNING
trx_started: 2022-04-09 23:03:19
trx_requested_lock_id: NULL
trx_wait_started: NULL
trx_weight: 2
trx_mysql_thread_id: 75
trx_query: NULL
trx_operation_state: NULL
trx_tables_in_use: 0
trx_tables_locked: 1
trx_lock_structs: 2
trx_lock_memory_bytes: 1128
trx_rows_locked: 8
trx_rows_modified: 0
trx_concurrency_tickets: 0
trx_isolation_level: REPEATABLE READ
trx_unique_checks: 1
trx_foreign_key_checks: 1
trx_last_foreign_key_error: NULL
trx_adaptive_hash_latched: 0
trx_adaptive_hash_timeout: 0
trx_is_read_only: 0
trx_autocommit_non_locking: 0
trx_schedule_weight: NULL
2 rows in set (0.00 sec)
MySQL8.0
删除了information_schema.INNODB_LOCKS,添加了performance_schema.data_locks
,可以通过performance_schema.data_locks
查看事务的锁情况,和MySQL5.7及之前不同,performance_schemidata_locks
不但可以看到阻塞该事务的锁,还可以看到该事务所持有的锁。
select * from performance_schema.data_locks\G
同时,information_schema.INNODB_LOCK_WAITS也被performance_schema. data_lock_waits
所代替。
我们模拟一个锁等待的场景,以下是从这三张表收集的信息
锁等待场景,我们依然使用记录锁中的案例,当事务2进行等待时,查询情况如下:
mysql> select * from performance_schema. data_lock_waits\G
*************************** 1. row ***************************
ENGINE: INNODB
REQUESTING_ENGINE_LOCK_ID: 139823931196200:95:4:7:139823935474128
REQUESTING_ENGINE_TRANSACTION_ID: 1037326
REQUESTING_THREAD_ID: 136
REQUESTING_EVENT_ID: 56
REQUESTING_OBJECT_INSTANCE_BEGIN: 139823935474128
BLOCKING_ENGINE_LOCK_ID: 139823931194584:95:4:7:139823935461392
BLOCKING_ENGINE_TRANSACTION_ID: 1037325
BLOCKING_THREAD_ID: 134
BLOCKING_EVENT_ID: 62
BLOCKING_OBJECT_INSTANCE_BEGIN: 139823935461392
1 row in set (0.00 sec)