并发控制
11.1 并发控制概述
事务是并发控制的基本单位
并发控制机制的任务
对并发操作进行正确调度
保证事务的隔离性
保证数据库的一致性
这种情况称为数据库的不一致性,是由并发操作引起的。
在并发操作情况下,对T1、T2两个事务的操作序列的调度是随机的。
若按上面的调度序列执行,T1事务的修改就被丢失。
原因:第4步中T2事务修改A并写回后覆盖了T1事务的修改
并发操作带来的数据不一致性
1.丢失修改(Lost Update)
2.不可重复读(Non-repeatable Read)
3.读“脏”数据(Dirty Read)
记号
R(x):读数据x
W(x):写数据x
1. 丢失修改
两个事务T1和T2读入同一数据并修改,T2的提交结果破坏了T1提交的结果,导致T1的修改被丢失。
上面飞机订票例子就属此类
2. 不可重复读
不可重复读包括三种情况:
(1)事务T1读取某一数据后,事务T2对其做了修改,当事务T1再次读该数据时,得到与前一次不同的值
T1 |
T2 |
① R(A)=50 |
|
R(B)=100 |
|
求和=150 |
|
② |
R(B)=100 |
|
B←B*2 |
|
W(B)=200 |
③ R(A)=50 |
|
R(B)=200 |
|
求和=250 |
|
(验算不对) |
|
T1读取B=100进行运算
T2读取同一数据B,对其进行修改后将B=200写回数据库。
T1为了对读取值校对重读B,B已为200,与第一次读取值不一致
(2)事务T1按一定条件从数据库中读取了某些数据记录后,事务T2删除了其中部分记录,当T1再次按相同条件读取数据时,发现某些记录神秘地消失了。
(3)事务T1按一定条件从数据库中读取某些数据记录后,事务T2插入了一些记录,当T1再次按相同条件读取数据时,发现多了一些记录。
后两种不可重复读有时也称为幻影现象(Phantom Row)
3. 读“脏”数据
读“脏”数据是指:
事务T1修改某一数据,并将其写回磁盘
事务T2读取同一数据后,T1由于某种原因被撤销
这时T1已修改过的数据恢复原值,T2读到的数据就与数据库中的数据不一致
T2读到的数据就为“脏”数据,即不正确的数据
T1 |
T2 |
① R(C)=100 |
|
C←C*2 |
|
W(C)=200 |
|
② |
R(C)=200 |
|
|
|
|
③ ROLLBACK |
|
C恢复为100 |
|
T1将C值修改为200,T2读到C为200
T1由于某种原因撤销,其修改作废,C恢复原值100
这时T2读到的C为200,与数据库内容不一致,就是“脏”数据
并发控制概述
数据不一致性:由于并发操作破坏了事务的隔离性
并发控制就是要用正确的方式调度并发操作,使一个用户事务的执行不受其他事务的干扰,从而避免造成数据的不一致性
对数据库的应用有时允许某些不一致性,例如有些统计工作涉及数据量很大,读到一些“脏”数据对统计精度没什么影响,可以降低对一致性的要求以减少系统开销
并发控制的主要技术
封锁(Locking)
时间戳(Timestamp)
乐观控制法
多版本并发控制(MVCC)
11.2 封锁
什么是封锁
封锁就是事务T在对某个数据对象(例如表、记录等)操作之前,先向系统发出请求,对其加锁
加锁后事务T就对该数据对象有了一定的控制,在事务T释放它的锁之前,其它的事务不能更新此数据对象。
封锁是实现并发控制的一个非常重要的技术
基本封锁类型
一个事务对某个数据对象加锁后究竟拥有什么样的控制由封锁的类型决定。
基本封锁类型
排它锁(Exclusive Locks,简记为X锁)
共享锁(Share Locks,简记为S锁)
排它锁
排它锁又称为写锁
若事务T对数据对象A加上X锁,则只允许T读取和修改A,其它任何事务都不能再对A加任何类型的锁,直到T释放A上的锁
保证其他事务在T释放A上的锁之前不能再读取和修改A
共享锁
共享锁又称为读锁
若事务T对数据对象A加上S锁,则事务T可以读A但不能修改A,其它事务只能再对A加S锁,而不能加X锁,直到T释放A上的S锁
保证其他事务可以读A,但在T释放A上的S锁之前不能对A做任何修改
锁的相容矩阵
T1
|
X |
S |
_ |
X |
N |
N |
Y |
S |
N |
Y |
Y |
_ |
Y |
Y |
Y |
Y=Yes,相容的请求
N=No,不相容的请求
11.3 封锁协议
什么是封锁协议
在运用X锁和S锁对数据对象加锁时,需要约定一些规则,这些规则为封锁协议(Locking Protocol)。
何时申请X锁或S锁
持锁时间
何时释放
对封锁方式规定不同的规则,就形成了各种不同的封锁协议,它们分别在不同的程度上为并发操作的正确调度提供一定的保证
保持数据一致性的常用封锁协议
三级封锁协议
1. 一级封锁协议
级封锁协议
事务T在修改数据R之前必须先对其加X锁,直到事务结束才释放。
正常结束(COMMIT)
非正常结束(ROLLBACK)
一级封锁协议可防止丢失修改,并保证事务T是可恢复的。
在一级封锁协议中,如果仅仅是读数据不对其进行修改,是不需要加锁的,所以它不能保证可重复读和不读“脏”数据。
2. 二级封锁协议
二级封锁协议
一级封锁协议加上事务T在读取数据R之前必须先对其
加S锁,读完后即可释放S锁。
二级封锁协议可以防止丢失修改和读“脏”数据。
在二级封锁协议中,由于读完数据后即可释放S锁,所以它不能保证可重复读
3. 三级封锁协议
三级封锁协议
一级封锁协议加上事务T在读取数据R之前必须先对其加S锁,直到事务结束才释放。
三级封锁协议可防止丢失修改、读脏数据和不可重复读。
11.4 活锁和死锁
封锁技术可以有效地解决并行操作的一致性问题,但也带来一些新的问题
死锁
活锁
11.4.1 活锁
事务T1封锁了数据R
事务T2又请求封锁R,于是T2等待。
T3也请求封锁R,当T1释放了R上的封锁之后系统首先批准了T3的请求,T2仍然等待。
T4又请求封锁R,当T3释放了R上的封锁之后系统又批准了T4的请求……
T2有可能永远等待,这就是活锁的情形
T1 |
T2 |
T3 |
T4 |
Lock R |
• • • |
• • • |
• • • |
• |
Lock R |
|
|
• |
等待 |
Lock R |
|
• |
等待 |
• |
Lock R |
Unlock R |
等待 |
• |
等待 |
|
等待 |
Lock R |
等待 |
• |
等待 |
• |
等待 |
• |
等待 |
Unlock |
等待 |
• |
等待 |
• |
Lock R |
|
等待 |
• |
• •
|
避免活锁:采用先来先服务的策略
当多个事务请求封锁同一数据对象时
按请求封锁的先后次序对这些事务排队
该数据对象上的锁一旦释放,首先批准申请队列中第一个事务获得锁
11.4.2 死锁
事务T1封锁了数据R1
T2封锁了数据R2
T1又请求封锁R2,因T2已封锁了R2,于是T1等待T2释放R2上的锁
接着T2又申请封锁R1,因T1已封锁了R1,T2也只能等待T1释放R1上的锁
这样T1在等待T2,而T2又在等待T1,T1和T2两个事务永远不能结束,形成死锁
T1 |
T2 |
Lock R1 |
• • • |
• |
Lock R2 |
• • |
• • |
Lock R2 |
• |
等待 |
|
等待 |
|
等待 |
Lock R1 |
等待 |
等待 |
等待 |
等待 |
|
• • • |
解决死锁的方法
两类方法
1. 死锁的预防
产生死锁的原因是两个或多个事务都已封锁了一些数据对象,然后又都请求对已为其他事务封锁的数据对象加锁,从而出现死等待。
预防死锁的发生就是要破坏产生死锁的条件
预防死锁的方法
(1)一次封锁法
(2)顺序封锁法
2. 死锁的诊断与解除
死锁的诊断
(1)超时法
如果一个事务的等待时间超过了规定的时限,就认为发生了死锁
优点:实现简单
缺点
有可能误判死锁
时限若设置得太长,死锁发生后不能及时发现
(2)等待图法
用事务等待图动态反映所有事务的等待情况
事务等待图是一个有向图G=(T,U)
T为结点的集合,每个结点表示正运行的事务
U为边的集合,每条边表示事务等待的情况
若T1等待T2,则T1,T2之间划一条有向边,从T1指向T2
图(a)中,事务T1等待T2,T2等待T1,产生了死锁
图(b)中,事务T1等待T2,T2等待T3,T3等待T4,T4又等待T1,产生了死锁
图(b)中,事务T3可能还等待T2,在大回路中又有小的回路
并发控制子系统周期性地(比如每隔数秒)生成事务等待图,检测事务。如果发现图中存在回路,则表示系统中出现了死锁
解除死锁
选择一个处理死锁代价最小的事务,将其撤消
释放此事务持有的所有的锁,使其它事务能继续运行下去
11.5 并发调度的可串行性
数据库管理系统对并发事务不同的调度可能会产生不同的结果
串行调度是正确的
执行结果等价于串行调度的调度也是正确的,称为可串行化调度
11.5.1 可串行化调度
可串行化(Serializable)调度
多个事务的并发执行是正确的,当且仅当其结果与按某一次序串行地执行这些事务时的结果相同
可串行性(Serializability)
是并发事务正确调度的准则
一个给定的并发调度,当且仅当它是可串行化的,才认为是正确调度
[例11.2]现在有两个事务,分别包含下列操作:
事务T1:读B;A=B+1;写回A
事务T2:读A;B=A+1;写回B
现给出对这两个事务不同的调度策略
T1 |
T2 |
Slock B |
|
Y=R(B)=2 |
|
Unlock B |
|
Xlock A |
|
A=Y+1=3 |
|
W(A) |
|
Unlock A |
|
|
Slock A |
|
X=R(A)=3 |
|
Unlock A |
|
Xlock B |
|
B=X+1=4 |
|
W(B) |
|
Unlock B |
n假设A、B的初值均为2。
n按T1→T2次序执行结果为A=3,B=4
n串行调度策略,正确的调度
T1 |
T2 |
|
Slock A |
|
X=R(A)=2 |
|
Unlock A |
|
Xlock B |
|
B=X+1=3 |
|
W(B) |
|
Unlock B |
Slock B |
|
Y=R(B)=3 |
|
Unlock B |
|
Xlock A |
|
A=Y+1=4 |
|
W(A) |
|
Unlock A |
|
n假设A、B的初值均为2。
nT2→T1次序执行结果为B=3,A=4
n串行调度策略,正确的调度
T1 |
T2 |
Slock B |
|
Y=R(B)=2 |
|
|
Slock A |
|
X=R(A)=2 |
Unlock B |
|
|
Unlock A |
Xlock A |
|
A=Y+1=3 |
|
W(A) |
|
|
Xlock B |
|
B=X+1=3 |
|
W(B) |
Unlock A |
|
|
Unlock B |
执行结果与(a)、(b)的结果都不同
是错误的调度
T1 |
T2 |
Slock B |
|
Y=R(B)=2 |
|
Unlock B |
|
Xlock A |
|
|
Slock A |
A=Y+1=3 |
等待 |
W(A) |
等待 |
Unlock A |
等待 |
|
X=R(A)=3 |
|
Unlock A |
|
Xlock B |
|
B=X+1=4 |
|
W(B) |
|
Unlock B |
执行结果与串行调度(a)的执行结果相同
是正确的调度
11.5.2 冲突可串行化调度
冲突可串行化
一个比可串行化更严格的条件
商用系统中的调度器采用
冲突操作:是指不同的事务对同一数据的读写操作和写写操作:
Ri(x)与Wj(x) /*事务Ti读x,Tj写x,其中i≠j*/
Wi(x)与Wj(x) /*事务Ti写x,Tj写x,其中i≠j*/
其他操作是不冲突操作
冲突
不能交换(Swap)的动作:
同一事务的两个操作
不同事务的冲突操作
冲突可串行化
一个调度Sc在保证冲突操作的次序不变的情况下,通过交换两个事务不冲突操作的次序得到另一个调度Sc’,如果Sc’是串行的,称调度Sc是冲突可串行化的调度
若一个调度是冲突可串行化,则一定是可串行化的调度
可用这种方法判断一个调度是否是冲突可串行化的
冲突可串行化调度
冲突可串行化调度是可串行化调度的充分条件,不是必要条件。还有不满足冲突可串行化条件的可串行化调度。
[例11.4]有3个事务
T1=W1(Y)W1(X),T2=W2(Y)W2(X),T3=W3(X)
调度L1=W1(Y)W1(X)W2(Y)W2(X) W3(X)是一个串行调度。
调度L2=W1(Y)W2(Y)W2(X)W1(X)W3(X)不满足冲突可串行化。但是调度L2是可串行化的,因为L2执行的结果与调度L1相同,Y的值都等于T2的值,X的值都等于T3的值
11.6 两段锁协议
数据库管理系统普遍采用两段锁协议的方法实现并发调度的可串行性,从而保证调度的正确性
两段锁协议
指所有事务必须分两个阶段对数据项加锁和解锁
在对任何数据进行读、写操作之前,事务首先要获得对该数据的封锁
在释放一个封锁之后,事务不再申请和获得任何其他封锁
“两段”锁的含义
事务分为两个阶段
第一阶段是获得封锁,也称为扩展阶段
事务可以申请获得任何数据项上的任何类型的锁,但是不能释放任何锁
第二阶段是释放封锁,也称为收缩阶段
事务可以释放任何数据项上的任何类型的锁,但是不能再申请任何锁
事务T1 |
事务T2 |
Slock A |
|
R(A)=260 |
|
|
Slock C |
|
R(C)=300 |
Xlock A |
|
W(A)=160 |
|
|
Xlock C |
|
W(C)=250 |
|
Slock A |
Slock B |
等待 |
R(B)=1000 |
等待 |
Xlock B |
等待 |
W(B)=1100 |
等待 |
Unlock A |
等待 |
|
R(A)=160 |
|
Xlock A |
Unlock B |
|
|
W(A)=210 |
|
Unlock C |
两段锁协议
事务遵守两段锁协议是可串行化调度的充分条件,而不是必要条件。
若并发事务都遵守两段锁协议,则对这些事务的任何并发调度策略都是可串行化的
若并发事务的一个调度是可串行化的,不一定所有事务都符合两段锁协议
两段锁协议与防止死锁的一次封锁法
一次封锁法要求每个事务必须一次将所有要使用的数据全部加锁,否则就不能继续执行,因此一次封锁法遵守两段锁协议
但是两段锁协议并不要求事务必须一次将所有要使用的数据全部加锁,因此遵守两段锁协议的事务可能发生死锁
11.7 封锁的粒度
封锁粒度
封锁对象的大小称为封锁粒度(Granularity)
封锁的对象:逻辑单元,物理单元
例:在关系数据库中,封锁对象:
逻辑单元: 属性值、属性值的集合、元组、关系、索引项、整个索引、整个数据库等
物理单元:页(数据页或索引页)、物理记录等
封锁粒度与系统的并发度和并发控制的开销密切相关。
封锁的粒度越大,数据库所能够封锁的数据单元就越少,并发度就越小,系统开销也越小;
封锁的粒度越小,并发度较高,但系统开销也就越大
例
若封锁粒度是数据页,事务T1需要修改元组L1,则T1必须对包含L1的整个数据页A加锁。如果T1对A加锁后事务T2要修改A中元组L2,则T2被迫等待,直到T1释放A。
如果封锁粒度是元组,则T1和T2可以同时对L1和L2加锁,不需要互相等待,提高了系统的并行度。
又如,事务T需要读取整个表,若封锁粒度是元组,T必须对表中的每一个元组加锁,开销极大
多粒度封锁(Multiple Granularity Locking)
在一个系统中同时支持多种封锁粒度供不同的事务选择
选择封锁粒度
同时考虑封锁开销和并发度两个因素, 适当选择封锁粒度
需要处理多个关系的大量元组的用户事务:以数据库为封锁单位
需要处理大量元组的用户事务:以关系为封锁单元
只处理少量元组的用户事务:以元组为封锁单位
11.7.1 多粒度封锁
多粒度树
以树形结构来表示多级封锁粒度
根结点是整个数据库,表示最大的数据粒度
叶结点表示最小的数据粒度
例:三级粒度树。根结点为数据库,数据库的子结点为关系,关系的子结点为元组。
允许多粒度树中的每个结点被独立地加锁
对一个结点加锁意味着这个结点的所有后裔结点也被加以同样类型的锁
在多粒度封锁中一个数据对象可能以两种方式封锁:显式封锁和隐式封锁
显式封锁和隐式封锁
显式封锁: 直接加到数据对象上的封锁
隐式封锁:是该数据对象没有独立加锁,是由于其上级结点加锁而使该数据对象加上了锁
显式封锁和隐式封锁的效果是一样的
系统检查封锁冲突时
要检查显式封锁
还要检查隐式封锁
例如事务T要对关系R1加X锁
系统必须搜索其上级结点数据库、关系R1
还要搜索R1的下级结点,即R1中的每一个元组
如果其中某一个数据对象已经加了不相容锁,则T必须等待
对某个数据对象加锁,系统要检查
该数据对象
有无显式封锁与之冲突
所有上级结点
检查本事务的显式封锁是否与该数据对象上的隐式封锁冲突:(由上级结点已加的封锁造成的)
所有下级结点
看上面的显式封锁是否与本事务的隐式封锁(将加到下级结点的封锁)冲突
11.7.2 意向锁
引进意向锁(intention lock)目的
提高对某个数据对象加锁时系统的检查效率
如果对一个结点加意向锁,则说明该结点的下层结点正在被加锁
对任一结点加基本锁,必须先对它的上层结点加意向锁
例如,对任一元组加锁时,必须先对它所在的数据库和关系加意向锁
常用意向锁
意向共享锁(Intent Share Lock,简称IS锁)
意向排它锁(Intent Exclusive Lock,简称IX锁)
共享意向排它锁(Share Intent Exclusive Lock,简称SIX锁)
IS锁
如果对一个数据对象加IS锁,表示它的后裔结点拟(意向)加S锁。
例如:事务T1要对R1中某个元组加S锁,则要首先对关系R1和数据库加IS锁
IX锁
如果对一个数据对象加IX锁,表示它的后裔结点拟(意向)加X锁。
例如:事务T1要对R1中某个元组加X锁,则要首先对关
系R1和数据库加IX锁
SIX锁
如果对一个数据对象加SIX锁,表示对它加S锁,再加IX锁,即SIX = S + IX。
例:对某个表加SIX锁,则表示该事务要读整个表(所以要对该表加S锁),同时会更新个别元组(所以要对该表加IX锁)。
具有意向锁的多粒度封锁方法
申请封锁时应该按自上而下的次序进行
释放封锁时则应该按自下而上的次序进行
例如:事务T1要对关系R1加S锁
要首先对数据库加IS锁
检查数据库和R1是否已加了不相容的锁(X或IX)
不再需要搜索和检查R1中的元组是否加了不相容的锁(X锁)
具有意向锁的多粒度封锁方法
提高了系统的并发度
减少了加锁和解锁的开销
在实际的数据库管理系统产品中得到广泛应用