11.1 并发控制概述
1.并发操作带来的数据不一致性
1.丢失修改(Lost Update):两个事务T1和T2读入同一数据并修改,T2的提交结果破坏了T1提交的结果,导致T1的修改被丢失。
2.不可重复读(Non-repeatable Read):指事务T1读取数据后,事务T2执行更新操作,使T1无法再现前一次读取结果。
3.读“脏”数据(Dirty Read):事务T1修改某一数据,并将其写回磁盘,事务T2读取同一数据后,T1由于某种原因被撤销,这时T1已修改过的数据恢复原值,T2读到的数据就与数据库中的数据不一致,T2读到的数据就为“脏”数据,即不正确的数据
(1)事务T1读取某一数据后,事务T2对其做了修改,当事务T1再次读该数据时,得到与前一次不同的值
(2)事务T1按一定条件从数据库中读取了某些数据记录后,事务T2删除了其中部分记录,当T1再次按相同条件读取数据时,发现某些记录神秘地消失了。
(3)事务T1按一定条件从数据库中读取某些数据记录后,事务T2插入了一些记录,当T1再次按相同条件读取数据时,发现多了一些记录。
后两种不可重复读有时也称为幻影现象(Phantom Row)
2.数据不一致性:由于并发操作破坏了事务的隔离性
3.并发控制就是要用正确的方式调度并发操作,使一个用户事务的执行不受其他事务的干扰,从而避免造成数据的不一致性
4.记号: R(x):读数据x W(x):写数据x
5.并发控制的主要技术 :封锁(Locking);时间戳(Timestamp);乐观控制法;多版本并发控制(MVCC)
11.2 封锁
1.什么是封锁
2.基本封锁类型
①排它锁又称为写锁
②共享锁又称为读锁
11.3 封锁协议
三级封锁协议
1.一级封锁协议:事务T在修改数据R之前必须先对其加X锁,直到事务结束才释放。
①一级封锁协议可防止丢失修改,并保证事务T是可恢复的。
②在一级封锁协议中,如果仅仅是读数据不对其进行修改,是不需要加锁的,所以它不能保证可重复读和不读“脏”数据。
例:
2.二级封锁协议
例:
3.三级封锁协议:一级封锁协议加上事务T在读取数据R之前必须先对其加S锁,直到事务结束才释放。
例:
11.4 活锁和死锁
11.4.1 活锁
※避免活锁:采用先来先服务的策略
当多个事务请求封锁同一数据对象时,按请求封锁的先后次序对这些事务排队,该数据对象上的锁一旦释放,首先批准申请队列中第一个事务获得锁
11.4.2 死锁
解决死锁的两类方法
1. 死锁的预防:(1)一次封锁法 (2)顺序封锁法
2. 死锁的诊断与解除
Ⅰ 死锁的诊断
(1)超时法:如果一个事务的等待时间超过了规定的时限,就认为发生了死锁
v优点:实现简单
v缺点:有可能误判死锁;时限若设置得太长,死锁发生后不能及时发现
(2)等待图法:用事务等待图动态反映所有事务的等待情况
Ⅱ 解除死锁
11.5 并发调度的可串行性
11.5.1 可串行化调度:多个事务的并发执行是正确的,当且仅当其结果与按某一次序串行地执行这些事务时的结果相同
11.5.2 冲突可串行化调度
1.冲突操作:是指不同的事务对同一数据的读写操作和写写操作:
Ri(x)与Wj(x) /*事务Ti读x,Tj写x,其中i≠j*/
Wi(x)与Wj(x) /*事务Ti写x,Tj写x,其中i≠j*/
其他操作是不冲突操作
2.不能交换(Swap)的动作: 同一事务的两个操作;不同事务的冲突操作
3.一个调度Sc在保证冲突操作的次序不变的情况下,通过交换两个事务不冲突操作的次序得到另一个调度Sc’,如果Sc’是串行的,称调度Sc是冲突可串行化的调度
4.冲突可串行化调度是可串行化调度的充分条件,不是必要条件。还有不满足冲突可串行化条件的可串行化调度。
[例11.4]有3个事务 T1=W1(Y)W1(X),T2=W2(Y)W2(X),T3=W3(X)
调度L1=W1(Y)W1(X)W2(Y)W2(X) W3(X)是一个串行调度。
调度L2=W1(Y)W2(Y)W2(X)W1(X)W3(X)不满足冲突可串行化。但是调度L2是可串行化的,因为L2执行的结果与调度L1相同,Y的值都等于T2的值,X的值都等于T3的值
11.6 两段锁协议
1.两段锁协议:指所有事务必须分两个阶段对数据项加锁和解锁
注意:
v事务遵守两段锁协议是可串行化调度的充分条件,而不是必要条件。
v若并发事务都遵守两段锁协议,则对这些事务的任何并发调度策略都是可串行化的
v若并发事务的一个调度是可串行化的,不一定所有事务都符合两段锁协议
2.两段锁协议与防止死锁的一次封锁法
11.7 封锁的粒度
一、封锁粒度
1.封锁对象的大小称为封锁粒度(Granularity)
2.封锁的对象:逻辑单元,物理单元
例:在关系数据库中,封锁对象:
二、选择封锁粒度的原则
1.封锁粒度与系统的并发度和并发控制的开销密切相关。
例:
2.多粒度封锁(Multiple Granularity Locking)
n需要处理多个关系的大量元组的用户事务:以数据库为封锁单位
n需要处理大量元组的用户事务:以关系为封锁单元
n只处理少量元组的用户事务:以元组为封锁单位
11.7.1 多粒度封锁
1.多粒度树
2.多粒度封锁协议
v允许多粒度树中的每个结点被独立地加锁
v对一个结点加锁意味着这个结点的所有后裔结点也被加以同样类型的锁
v在多粒度封锁中一个数据对象可能以两种方式封锁:显式封锁和隐式封锁 ——两者的效果一样
11.7.2 意向锁
1.意向锁
v如果对一个结点加意向锁,则说明该结点的下层结点正在被加锁
v对任一结点加基本锁,必须先对它的上层结点加意向锁
例如,对任一元组加锁时,必须先对它所在的数据库和关系加意向锁
2.常用意向锁
(1)意向共享锁(Intent Share Lock,简称IS锁)
IS锁: 如果对一个数据对象加IS锁,表示它的后裔结点拟(意向)加S锁。
例如:事务T1要对R1中某个元组加S锁,则要首先对关系R1和数据库加IS锁
(2)意向排它锁(Intent Exclusive Lock,简称IX锁)
IX锁: 如果对一个数据对象加IX锁,表示它的后裔结点拟(意向)加X锁
(3)共享意向排它锁(Share Intent Exclusive Lock,简称SIX锁)
SIX锁: 如果对一个数据对象加SIX锁,表示对它加S锁,再加IX锁,即SIX = S + IX。
例:对某个表加SIX锁,则表示该事务要读整个表(所以要对该表加S锁),同时会更新个别元组(所以要对该表加IX锁)。
3.具有意向锁的多粒度封锁方法
例如:事务T1要对关系R1加S锁
- 要首先对数据库加IS锁
- 检查数据库和R1是否已加了不相容的锁(X或IX)
- 不再需要搜索和检查R1中的元组是否加了不相容的锁(X锁)
11.8 小结
一、封锁协议小结:
1.三级协议的主要区别:什么操作需要申请封锁以及何时释放锁(即持锁时间)
2.不同的封锁协议使事务达到的一致性级别不同
封锁协议级别越高,一致性程度越高
二、数据库的并发控制通常使用封锁机制