文来自【风骨散人】
合作整理
允许多个用户同时使用的数据库系统
-飞机定票数据库系统
本章讨论的数据库系统并发控制技术是以单处理机系统为基础的
数据库管理系统必须提供并发控制机制
并发控制机制是衡量一个数据库管理系统性能的重要标志之一
事务是并发控制的基本单位
并发控制机制的任务
并发操作带来数据的不一致性实例
[例11.1]飞机订票系统中的一个活动序列
① 甲售票点(事务T1)读出某航班的机票余额A,设A=16;
② 乙售票点(事务T2)读出同一航班的机票余额A,也为16;
③ 甲售票点卖出一张机票,修改余额A←A-1,所以A为15,把A写回数据库;
④ 乙售票点也卖出一张机票,修改余额A←A-1,所以A为15,把A写回数据库
结果明明卖出两张机票,数据库中机票余额只减少1
并发操作带来的数据不一致性
记号
两个事务T1和T2读入同一数据并修改,T2的提交结果破坏了T1提交的结果,导致T1的修改被丢失。
上面飞机订票例子就属此类
不可重复读是指事务T1读取数据后,事务T2 执行更新操作,使T1无法再现前一次读取结果。
不可重复读包括三种情况:
数据不一致性:由于并发操作破坏了事务的隔离性
并发控制就是要用正确的方式调度并发操作,使一个用户事务的执行不受其他事务的干扰,从而避免造成数据的不一致性
对数据库的应用有时允许某些不一致性,例如有些统计工作涉及数据量很大,读到一些“脏”数据对统计精度没什么影响,可以降低对一致性的要求以减少系统开销
并发控制的主要技术
一个事务对某个数据对象加锁后究竟拥有什么样的控制由封锁的类型决定。
基本封锁类型
排它锁(Exclusive Locks,简记为X锁)
排它锁又称为写锁
若事务T对数据对象A加上X锁,则只允许T读取和修改A,其它任何事务都不能再对A加任何类型的锁,直到T释放A上的锁
保证其他事务在T释放A上的锁之前不能再读取和修改A
共享锁(Share Locks,简记为S锁)
共享锁又称为读锁
若事务T对数据对象A加上S锁,则事务T可以读A但不能修改A,其它事务只能再对A加S锁,而不能加X锁,直到T释放A上的S锁
保证其他事务可以读A,但在T释放A上的S锁之前不能对A做任何修改
Y=Yes,相容的请求(可同时进行)
N=No,不相容的请求(不可同时进行)
在锁的相容矩阵中:
最左边一列表示事务T1已经获得的数据对象上的锁的类型,其中横线表示没有加锁。
最上面一行表示另一事务T2对同一数据对象发出的封锁请求。
事务T在修改数据R之前必须先对其加X锁,直到事务结束才释放。
一级封锁协议可防止丢失修改,并保证事务T是可恢复的。
在一级封锁协议中,如果仅仅是读数据不对其进行修改,是不需要加锁的,所以它不能保证可重复读和不读“脏”数据。
一级封锁协议加上事务T在读取数据R之前必须先对其加S锁,读完后即可释放S锁。
二级封锁协议可以防止丢失修改和读“脏”数据。
在二级封锁协议中,由于读完数据后即可释放S锁,所以它不能保证可重复读。
三级协议的主要区别
不同的封锁协议使事务达到的一致性级别不同
解决死锁的方法:
1. 一次封锁法
要求每个事务必须一次将所有要使用的数据全部加锁,否则就不能继续执行
存在的问题
2. 顺序封锁法
顺序封锁法是预先对数据对象规定一个封锁顺序,所有事务都按这个顺序实行封锁。
顺序封锁法存在的问题
如果一个事务的等待时间超过了规定的时限,就认为发生了死锁
优点:实现简单
缺点
用事务等待图动态反映所有事务的等待情况
并发控制子系统周期性地(比如每隔数秒)生成事务等待图,检测事务。如果发现图中存在回路,则表示系统中出现了死锁。
可串行化(Serializable)调度
可串行性(Serializability)
例:现在有两个事务,分别包含下列操作:
事务T1:读B;A=B+1;写回A
事务T2:读A;B=A+1;写回B
现给出对这两个事务不同的调度策略
冲突操作:是指不同的事务对同一数据的读写操作和写写操作:
Ri(x)与Wj(x) /事务Ti读x,Tj写x,其中i≠j/
Wi(x)与Wj(x) /事务Ti写x,Tj写x,其中i≠j/
其他操作是不冲突操作
不能交换(Swap)的动作:
同一事务的两个操作
不同事务的冲突操作
一个调度Sc在保证冲突操作的次序不变的情况下,通过交换两个事务不冲突操作的次序得到另一个调度Sc’,如果Sc’是串行的,称调度Sc是冲突可串行化的调度
若一个调度是冲突可串行化,则一定是可串行化的调度
冲突可串行化调度是可串行化调度的充分条件,不是必要条件。还有不满足冲突可串行化条件的可串行化调度。
[例] 有3个事务
T1=W1(Y)W1(X),T2=W2(Y)W2(X),T3=W3(X)
调度L1=W1(Y)W1(X)W2(Y)W2(X) W3(X)是一个串行调度。
调度L2=W1(Y)W2(Y)W2(X)W1(X)W3(X)不满足冲突可串行化。但是调度L2是可串行化的,因为L2执行的结果与调度L1相同,Y的值都等于T2的值,X的值都等于T3的值
数据库管理系统普遍采用两段锁协议的方法实现并发调度的可串行性,从而保证调度的正确性
指所有事务必须分两个阶段对数据项加锁和解锁
“两段”锁的含义
例
事务Ti遵守两段锁协议,其封锁序列是 :
Slock A Slock B Xlock C Unlock B Unlock A Unlock C;
|← 扩展阶段 →| |← 收缩阶段 →|
事务Tj不遵守两段锁协议,其封锁序列是:
Slock A Unlock A Slock B Xlock C Unlock C Unlock B;
左图的调度是遵守两段锁协议的,因此一定是一个可行化调度。
如何验证?
两段锁协议与防止死锁的一次封锁法
封锁对象的大小称为封锁粒度(Granularity)
封锁的对象:逻辑单元,物理单元
例:在关系数据库中,封锁对象:
封锁粒度与系统的并发度和并发控制的开销密切相关
例
若封锁粒度是数据页,事务T1需要修改元组L1,则T1必须对包含L1的整个数据页A加锁。如果T1对A加锁后事务T2要修改A中元组L2,则T2被迫等待,直到T1释放A。
如果封锁粒度是元组,则T1和T2可以同时对L1和L2加锁,不需要互相等待,提高了系统的并行度。
又如,事务T需要读取整个表,若封锁粒度是元组,T必须对表中的每一个元组加锁,开销极大
在一个系统中同时支持多种封锁粒度供不同的事务选择
选择封锁粒度
同时考虑封锁开销和并发度两个因素, 适当选择封锁粒度
多粒度树
以树形结构来表示多级封锁粒度
根结点是整个数据库,表示最大的数据粒度
叶结点表示最小的数据粒度
三级粒度树。根结点为数据库,数据库的子结点为关系,关系的子结点为元组。
多粒度封锁协议
显式封锁和隐式封锁
例如事务T要对关系R1加X锁
系统必须搜索其上级结点数据库、关系R1
还要搜索R1的下级结点,即R1中的每一个元组
如果其中某一个数据对象已经加了不相容锁,则T必须等待
对某个数据对象加锁,系统要检查
引进意向锁(intention lock)目的
如果对一个结点加意向锁,则说明该结点的下层结点正在被加锁
对任一结点加基本锁,必须先对它的上层结点加意向锁
例如,对任一元组加锁时,必须先对它所在的数据库和关系加意向锁
常用意向锁
意向共享锁(Intent Share Lock,简称IS锁)
如果对一个数据对象加IS锁,表示它的后裔结点拟(意向)加S锁。
例如:事务T1要对R1中某个元组加S锁,则要首先对关系R1和数据库加IS锁
意向排它锁(Intent Exclusive Lock,简称IX锁)
如果对一个数据对象加IX锁,表示它的后裔结点拟(意向)加X锁。
例如:事务T1要对R1中某个元组加X锁,则要首先对关
系R1和数据库加IX锁
共享意向排它锁(Share Intent Exclusive Lock,简称SIX锁)
如果对一个数据对象加SIX锁,表示对它加S锁,再加IX锁,即SIX = S + IX。
例:对某个表加SIX锁,则表示该事务要读整个表(所以要对该表加S锁),同时会更新个别元组(所以要对该表加IX锁)。
锁的强度
例如:事务T1要对关系R1加S锁
具有意向锁的多粒度封锁方法
数据库的并发控制以事务为单位
数据库的并发控制通常使用封锁机制
活锁和死锁
并发事务调度的正确性
其他并发控制机制