2.4.1 死锁的概念
1. 死锁的定义
所谓死锁是指多个进程因竞争资源而造成的一种僵局(互相等待),若无外力作用,这些进程都将无法向前推进。
2. 死锁产生的原因
(1)系统资源的竞争
通常系统中拥有的不可剥夺资源,其数量不足以满足多个进程运行的需要,使得进程在运行过程中,会因争夺资源而陷入僵局,如磁带机、打印机等。只有对不可剥夺资源的竞争才可能产生死锁,对可剥夺资源的竞争不会引起死锁的。
(2)进程推进顺序非法
进程在运行过程中,请求和释放资源的顺序不当,也同样会导致死锁。例如,并发进程P1、P2分别保持了资源R1、R2,而进程P1申请资源R2,进程P2申请资源R1时,两者都会因为所需资源被占用而阻塞。
信号量使用不当也会造成死锁。进程间彼此相互等待对方发来的消息,结果也会使得这些进程间无法继续向前推进。例如,进程A等待进程B发的消息,进程B又在等待进程A发的消息,可以看出进程A和B不是因为竞争同一资源,而是在等待对方的资源导致死锁。
(3)死锁产生的必要条件
互斥条件:进程要求对所分配的资源进行排他性控制,即在一段时间内某资源仅为一个进程所占有。此时若有其他进程请求该资源,则请求进程只能等待。
不剥夺条件:进程所获得的资源在在未使用完毕之前,不能被其他进程强行夺走,即只能由获得该资源的进程自己来释放(只能是主动释放)。
请求和保持条件:进程已经保持了至少一个资源,但又提出了新的资源请求,而该资源已被其他进程占有,此时请求进程被阻塞,但对自己已获得的资源保持不放。
循环等待条件:存在一种进程资源的循环等待链,链中每一个进程已获得的资源同时被链中下一个进程所请求。即存在一个处于等待状态的进程集合{P1,P2,...,Pn},其中Pi等待的资源被P(i+1)占有(i=0,1,...,n-1),Pn等待的资源被P0占有。
2.4.2 死锁的处理策略
1.预防死锁
设置某些限制条件,破坏产生死锁的四个必要条件中的的一个或几个,以防止发送死锁。
2.避免死锁
在资源的动态分配过程中,用某种方法防止系统进入不安全状态,从而避免死锁。
3.死锁的检测及解除
无需采取任何限制性措施,允许进程在运行过程中发生死锁。通过系统的检测机构及时地检测出死锁的发生,然后采取某种措施解除死锁。
预防死锁和避免死锁都属于事先预防策略,但预防死锁的限制条件比较严格,实现起来较为简单,但往往导致系统的效率低,资源利用率低;避免死锁的限制条件相对宽松,资源分配后需要通过算法来判断是否进入不安全状态,实现起来较为复杂。
|
资源分配策略 |
各种可能模式 |
主要优点 |
主要缺点 |
死锁预防 |
保守,宁可资源闲置 |
一次请求所有资源,资源剥夺,资源按序分配 |
适用于做突发式处理的进程,不必进行剥夺 |
效率低,进程初始化时间延长;剥夺次数过多;不便灵活申请新资源 |
死锁避免 |
是“预防”和“检测”的折中(在运行时判断是否可能死锁) |
寻找可能的安全允许顺序 |
不必进行剥夺 |
必须知道将来的资源需求;进程不能被长时间阻塞 |
死锁检测 |
宽松,只要允许就分配资源 |
定期检查死锁是否已经发生 |
不延长进程初始化时间,允许对死锁进行现场处理 |
通过剥夺解除死锁,造成损失 |
2.4.3 死锁预防
1. 破坏互斥条件
如果允许系统资源都能共享使用,则系统不会进入死锁状态。但有些资源根本不能同时访问,如打印机等临界资源只能互斥使用。所以,破坏互斥条件而预防死锁的方法不太可行,而且在有的场合应该保护这种互斥性。
2.破坏不剥夺条件
当一个已保持了某些不可剥夺资源的进程,请求新的资源而得不到满足时,它必须释放已经保持的所有资源,待以后需要时再重新申请。
该策略实现起来比较复杂,释放已获得的资源可能造成前一阶段工作的失效,反复地申请和释放资源会增加系统开销,降低系统吞吐量。这种方法常用于状态易于保存和恢复的资源,如CPU的寄存器及内存资源,一般不能用于打印机之类的资源。
3.破坏请求和保持条件
采用预先静态分配方法,即进程在运行前一次申请完它所需要的全部资源,在它的资源未满足前,不能把它投入运行。一旦投入运行后,这些资源就一直归它所有,也不再提出其他资源请求,这样就可以保证系统不会发生死锁。
这种方式实现简单,但缺点也显而易见,系统资源被严重浪费,其中有些资源可能仅在运行初期或运行快结束时才使用,甚至根本不使用。而且还会导致“饥饿”现象,当由于个别资源长期被其他进程占用时,将致使等待该资源的进程迟迟不能开始运行。
4.破坏循环等待条件
为了破坏循环等待条件,可采用顺序资源分配法。首先给系统中的资源编号,规定每个进程,必须按编号递增的顺序请求资源,同类资源一次申请完。
这种方法存在的问题是,编号必须相对稳定,这就限制了新类型设备的增加;尽管在为资源编号时已经考虑到大多数作业实际使用这些资源的顺序,但也经常会发生作业使用资源的顺序与系统规定顺序不同的情况,造成资源的浪费;此外,这种按规定次序申请资源的方法,也必然会给用户的编程带来麻烦。
2.4.4 死锁避免
避免死锁同样是属于事先预防的策略,但并不是事先采取某种限制措施破坏死锁的必要条件,而是在资源动态分配过程中,防止系统进入不安全状态,以避免发生死锁。这种方法所施加的限制条件较弱,可以获得较好的系统性能。
1. 系统安全状态
避免死锁的方法中,允许进程动态地申请资源,但系统在进行资源分配之前,应先计算此次资源分配的安全性。若此次分配不会导致系统进入不安全状态,则将资源分配给进程;否则,让进程等待。
所谓安全状态,是指系统能按某种进程推进顺序(P1,P2,...,Pn),为每个进程Pi分配其所需资源,直至满足每个进程对资源的最大需求,使每个进程都可以顺序地完成。此时称P1,P2,..,Pn为安全序列。如果系统无法找到一个安全序列,则称系统处于不安全状态。
假设系统中有三个进程P1、P2和P3,共有12台磁带机。进程P1总共需要10台磁带机,P2和P3分别需要4台和9台。假设在T0时刻,进程P1、P2和P3已分别获得5台、2台和2台,尚有3台未分配。
则在T0时刻是安全的,因为存在一个安全序列P2、P1、P3,即只要系统按此进程序列分配资源,则每个进程都能顺利完成。若在T0时刻后,系统分配1台磁带机给P3,则此时系统便进入不安全状态,因为此时已无法再找到一个安全序列。
并非所有的不安全状态都是死锁状态,但当系统进入不安全状态后,便可能进入死锁状态;反之,只要系统处于安全状态,系统便可以避免进入死锁状态。
2. 银行家算法
银行家算法是最著名的死锁避免算法。它提出的思想是:把操作系统看做是银行家,操作系统管理的资源相当于银行家管理的资金,进程向操作系统请求分配资源相当于用户向银行家贷款。操作系统按照银行家指定的规则为进程分配资源,当进程首次申请资源时,要测试该进程对资源的最大需求量,如果系统现存的资源可以满足它的最大需求量则按当前的申请量分配资源,否则就推迟分配。当进程在执行中继续申请资源时,先测试该进程已占用的资源数与本次申请的资源数之和是否超过了该进程对资源的最大需求量。若超过则拒绝分配资源,若没有超过则再测试系统现存的资源能否满足该进程尚需的最大资源量,若能满足则按当前的申请量分配资源,否则也要推迟分配。
(1)数据结构描述
可利用资源矢量Available:含有m个元素的数组,其中的每一个元素代表一类可用的资源数目。Available[j]=K,则表示系统中现有的Rj类资源k个。
最大需求矩阵Max:为nxm矩阵,定义了系统中n个进程中的每一个进程对m类资源的最大需求,简单来说,一行代表一个进程,一列代表一类资源。Max[i,j]=K,则表示进程j需要Rj类资源的最大数目为K。
分配矩阵Allocation:为nxm矩阵,定义了系统中每一类资源当前已分配给每一进程的资源数。Allocation[i,j]=K,则表示进程i当前已分得Rj类资源的数目为K。
需求矩阵Need:为nxm矩阵,表示每个进程尚需的各类资源数。Need[i,j]=K,则表示进程i还需要Rj类资源的数目为K。
上述三个矩阵间存在下述关系:
Need = Max - Allocation
一般情况下,在银行家算法的题目中,Max矩阵和Allocation矩阵是已知条件,而求出Need矩阵是解题的第一步。
(2)银行家算法描述
设Requesti是进程Pi的请求矢量,如果Requesti[j]=K,表示进程Pi需要j类资源K个。当Pi发出资源请求后,系统按下述步骤进行检查:
1)如果Requesti[j]≤Need[i,j],便转向步骤2);否则认为出错,因为它所需要的资源数已超过它所宣布的最大值。
2)如果Requesti[j]≤Available[j],便转向步骤3);否则,表示尚无足够资源,Pi须等待。
3)系统试探着把资源分配给进程Pi,并修改下面的数据结构中的数值:
Available = Available - Requesti;
Allocation[i,j] = Allocation[i,j] + Requesti[j];
Need[i,j]=Need[i,j]-Requesti[j];
4)系统执行安全性算法,检查此次资源分配后,系统是否处于安全状态。若安全才正式将资源分配给进程Pi,以完成本次分配;否则,将本次的试探分配作废,恢复原来的资源分配状态,让进程Pi等待。
(3)安全性算法
1)初始时安全序列为空。
2)从Need矩阵中找出符合下面条件的行:该行对应的进程不在安全序列中而且该行小于等于Available向量,找到后,把对应的进程加入安全序列中:如果找不到,执行步骤4)。
3)当进程Pi进入安全序列后,可顺利执行,直至完成,并释放出分配给它的资源,故应执行:Available=Available+Allocation[i],其中Allocation[i]表示进程Pi代表的在Allocation矩阵中对应的行,返回步骤2)。
4)如果此时安全序列中已经有所有的进程,则系统处于安全状态,否则,系统处于不安全状态。
2.4.5 死锁检测和解除
1. 资源分配图
系统死锁,可利用资源分配图来描述。如图所示,用圆圈代表一个进程,用框代表一类资源。由于一种类型的资源可能有多个,用框中的一个点代表一类资源中的一个资源。从进程到资源的有向边叫请求边,表示该进程申请一个单位的该类资源;从资源到进程的边叫分配边,表示该类资源已经有一个资源被分配到该进程。
在下图所示的资源分配图中,进程P1已经分得了两个R1资源,并又请求一个R2资源;进程P2分得了一个R1和一个R2资源,并又请求一个R1资源。
2. 死锁定理
可以通过将资源分配图简化的方法来检测系统状态S是否为死锁状态。简化方法如下:
1)在资源分配图中,找出既不阻塞又不是孤点的进程Pi(即找出一条有向边与它相连,且该有向边对应资源的申请数量小于等于系统中已有的空闲资源数量,如上图中,R1没有空闲资源,R2有一个空闲资源。若所有的连接该进程的边均满足上述条件,则这个进程能继续直至完成,然后释放它所占有的所有资源)。消去它所有的请求边和分配边,使之成为孤立的结点。在下图(a)中,P1是满足这一条件的进程结点,将P1的所有边消去,便得到(b)所示的情况。
在这里要注意一个问题,判断某种资源是否有空间,应该用它的资源数量减去它在资源分配图中的出度,如上图所示,R1资源数有3,而出度也是3,所以R1没有空闲资源,R2的资源数是2,出度是1,所以R2有1个空闲资源。
2)进程Pi所释放的资源,可以唤醒某些因等待这些资源而阻塞的进程,原来的阻塞进程可能变为非阻塞进程。
S为死锁的条件是当且仅当S状态的资源分配图是不可完全简化的,该条件为死锁定理。
3. 死锁解除
一旦检测出死锁,就应立即采取相应的措施,以解除死锁。死锁解除的主要方法有:
1)资源剥夺法。挂起某些死锁进程,并抢占它的资源,将这些资源分配给其他的死锁进程。但应防止被挂起的进程长时间得不到资源,而处于资源匮乏的状态。
2)撤销进程法。强制撤销部分、甚至全部死锁进程并剥夺这些进程的资源。撤销的原则可以按进程优先级和进程代价的高低进行。
3)进程回退法。让一(或多)个进程回退到足以回避死锁的地步,进程回退时自愿释放资源而不是被剥夺。要求系统保持进程的历史信息,设置还原点。