当进程处于Wait状态时其PCB会被放置在特定的等待队列中。等待一个I/O设备的进程列表叫做设备队列(device queue),
每个设备都有自己的设备队列。
抢占式 多任务 分时
前面我们已经明确了调度可能发生的时机,现在我们通过这些调度时机来理清下现代操作系统中这几个重要的概念。
1.多任务
在单任务系统中,一个进程即使发生I/O阻塞(比如等待用户输入)时,操作系统也不会执行另一进程,整个系统都将陷入
等待的空闲中。而多任务就是指当一个正在执行的进程发生I/O阻塞或等待其他资源需要暂停时,操作系统会启动另一个
个进程继续执行,系统不会因为一个进程的阻塞而空闲下来,即单任务系统只能在进程终止后才能调度其他进程开始执行。
而多任务系统在时机(1)I/O阻塞时发生调度。此外,时机(3)属于主动放弃也是会发生调度的。
一个有趣的比喻:
"The lawyer works on several cases meanwhile and will never be idle for lack of work.Idle lawyers tend to become politicians,
so there is a certain social value in keepinglawyers busy."
2.分时
分时是在多任务的基础上,就算一个进程运行良好一直都没有发生阻塞,也不能让它就这样一直占用CPU资源直到它完成
为止。操作系统会让每个没有阻塞能够运行的进程共同分享CPU的计算能力。所以,可以说分时的理念是对多任务的扩展。
分时的调度发生在时机(2)当内核分配给当前进程的时间片耗尽时。
3.抢占式
而区分一个多任务分时系统是抢占式的还是非抢占式的,则要看进程调度能否发生在时机(4)发生中断,CPU停止当前
手头的工作(正在执行的进程),保存下当前工作的现场后,转入中断处理程序。如果在中断处理程序的执行中能否发生
调度,即中断处理程序还没有执行完,又切换到其他进程。这里要说明的是,系统调用也是通过中断机制来实现的(以后
我们会专门学习系统调用的机制,这里先简单了解下)。所以,也就是说要看系统调用的执行过程中,或者中断处理程序
的执行过程中能否发生调度(抢占)。
理清了这三个概念后,让我们看一看要实现这三个目标会对操作系统的设计产生怎样的影响。
多任务、分时、抢占式都会
很自然地对操作系统的设计产生根本影响。比如要为进程设计不同的状态表示运行、等待时间
片、阻塞等。并且因为多进程
同时运行,还要对进程进行时间片分配、同步、避免死锁。还要保护隔离各个进程不能随意访问其他进程的资源。可以说要
达到多任务分时的目的,这些问题是不可避免要考虑的。而抢占式在增强了进程的实时性的同时也增加了进程调度的复杂
度,进程或者内核完全有可能在系统调用或者中断处理程序未执行完时被抢占。
三种调度器
1.长期调度器(long-term scheduler)
在批处理系统中,通常被提交的进程远远超出可以立即执行的进程数目。于是,这些被保存在大容量存储设备上等待执行。
长期调度器又叫
作业调度器(job scheduler)从缓存中选出等待执行的进程加载到内存中,使其进入Ready状态。像UNIX
和Windows这样的分时系统通常没有长期调度器,内核只是简单地将提交的进程加载进内存,等待短期调度器去调度。
2.中期调度器(medium-term scheduler)
中期调度器的思想是将一些进程从内存中暂时移出,从而降低调度器需要处理进程的数目。这种将进程移出内存的机制
叫做
换出(Swapping)。
3.短期调度器(short-term scheduler)
短期调度器从Ready状态的进程队列中选出一个执行,分配CPU资源给它。这是我们最常说的调度器。
三种调度器可以在下图中找到对应的位置,它们在不同的时机对进程进行调度。
调度算法
1.先到先服务调度 First-Come, First-Served Scheduling (FCFS)
来看一个例子,假设有三个进程和它们各自执行时间(以毫秒为单位)如下表:
那么如果三个进程按照P1, P2, P3的顺序启动的话,按照先到先服务的调度算法,执行过程如下:
平均等待时间就是(0 + 24 + 27) / 3 = 17毫秒。FCFS算法是非抢占式的,一旦内核将CPU分配给一个进程就不会被释放
了,除非进程结束或者请求I/O阻塞。这也是我们之前学习的多任务系统的特点。
2.基于优先级调度 Priority Scheduling
在优先级调度算法中,每个进程都关联一个优先级,内核将CPU分配给最高优先级的进程。具有相同优先级的进程,按照
先来先服务的原则进行调度。假设进程的执行时间和优先级如下,并且这些进程同时存在于内存中时,内核基于优先级的
调度过程如下:
采取基于优先级调度算法要考虑进程饿死的问题,因为高优先级的进程总是会被优先调度,具有低优先级的进程可能永远
都不会被内核调度执行。
Aging是对于这个问题的一个解决方案,所谓Aging就是指逐渐提高系统中长时间等待的进程的
优先级。比如如果优先级的范围从127到0(127表示最低优先级),那么我们可以每15分钟将等待进程的优先级加1。最终
经过一段时间,即便是拥有最低优先级127的进程也会变成系统中最高优先级的进程,从而被执行。
一个有趣的谣言:
"Rumor has it that, when they shut down the IBM 7094 at MIT in 1973, they found a low-priority process that had been
submitted in 1967 and had not yet been run."
优先级调度可以抢占式或者非抢占式的。当一个进程在Ready队列中时,内核将它的优先级与正在CPU上执行的进程的优先级
进行比较。当发现这个新进程的优先级比正在执行的进程高时:对于抢占式内核,新进程会抢占CPU,之前正在执行的进程
转入Ready队列;对于非抢占式内核,新进程只会被放置在Ready队列的头部,不会抢占正在执行的进程。
3.最短作业优先调度 Shortest-Job-First Scheduling (SJF)
最短作业优先调度是优先级调度的特例。在优先级调度中我们根据进程的优先级来进行调度,在最短作业优先调度中我们
根据作业的执行时间长短来调度。通过下面的例子来看看SJF是怎样调度的。
进程1首先执行了1毫秒,当执行时间更短的进程2进入Ready队列时发生抢占。进程3在进程2执行1毫秒后到来,但是进程3的
执行时间比进程2长。同理进程4的到来也没法抢占进程2,所以进程2可以一直执行到结束。之后是执行时间第二短的进程4
执行,最后是进程1(要看剩余执行时间,还剩7毫秒)和进程3。
SJF调度是最优的调度,但难点在于如何预测进程的执行时间(Burst Time)。对于批处理系统中的长期调度来说,可以将用户
提交进程时输入的执行时间上限作为依据。但对于短期调度来说,没有办法能够提前得知下一个要被分配CPU的进程的执行
时间长短。我们只能通过历史数据来进行预测,公式如下:
α可以取0.5,公式前半部分表示最近一次Burst Time,而后半部分表示过去历史平均的Burst Time。
4.循环调度 Round-Robin Scheduling (RR)
RR调度算法转为分时系统设计,它与FCFS很像,但是加入了抢占。具体调度过程是:内核从Ready队列中选取第一个进程,
将CPU资源分配给它,并且设置一个定时器在一个时间片后中断该进程,调度Ready队列中的下一进程。很明显,RR调度
算法是抢占式的,并且在该算法的调度下,没有一个进程能够连续占用CPU超过一个时间片,从而达到了分时的目的。
来看下面的例子,假设一个时间片的长度为4毫秒:
5.多层次队列调度 Multilevel Queue Scheduling
多层次队列调度将Ready队列分成几个单独的队列,每个小队列上都有自己的调度算法,每个进程根据其特点被永久地分配
到其中某个队列中。