我们都知道处理机调度分为三种,其中进程调度就是我们需要重点掌握的内容
进程调度分两种情况,一种是当前运行的进程主动放弃处理机,另一种就是当前运行的进程被动放弃处理机(搁这搁这)。
主动放弃可以分为下面几种情况:
进程正常终止
运行过程中发生异常而终止
进程主动请求阻塞(如等待I/0)
被动放弃可以有如下情形:
当然,也有不能进行进程调度的情形:
这里补充一下知识点:临界区和临界资源。
临界资源是指一个时间段内只允许一个进程使用的资源。各进程需要互斥地访问临界资源。
临界区就是指一个进程中访问临界资源的那段代码(注意是代码嗷!)。
而内核程序的临界区一般就是有用来访问某种内核数据结构的,比如进程的就绪队列(由各进程的PCB组成)。
需要注意的是:进程在操作系统内核程序临界区中不能进行调度与切换是对的,但是进程处于临界区时不能进行处理机调度则是错的。
下面来两个案例进行解释:
假设一个进程存在内核程序临界区,当它通过临界区访问就绪队列的时候,会给队列上锁。假如说在进程还没退出临界区(还没解锁)时候,对该进程实施进程调度,又因为进程调度相关的程序也要访问就绪队列,那这个时候就产生矛盾了,进程调度程序会因为就绪队列被锁(无法对就绪队列操作)而无法顺利完成进程调度。
再假设,一个进程正在访问打印机。打印机也是一种临界资源,在其完成打印之前,进程会一直处于临界区内,但是打印机又是慢速设备,此时如果一直不允许操作系统进行进程调度,就会导致处理机在打印机完成打印之前一直处于空闲状态。
而普通临界区访问的临界区资源不会直接影响操作系统内核的管理工作,因此在访问普通临界区时可以进行调度与切换。
了解完进程调度发生的时机,我们再了解了解进程调度的方式。进程调度的方式主要分成两中:非剥夺调度方式和剥夺调度方式。
非剥夺调度方式,又称非抢占方式。即只允许进程主动放弃处理机。在运行过程中即便有更紧迫的任务到达,当前进程依然会继续使用处理机,直到该进程终止或主动要求进入阻塞态。
可以看到的是,这种调度方式实现简单,系统开销小但是无法及时处理紧急任务,适合于早期的批处理系统。
剥夺调度方式,又称抢占方式。当一个进程正在处理机上执行时,如果有一一个更重要或更紧迫的进程需要使用处理机,则立即暂停正在执行的进程,将处理机分配给更重要紧迫的那个进程。
这种处理方式可以优先处理更紧急的进程,也可实现让各进程按时间片轮流执行的功能( 通过时钟中断)。适合于分时操作系统、实时操作系统。
狭义的进程调度与进程切换的区别:
狭义的进程调度指的是从就绪队列中选中一个要运行的进程。(这个进程可以是刚刚被暂停执行的进程,也可能是另一个进程,后一种情况就需要进程切换)
进程切换是指一个进程让出处理机,由另一个进程占用处理机的过程。
广义的进程调度包含了选择进程和进程切换两个步骤。
有时候并不特指广义或狭义,根据题目信息判断即可
进程切换的过程主要完成了:
注意:进程切换是有代价的,因此如果过于频繁的进行进程调度、切换,必然会使整个系统的效率降低,使系统大部分时间都花在了进程切换上,而真正用于执行进程的时间减少。
所以并不是进程调度越频繁,系统并发度越高
这一小节主要理解一些关于评价指标的名词,以及相关计算方法。
由于早期的CPU造价极其昂贵,因此人们会希望让CPU尽可能多地工作
CPU利用率就是指CPU“忙碌”的时间占总时间的比例。
计算方式如下:
利 用 率 利用率 利用率 = = = 忙 碌 的 时 间 总 时 间 \frac {忙碌的时间} {总时间} 总时间忙碌的时间
当然,有些题目不会只算CPU利用率
例如: 某计算机只支持单道程序,某个作业刚开始需要在CPU上运行5秒,再用打印机打印输出5秒,之后再执行5秒,才能结束。在此过程中,CPU利用率、打印机利用率分别是多少?
答: C P U 利 用 率 CPU利用率 CPU利用率 = = = 5 + 5 5 + 5 + 5 \frac {5 + 5} {5 + 5 + 5} 5+5+55+5 = = = 66.6 66.6 66.6%, 打 印 机 利 用 率 打印机利用率 打印机利用率 = = = 5 5 + 5 + 5 \frac {5} {5 + 5 + 5} 5+5+55 = = = 33.3 33.3 33.3%
系统吞吐量是指单位时间内完成作业的数量。
系 统 吞 吐 量 系统吞吐量 系统吞吐量 = = = 总 共 完 成 了 多 少 道 作 业 总 共 花 了 多 少 时 间 \frac {总共完成了多少道作业} {总共花了多少时间} 总共花了多少时间总共完成了多少道作业
比如:某计算机系统处理完10道作业,共花费100秒,则系统吞吐量为?
答: 系 统 吞 吐 量 系统吞吐量 系统吞吐量 = = = 10 100 \frac {10} {100} 10010 = = = 0.1 道 / 秒 0.1道/秒 0.1道/秒
对于计算机的用户来说,他肯定很关心自己的作业从提交到完成花了多少时间
周转时间,是指从作业被提交给系统开始,到作业完成为止的这段时间间隔。
它包括四个部分:作业在外存后备队列上等待作业调度(高级调度)的时间、进程在就绪队列上等待进程调度(低级调度)的时间、进程在CPU上执行的时间、进程等待I/O操作完成的时间。后三项在一个作业的整个处理过程中,可能发生多次。
计算方式如下:
( 作 业 ) 周 转 时 间 = (作业)周转时间= (作业)周转时间= = = = 作 业 完 成 时 间 作业完成时间 作业完成时间 − - − 作 业 提 交 时 间 作业提交时间 作业提交时间
平 均 周 转 时 间 = 平均周转时间= 平均周转时间= = = = 各 作 业 周 转 时 间 之 和 作 业 数 \frac {各作业周转时间之和} {作业数} 作业数各作业周转时间之和
周转时间=
为了避免麻烦,我们当然是不会仔细算每一部分的时间的
对于用户来说,那肯定不更关心自己的单个作业的周转时间,对于操作系统来说,更关心系统的整体表现,因此更关心所有作业周转时间的平均值。
有的作业运行时间短,有的作业运行时间长,因此在周转时间相同的情况下,运行时间不同的作业,给用户的感觉肯定是不一样的。
由此提出了带权周转时间这一个概念。
带 权 周 转 时 间 带权周转时间 带权周转时间 = = = 作 业 周 转 时 间 作 业 实 际 运 行 的 时 间 \frac {作业周转时间} {作业实际运行的时间} 作业实际运行的时间作业周转时间 = = = 作 业 完 成 时 间 − 作 业 提 交 时 间 作 业 实 际 运 行 的 时 间 \frac {作业完成时间 - 作业提交时间} {作业实际运行的时间} 作业实际运行的时间作业完成时间−作业提交时间
平 均 带 权 周 转 时 间 平均带权周转时间 平均带权周转时间 = = = 各 作 业 带 权 周 转 时 间 之 和 作 业 数 \frac {各作业带权周转时间之和} {作业数} 作业数各作业带权周转时间之和
可以看到的是:带权周转时间必然>1,带权周转时间与周转时间都是越小越好。
从用户角度来说:
计算机的用户希望自己的作业尽可能少的等待处理机
等待时间,指进程/作业处于等待处理机状态时间之和,等待时间越长,用户满意度越低。
对于进程来说,等待时间就是指进程建立后等待被服务的时间之和。
在等待I/0完成的期间其实进程也是在被服务的,所以不计入等待时间
对于作业来说,不仅要考虑建立进程后的等待时间,还要加上作业在外存后备队列中等待的时间。
一个作业总共需要被CPU服务多久,被I/O设备服务多久,一般是确定不变的,因此调度算法其实只会影响作业/进程的等待时间。当然,与前面指标类似,也有“平均等待时间”来评价整体性能。
对于计算机用户来说,会希望自己的提交的请求(比如通过键盘输入了一个调试命令)尽早地开始被系统服务、回应。
响应时间,就是指从用户提交请求到首次产生响应所用的时间。
前面说了很多关于调度的基本知识,这里开始了解操作系统关于调度的算法。
先来先服务(FCFS,First Come First Serve)主要知识点如下:
类别 | 内容 |
---|---|
算法思想 | 主要从“公平”的角度考虑(类似于我们生活中排队买东西的例子) |
算法规则 | 按照作业/进程到达的先后顺序进行服务 |
用于作业/进程调度 | 用于作业调度时,考虑的是哪个作业先到达后备队列 用于进程调度时,考虑的是哪个进程先到达就绪队列 |
是否可抢占 | 非抢占式的算法 |
优缺点 | 优点:公平、算法实现简单 缺点:排在长作业(进程)后面的短作业需要等待很长时间,带权周转时间很大,对短作业来说用户体验不好。即,FCFS算法对长作业有利,对短作业不利 |
是否会导致饥饿 | 不会 |
下面通过一个例题来了解FCFS。
假如各进程到达就绪队列的时间、需要的运行时间如下表所示。使用先来先服务调度算法,计算各进程的等待时间、平均等待时间、周转时间、平均周转时间、带权周转时间、平均带权周转时间。
按照FCFS的规则,我们可以得到如下调度过程:
答案如下图所示:
如果题目中提到有I/O操作,那么等待时间就是周转时间-运行时间-I/O操作时间
短作业优先算法主要知识点如下:
类别 | 内容 |
---|---|
算法思想 | 追求最少的平均等待时间,最少的平均周转时间、最少的平均带权周转时间 |
算法规则 | 最短的作业/进程优先得到服务(所谓“最短”,是指要求服务时间最短) |
用于作业/进程调度 | 即可用于作业调度,也可用于进程调度。用于进程调度时也称为短进程优先(SPF, Shortest Process First)算法 |
是否可抢占 | SJF和SPF是非抢占式的算法。但是也有抢占式的版本–最短剩余时间优先算法(SRTN,Shortest Remaining Time Next) |
优缺点 | 优点:“最短的”平均等待时间、平均周转时间 缺点:不公平。对短作业有利,对长作业不利。可能产生饥饿现象。另外,作业/进程的运行时间是由用户提供的,并不一定真实,不一定能做到真正的短作业优先 |
是否会导致饥饿 | 会。如果源源不断地有短作业/进程到来,可能使长作业/进程长时间得不到服务,产生“饥饿”现象。如果一直得不到服务,则称为“饿死” |
例题:各进程到达就绪队列的时间、需要的运行时间如下表所示。使用非抢占式的短作业优先调度算法,计算各进程的等待时间、平均等待时间、周转时间、平均周转时间、带权周转时间、平均带权周转时间。
答案如下:
可以发现的是,SPF的平均周转时间、平均带权周转时间、平均等待时间一般要比FCFS少
这里再了解一下最短剩余时间优先算法。
最短剩余时间优先算法(SRTN):每当有进程加入就绪队列改变时就需要调度,如果新到达的进程剩余时间比当前运行的进程剩余时间更短,则由新进程抢占处理机,当前运行进程重新回到就绪队列。另外,当一个进程完成时也需要调度。
在问到这种算法的题目中,要注意需要不断分析进程的执行顺序
拿上面那道题目作为案例,分析过程如下:
执行过程如下:
答案如下:
可以得到的结论是:这个抢占式的算法比之前非抢占式的算法具有更优的整体效果
注意:
根据前面的学习,可以发现的是:FCFS算法是在每次调度的时候选择一个等待时间最长的作业(进程)为其服务。但是没有考虑到作业的运行时间,因此导致了对短作业不友好的问题;SJF算法是选择一个执行时间最短的作业为其服务。但是又完全不考虑各个作业的等待时间,因此导致了对长作业不友好的问题,甚至还会造成饥饿问题。
那我们能不能设计一个算法,即考虑到各个作业的等待时间,也能兼顾运行时间呢?那当然是可以的。
下面是高相应比算法的基本知识点:
类别 | 内容 |
---|---|
算法思想 | 要综合考虑作业/进程的等待时间和要求服务的时间 |
算法规则 | 在每次调度时先计算各个就绪作业/进程的响应比,选择响应比最高的作业/进程为其服务 计算公式: 响 应 比 响应比 响应比 = = = 等 待 时 间 + 要 求 服 务 时 间 要 求 服 务 时 间 \frac {等待时间+要求服务时间} {要求服务时间} 要求服务时间等待时间+要求服务时间 |
用于作业/进程调度 | 即可用于作业调度,也可用于进程调度 |
是否可抢占 | 非抢占式的算法。因此只有当前运行的作业/进程主动放弃处理机时(正常/异常完成、阻塞),才需要调度,才需要计算响应比 |
优缺点 | 综合考虑了等待时间和运行时间(要求服务时间) 等待时间相同时,要求服务时间短的优先(SJF 的优点) 要求服务时间相同时,等待时间长的优先(FCFS 的优点) 对于长作业来说,随着等待时间越来越久,其响应比也会越来越大,从而避免了长作业饥饿的问题 |
是否会导致饥饿 | 不会 |
还是以上面那道题作为例题。按照HRRN算法,有如下分析:
算法执行过程图示如下:
注:这几种算法主要关心对用户的公平性、平均周转时间、平均等待时间等评价系统整体性能的指标,但是不关心“响应时间”,也并不区分任务的紧急程度,因此对于用户来说,交互性很糟糕。因此这三种算法一般适合用于早期的批处理系统,当然,FCFS算法也常结合其他的算法使用,在现在也扮演着很重要的角色。而适合用于交互式系统的调度算法将在下面学到。
时间片轮转算法主要知识点如下:
类别 | 内容 |
---|---|
算法思想 | 公平地、轮流地为各个进程服务,让每个进程在一定时间间隔内都可以得到响应 |
算法规则 | 按照各进程到达就绪队列的顺序,轮流让各个进程执行一个时间片(如100ms)。若进程未在一个时间片内执行完,则剥夺处理机,将进程重新放到就绪队列队尾重新排队。 |
用于作业/进程调度 | 用于进程调度(只有作业放入内存建立了相应的进程后,才能被分配处理机时间片) |
是否可抢占 | 若进程未能在时间片内运行完,将被强行剥夺处理机使用权,因此时间片轮转调度算法属于抢占式的算法,由时钟装置发出时钟中断来通知CPU时间片已到 |
优缺点 | 优点:公平、响应快、适用于分时操作系统 缺点:由于高频率的进程切换,因此有一定开销;不区分任务的紧急程度 |
是否会导致饥饿 | 不会 |
可以看到的是,时间片轮转调度算法更适用于分时操作系统,更注重“响应时间”,而不是”周转时间“。
老样子,拿之前的题目做例子。
按照RR算法,假设时间片大小为2,那么我们可以得到下面的进程调度分析过程:
调度过程图示如下:
那把时间片做一下调整,比如说5,结果会怎么样呢?
调度分析过程:
调度图示:
可以发现的是,如果时间片太大,使得每个进程都可以在一个时间片内就完成,则时间片轮转调度算法退化为先来先服务调度算法,并且会增大进程响应时间。因此时间片不能太大。
另一方面,进程调度、切换是有时间代价的(保存、恢复运行环境),因此如果时间片太小,会导致进程切换过于频繁,系统会花大量的时间来处理进程切换,从而导致实际用于进程执行的时间比例减少。可见时间片也不能太小。
一般来说,设计时间片时要让切换进程的开销占比不超过1%
优先级调度算法主要知识点总结如下:
类别 | 内容 |
---|---|
算法思想 | 随着计算机的发展,特别是实时操作系统的出现,越来越多的应用场景需要根据任务的紧急程度来决定处理顺序 |
算法规则 | 每个作业/进程有各自的优先级,调度时选择优先级最高的作业/进程 |
用于作业/进程调度 | 既可用于作业调度,也可用于进程调度。甚至,还会用于在之后会学习的I/O调度中 |
是否可抢占 | 抢占式、非抢占式都有(做题时的区别在于:非抢占式只需在进程主动放弃处理机时进行调度即可,而抢占式还需在就绪队列变化时,检查是否会发生抢占) |
优缺点 | 优点:用优先级区分紧急程度、重要程度,适用于实时操作系统。可灵活地调整对各种作业/进程的偏好程度 缺点:若源源不断地有高优先级进程到来,则可能导致饥饿 |
是否会导致饥饿 | 会 |
这里需要说明一点:优先数和优先级的关系,并不是说优先数越大优先级越高,也有可能是前者越小优先级越高,具体需要注意题目所给信息
假如有如下题目:
各进程到达就绪队列的时间、需要的运行时间、进程优先数如下表所示。使用非抢占式的优先级调度算法,分析进程运行情况。(注: 优先数越大,优先级越高)
按照题目所给”非抢占式“、”优先数大优先级高“,我们有如下分析过程:
有如下调度图示:
那如果是”抢占式“的呢?
这时我们需要同时思考作业到达时和作业(完成)主动放弃时两种情况。可得如下分析过程:
可得如下图示:
补充几个小知识点:
那么如何合理地设置各类进程的优先级呢?
我们有如下一般性规则:
关于第三点,主要原因是:
I/O设备和CPU可以并行工作,如果优先让I/O繁忙型进程优先运行的话,则越有可能让I/O设备尽早地投入工作,则资源利用率、系统吞吐量都会得到提升
保留节目来了。
结合前面所学的知识,我们可以知道:FCFS算法的优点是公平;SJF算法的优点是能尽快处理完短作业,平均等待/周转时间等参数很优秀;时间片轮转调度算法可以让各个进程得到及时的响应;优先级调度算法可以灵活地调整各种进程被服务的机会。
能否对其他算法做个折中权衡?得到一个综合表现优秀平衡的算法呢?
那当然是可以的:多级反馈调度算法。
UNIX使用的就是这种算法
下面是多级反馈队列调度算法的知识点总结:
类别 | 内容 |
---|---|
算法思想 | 对其他调度算法的折中权衡 |
算法规则 | 1.设置多级就绪队列,各级队列优先级从高到低,时间片从小到大 2.新进程到达时先进入第1级队列,按FCFS原则排队等待被分配时间片,若用完时间片进程还未结束,则进程进入下一级队列队尾。如果此时已经是在最下级的队列,则重新放回该队列队尾 3. 只有第k级队列为空时,才会为k+1级队头的进程分配时间片 |
用于作业/进程调度 | 用于进程调度 |
是否可抢占 | 抢占式的算法。在k级队列的进程运行过程中,若更上级的队列(1~k-1级)中进入了一个新进程,则由于新进程处于优先级更高的队列中,因此新进程会抢占处理机,原来运行的进程放回k级队列队尾。 |
优缺点 | 对各类型进程相对公平(FCFS的优点);每个新到达的进程都可以很快就得到响应(RR的优点);短进程只用较少的时间就可完成(SPF的优点);不必实现估计进程的运行时间(避免用户作假);可灵活地调整对各类进程的偏好程度,比如CPU密集型进程、I/O密集型进程(拓展:可以将因I/O阻塞后激活的进程重新放回原队列,这样I/O型进程就可以保持较高优先级) |
是否会导致饥饿 | 会(多个短进程源源不断地到来时,会被分配给较高优先级的队列,而较低优先级队列的长进程可能会因此导致饥饿) |
这个算法整体规则要比前几种复杂得多,下面我们来个案例来进行具体理解。
假设各进程到达就绪队列的时间、需要的运行时间如下表所示。使用多级反馈队列调度算法,分析进程运行的过程。
队列分级和时间片分配规则假设如下:
根据算法规则,我们知道各个进程在队列中的调度走向是这样的:
所以,我们有如下调度执行情况分析: