目录
1 处理器调度的基本概念、层次
1.1 基本概念
1.2 三个层次
1.2.1 高级调度(作业调度)
1.2.2 中级调度(内存调度)
1.2.3 低级调度(进程调度)
1.3 三种调度的联系和对比
2 进程调度的时机、切换与过程
2.1 时机
2.2 临界区与内核程序临界区
2.3 进程切换与过程
2.4 进程调度的方式
3 调度算法的评价指标
4 处理器调度算法
4.1 先来先服务(FCFS)
4.2 短作业优先(SJF)
4.3 高响应比优先(HRRN)
小总结
4.4 时间片轮转调度算法(RR)
4.5 优先级调度算法
4.6 多级反馈队列调度算法
当有一堆任务要处理,但由于资源有限,这些事情没法同时处理。这就需要某种规则来决定处理这些任务的顺序,这就是 “调度” 研究的问题。
处理器调度考虑如何从多个作业中选择一些作业加载到内存中为其创建进程(称为作业调度或高级调度、长程调度)和如何从多个进程中选择一个进程占用处理器运行(称为进程/线程调度、低级调度或短程调度)的问题。
处理器调度策略与作业类型密切相关。用户作业包括批处理作业和终端交互型作业。 批处理作业进入系统后在磁盘后备队列中等候作业调度,终端交互型作业一旦被接纳,直接创建进程,接受进程调度。
从系统接收到运行结束退出系统为止,作业可能要经历如下图所示的三级调度过程:高级调度、中级调度和低级调度。
高级调度发生在新进程的创建中,它决定一个进程能否被创建,或者创建后能否被置成就绪态;中级调度反映到进程状态上就是挂起和解除挂起,它根据系统的当前负荷情况决定停留在主存中的进程数;低级调度决定哪一个就绪进程占用CPU 。
调度层级与调度队列的关系如下图。
由于内存空间有限,有时无法将用户提交的作业全部放入内存,因此就需要确定某种规则来决定将作业调入内存的顺序。
高级调度指按照一定原则从外存上处于后备作业队列的作业中挑选若干作业进入内存,为其分配内存等必要资源,并建立相应的进程(建立PCB),以使它们获得竞争处理机的权利。
高级调度是辅存(外存)与内存之间的调度。每个作业只调入一次,调出一次。作业调入时会建立相应的PCB,作业调出时才撤销PCB。高级调度主要是指调入的问题,因为只有调入的实际需要操作系统来确定,但调出的实机必然是作业运行结束才调出。
中级调度(平衡调度、中程调度)是进程对换的一部分。中级调度决定哪些进程参与竞争处理器资源,途径是把一些进程换出主存,使之进入“挂起”状态,不参与进程调度; 或者将进程对换到内存中,解除挂起状态。值得注意的是,PCB并不会一起调到外存,而是会常驻内存。PCB中会记录进程数据在外存中的存放位置,进程状态等信息,操作系统通过内存中的PCB来保持对各个进程的监控、管理。被挂起的进程PCB会被放到挂起队列中。中级调度根据主存资源决定主存中所能容纳的进程数目,并根据进程的当前状态来决定外存和主存中进程的对换。中级调度起到平滑和调整系统负荷的作用,提高主存利用率和系统吐吞率。
低级调度(进程调度、线程调度、短程调度)的主要功能是按照某种原则决定就绪队列中的哪个进程或内核级线程获得处理器,并将处理器出让给它进行工作。低级调度执行分配CPU的程序称为分派程序。
低级调度程序是操作系统最为核心的部分,执行十分频繁。低级调度策略的优劣直接影响到整个系统的性能。
低级调度是各类操作系统必须具有的功能;在纯粹的分时或实时操作系统中,通常不需要配备高级调度,而仅配置低级调度;一般的操作系统配置了高级调度和低级调度;引进中级调度有利于提高主存利用率和作业吞吐量。
低级调度执行的时机是当前进程阻塞或可能抢占当前运行进程的事件发生时,这类事件有时钟中断、操作系统调用、中断和信号(如信号量)。
进程调度(低级调度),就是按照某种算法从就绪队列中选择一个进程为其分配处理机。
需要进行进程调度与切换的情况
当前运行的进程主动放弃处理机
当前运行的进程被动放弃处理机
不能进行进程调度与切换的情况
进程在操作系统内核程序临界区中不能进行调度与切换 ✔
进程处于临界区不能进行处理机调度 ✘
临界资源:一个时间段内只允许一个进程使用的资源(比如qq微信不可以同时使用摄像头)。各进程需要互斥的访问临界资源。
临界区:访问临界资源的那段代码。
内核程序临界区一般是用来访问某种内核数据结构的,比如进程的就绪队列(由各就绪进程的PCB组成)
如上图,假设进程访问就绪队列,此时没有退出临界区(还没解锁)就进行进程调度,但是进程调度相关程序也需要访问就绪队列,但此时就绪队列又被锁住了,因此又无法顺利进行进程调度。
内核程序临界区访问的临界资源如果不尽快释放,极有可能影响到操作系统内核的其他工作。因此在访问内核程序临界区期间不能进行调度和切换。
如上图,在打印机打印完成前,进程一直处于临界区内,临界资源不会解锁。但打印机又是慢速设备,此时如果一直不允许进程调度的话就会导致CPU一直空闲。
普通临界区访问的临界资源不会直接影响操作系统内核的管理工作。因此在访问普通临界区时可以进行调度与切换。
“狭义的进程调度” 与 “进程切换” 的区别:
狭义的进程调度指的是从就绪队列中选中一个要运行的进程。(这个进程可以是刚刚被暂停执行的进程,也可能是另一个进程,后一种情况需要进程切换)
进程切换是指一个进程让出处理机,由另一个进程占用处理机的过程。
广义的进程调度包含了选择一个进程和进程切换两个步骤。
进程切换的过程主要完成了:
注:进程切换是有代价的,因此如果过于频繁的进程调度、切换,必然会使整个系统的效率降低,使系统大部分时间浪费在进程切换上,而真正用于执行进程的时间减少。
非剥夺调度方式,又称非抢占方式。即,只允许进程主动放弃处理机。在运行过程中即便有更紧急的任务到达,当前进程依然会继续使用处理机,直到进程终止或主动要求进入阻塞态。(实现简单,系统开销小但是无法处理晋级任务,适合于早期的批处理系统)
剥夺调度方式,又称抢占方式。当一个进程正在处理机上执行时,如果有一个更重要或更紧迫的进程需要使用处理机,则立即暂停正在执行的进程,将处理机分配给更重要的那个进程。(可以优先处理紧急的进程,也可以实现让各进程按时间片轮流执行的功能(通过时钟中断)。适合分时操作系统,实时操作系统)
操作系统调度程序所使用的算法称为调度算法。根据调度所要达到的目标,设计调度 算法通常应考虑如下原则。
1) 资源利用率
资源包括CPU及I/O设备等,其中CPU资源的利用率最为关键。在一定I/O操作等待 时间的比率下,运行程序的道数越多,CPU空闲时间所占百分比越低。CPU利用率的计算 公式如下。
CPU利用率=CPU有效工作时间/CPU总的运行时间
CPU总的运行时间=CPU有效工作时间+CPU空闲等待时间
利用率=忙碌的时间/总时间
2) 吞吐率
吞吐率是单位时间内CPU处理的作业数。这是批处理系统调度性能的一个指标。显然, 处理的长作业多则吞吐率低,短作业多则吞吐率高。
系统吞吐量:单位时间内完成作业的数量
系统吞吐量=总共完成了多少道作业/总共花了多少时间
3) 公平性
调度算法要确保每个用户每个进程获得合理的CPU份额或其他资源份额,不会出现 “饥饿”现象。
4) 响应时间
交互式进程从提交一个请求到接收到响应之间的时间间隔称为响应时间。响应时间包括命令传输到CPU的时间、CPU处理命令的时间和处理结果返回终端的时间。使交互式用户的响应时间尽可能短,或尽快处理实时任务,是分时系统和实时系统衡量调度性能的一个重要指标。
5)周转时间
批处理用户从作业提交给系统开始,到作业完成为止的时间间隔称为作业周转时间。
周转时间包括:作业在后备队列等待作业调度(高级调度)的时间、作业进程在就绪队列等待进程调度(低级调度)时间、进程在CPU上运行时间、进程等待I/O操作完成的时间。后三项在一个作业的处理过程中,可能发生多次。
应使作业周转时间或平均作业周转时间尽可能短,这是批处理系统衡量调度性能的一个重要指标。批处理系统的调度性能主要用作业周转时间和作业带权周转时间来衡量,此时间越短,则系统效率越高,作业吞吐量越大。
对于单个作业,采用周转时间衡量该作业的运行效率。
周转时间=作业完成时间-作业提交时间(用户更关心单个作业周转时间)
平均周转时间=各作业周转时间之和/作业数(操作系统更关心整体表现)
带权周转时间=作业周转时间/作业实际运行的时间(必然大于等于1,越小越好)
平均带权周转时间=各作业带权周转时间之和/作业数
对于周转时间相同的两个作业,实际运行时间长的作业在相同时间内被服务的更多,带权周转时间更小,用户满意度更高。
对于实际运行时间相同的两个作业,周转时间短的带权周转时间小,用户满意度更高。
6)等待时间
等待时间,指进程/作业处于等待处理机状态时间之和,越短,用户满意度越高。
作业在后备队列等待被服务(调度)的时间,作业调入内存后,建立对应的进程。该进程会被CPU服务,会被I/O设备服务,也有等待被服务的时候。
对于进程来说,等待时间就是进程建立后等待被服务时间之和,在等待I/O完成期间进程也是在被服务,所以不计入等待时间。
对于作业来说,不仅要考虑建立进程后的等待时间,还要加上作业在外村后备队列中的等待时间。
一个作业总共要被CPU服务多久,被I/O设备服务多久一般是确定不变的,因此调度算法其实只会影响作业/进程的等待时间。
Tips:各种调度算法的学习思路
1)算法思想:主要从 “公平” 的角度考虑(类似于生活中排队排队买东西)
2)算法规则:按照 作业/进程 到达的先后顺序进行服务
3)用于作业/进程调度:用于作业调度时,考虑哪个作业先到达后备队列;用于进程调度时,考虑哪个进程先到达就绪队列
4)是否可抢占? 非抢占式的算法
5)优缺点:
优点:公平、算法简单
缺点:排在长作业(进程)后面的短作业需要等待很长时间,带权周转时间很大,对短作业来说用户体验不好。即,FCFS算法对长作业有利,对短作业不利。
6)是否会导致饥饿 :不会
FCFS算法举例:设3个作业到达系统的时刻和所需CPU时间如下表
作业名 |
作业到达时刻 |
所需CPU时间 |
作业1 |
0 |
8 |
作业2 |
3 |
9 |
作业3 |
4 |
3 |
按照先来先服务算法调度3个作业,请分别计算各作业的周转时间、带权周转时间、 平均周转时间和平均带权周转时间。
解:3个作业的调度时序如下图
图中虚线表示作业/进程等待的时间,实线表示进程占用处理器运行的时间。3个作业顺序执行,每个作业的周转时间和带权周转时间如图所示。
等待时间=周转时间-运行时间 注:在本例中的进程都是纯计算型的进程,一个进程到达后要么在等待,要么在运行。如果是又有计算,又有I/O操作的进程,其等待时间就是周转时间-运行时间-I/O操作的时间
3个作业的平均周转时间为(8+14+16) / 3=12.67。
3个作业的平均带权周转时间为(1+1.55+5.33) / 3=2.63。
1)算法思想:追求最少的平均等待时间,最少的平均周转时间、最少的品骏带权周转时间
2)算法规则:最短的作业/进程优先得到服务(所谓“最短”,是指要求服务时间最短)
3)用于作业/进程调度:即可用于作业调度,也可用于进程调度。用于进程调度时称为“短进程优先(SPF,Shortest Process First)算法”
4)是否可抢占? SJF和SPF是非抢占算法。但是也有抢占式的版本--最短剩余时间优先算法(SRTN,Shortest Remaining Time Next)
5)优点:“最短的”平均等待时间、平均周转时间
缺点:不公平。对短作业有利,对长作业不利。可能产生饥饿现象。另外,作业/进程的运行时间是由用户提供的,并不一定真实,不一定能做到真正的短作业优先
6)是否会导致饥饿:会。如果源源不断的有短作业/进程到来,可能使长作业/进程长时间得不到服务,产生“饥饿”现象。如果一直得不到服务,则称为“饿死”
SJF算法举例:设4个作业到达系统的时刻和所需CPU时间如下表所示。
作业名 |
作业到达时刻 |
所需CPU时间 |
作业1 |
0 |
8 |
作业2 |
3 |
9 |
作业3 |
4 |
3 |
作业4 |
6 |
10 |
按照最短作业优先算法调度4个作业,请分别计算各作业的周转时间、带权周转时间、 平均周转时间和平均带权周转时间。
每次调度时选择当前已经到达且运行时间最短的作业/进程。
解:4个作业的调度时序如下图所示
4个作业的平均周转时间为(8+17+7+24)+4=14。
4个作业的平均带权周转时间为(1+1.89+2.33+2.4)+4=1.905。
最短剩余时间优先(SRTF)算法是剥夺式的最短时间优先调度算法。每当有进程加入就绪队列改变时就需要调度,如果新作业需要的CPU时间比当前正在执行的作业剩余所需CPU时间短,则新作业将抢占当前作业的处理器。另外,当一个进程完成时也需要调度。此算法适用于作业调度和进程调度。
SRTF算法举例:设4个就绪作业到达系统和所需CPU时间如下表所示。
作业名 |
到达系统时间 |
所需CPU时间 |
作业1 |
0 |
8 |
作业2 |
2 |
4 |
作业3 |
3 |
9 |
作业4 |
5 |
5 |
按照最短剩余时间优先算法调度4个作业,请分别计算各作业的周转时间、带权周转 时间、平均周转时间和平均带权周转时间。
解:4个作业的调度时序如图所示。
4个作业的平均周转时间为(17+4+23+6)+4=12.5。
4个作业的平均带权周转时间为(2.13+1+2.55+1.2)+4=1.72。
先来先服务算法与最短作业优先算法都有明显的片面性。FCFS算法只考虑作业等候 时间而忽视了作业的计算时间,SJF算法只考虑用户估计的作业计算时间而忽视了作业等待时间。响应比最高者优先(HRRF)算法是介于FCFS算法和SJF算法的折中算法,既考虑作业等待时间,又考虑作业运行时间,既照顾短作业又不使长作业等待时间过长,力图改进公平性。
响应比=(等待时间+要求服务时间)/要求服务时间
1)算法思想:要综合考虑作业/进程的等待时间和要求服务时间
2)算法规则:在每次调度时先计算各个作业/进程的响应比,选择响应比高的作业/进程为其服务
3)既可用于作业调度,也可用于进程调度
4)非抢占式算法。因此只有当前运行的作业/进程主动放弃处理机时,才需要调度,才需要计算响应比
5)优点:
6)不会导致饥饿
每当调度一个作业运行时,都要计算后备作业队列中每个作业的响应比,选择响应比最高者投入运行。HRRF算法采用非剥夺式方式调度作业。
HRRF算法举例:如表所示的4个作业先后到达系统进入调度。
作业名 |
到达系统时间 |
所需CPU时间 |
作业1 |
0 |
20 |
作业2 |
5 |
15 |
作业3 |
10 |
5 |
作业4 |
15 |
10 |
按照响应比最高者优先算法调度4个作业,请分别计算各作业的周转时间、带权周转时间、平均周转时间和平均带权周转时间。
解:由于HRRF算法采用非剥夺式方式调度作业,因此,响应比的计算时机为作业结束时。
在0时刻,作业1首先到达系统,系统此时仅有一个作业,作业1立即被调度执行。作业1需要计算20min,即到时刻20结束。在时刻20之前,作业2、作业3、作业4相继到达。
第1次计算响应比的时刻为20,即作业1运行结束时。此时,作业2、作业3、作业4的响应比依次如下。
作业2响应比=1+作业2等待时间/作业2所需CPU时间=1+(20-5)/15=2
作业3响应比=1+作业3等待时间/作业3所需CPU时间=1+(20-10)/5=3
作业4响应比=1+作业4等待时间/作业4所需CPU时间=1+(20-15)/10=1.5。
作业3的响应比最高,因此,在时刻20调度作业3运行,如图所示。
作业3需要5个单位的计算时间,于时刻25计算结束。
第2次计算响应比的时刻为25,即作业3运行结束时。此时,作业2、作业4的响应 比依次如下。
作业2响应比=1+作业2等待时间/作业2所需CPU时间=1+(25-5)/15=2.33。
作业4响应比=1+作业4等待时间/作业4所需CPU时间=1+(25-15)/10=2
作业2的响应比最高,因此,在时刻25调度作业2运行,如图所示。
作业2需要计算15个单位时间,于时刻40运行结束。此后仅剩一个作业4,无需计 算响应比,直接调度运行。各作业调度时序如图所示。
1)算法思想:公平的、轮流的为各个进程服务,让每个进程在一定时间间隔内都可以得到响应
2)按照各进程到达就绪队列的顺序,轮流让各个进程执行一个时间片(如100ms)。若进程未在一个时间片内执行完,则剥夺处理机,将进程重新放到就绪队列队尾重新排队
3)用于进程调度(只有作业放入内存建立了相应的进程后,才能被分配处理机时间片)
4)是否可抢占? 若进程未能在时间片内运行完,将被强行剥夺处理机使用权,因此时间片轮转调度算法属于抢占式算法。由时钟装置发出时钟中断来通知CPU时间片已到
5)优点:公平;响应快,适用于分时操作系统
缺点:由于高频率的进程切换,因此有一定开销;不区分任务的紧急程度
6)不会导致饥饿
RR算法举例:各进程到达就绪队列的时间、需要运行的时间如下表。使用时间片轮转(常用于分时操作系统,更注重响应时间,因此不计算周转时间)调度算法,分析时间片大小分别为2、5时的进程运行情况。
时间片大小为2(注:以下括号内表示当前时刻就绪队列中的进程、进程的剩余运行时间)
时间片大小为5
如果时间片太大,使得每个进程可以在一个时间片内完成,则时间片轮转调度算法退化为先来先服务调度算法,并且会增大进程响应时间(比如:系统中有10个进程并发执行,如果时间片为1秒,则一个进程被响应需要等9秒,也就是说,用户在自己进程的时间片外通过键盘发出调试命令需要等待9秒才能被响应),因此时间片不能太大
另一方面,进程调度、切换是有时间代价的(保存、回复运行环境),因此如果时间片太小,会导致进程切换过于频繁,系统会花大量时间来处理进程切换,从而导致实际用于进程执行的时间比例减少。可见,时间片也不能太小
一般来说,设计时间片时要让切换进程的开销占比不超过1%
1)算法思想:随着计算机的发展,特别是实时操作系统的出现,越来越多的应用场景需要根据任务的紧急程度来决定处理顺序
2)算法规则:每个作业/进程有各自的优先级,调度时选择优先级最高的作业/进程
3)既可用于作业调度,也可用于进程调度。甚至,还会用于I/O调度中
4)抢占式、非抢占式都有。区别是:非抢占式只需要在进程主动放弃处理机时调度,而抢占式还需要在就绪队列变化时,检查是否会抢占
5)优点:用优先级区分紧急程度、重要程度,适用于实时操作系统。可灵活的调整对各种作业/进程的偏好程度
缺点:若源源不断的有高优先级进程到来,则可能导致饥饿
优先级调度算法举例:各进程到达就绪队列的时间、需要运行的时间、进程优先数如下表。
使用非抢占式的优先级调度算法,分析进程运行情况(注:优先数越大,优先级越高)
非抢占式的优先级调度算法:每次调度时选择当前已到达且优先级最高的进程。当前进程主动放弃处理机时发生调度
注:以下括号表示当前处于就绪队列的进程
使用抢占式优先级调度算法:每次调度时选择当前已到达且优先级最高的进程。当前进程主动放弃处理机时发生调度。另外,当就绪队列发生改变时也需要检查是否会发生抢占
对这些算法做个这种均衡,得到多级反馈队列调度算法
1)算法思想:对其它调度算法的折中均衡
2)算法规则:
3)用于进程调度
4)抢占式的算法。在k级队列的进程运行过程中,若更上级的队列(1~k-1级)中进入一个新进程,则由于新进程处于优先级更高的队列中,因此新进程会抢占处理机,原来运行的进程放回k级队列队尾
5)优点:对各类型进程相对公平(FCFS);每个新到达的进程都可以很快得到响应(RR);短进程只用较少时间就可以完成(SPF);不必实现估计进程的运行时间(避免用户作假);可灵活的调整对各类进城的偏好程度,比如CPU密集型进程、I/O密集型进程(拓展:可以将因I/O进程而阻塞的进程重新放回原队列,这样I/O型进程就可以保持较高优先级)
6)会导致饥饿,有源源不断短进程到达,下级队列导致饥饿
多级反馈队列调度算法举例:各进程到达就绪队列的时间、需要运行的时间如下表。使用多级反馈调度算法,分析优先级。
设置多级就绪队列,各级队列优先级从高到低,时间片由小到大
新进程到达时先进入第1级队列,按FCFS原则排队等待被分配时间片。若用完时间片进程还未结束,则进程进入下一级队列队尾。如果此时已经在最下级的队列,则重新放回最下级队列队尾
P1(1)
P1先进入第1级队列,运行完1个时间片后,还没完,所以进入第2级队列队尾
P1(1) → P2(1)
在2时刻,P2到达第1级队列,只有第只有第k级队列为空时,才会为k+1级队头的进程分配时间片,所以处理机先分配给P2运行1个时间片,然后P2也加入第2级队列队尾
P1(1) → P2(1) → P1(2)
此时,第1级队列为空,所以处理机分配给第2级队列,P1开始运行2个单位时间,还没完,所以加入第3级队列队尾
P1(1) → P2(1) → P1(2) → P2(1) → P3(1)
第2级队列继续运行,P2开始运行,1个时间片后,P3到达,抢占P2的处理机,但是P2不会加入到第3级队列,而是继续放到第2级队尾,P3运行1个时间片
P1(1) → P2(1) → P1(2) → P2(1) → P3(1) → P2(2) → P1(4)
P3运行完后调出内存,开始运行P2,运行两个单位时间后,P2完成,调出内存,只剩第3级队列的P1,所以P1开始运行4个时间片
运行4个时间片后,P1还剩1个单位,它已经处于最下层队列,没法继续往下,所以返回第3级队列队尾,运行1个单位后,调出内存
P1(1) → P2(1) → P1(2) → P2(1) → P3(1) → P2(2) → P1(4) → P1(1)