程序:是静态的,就是个存放在磁盘里的可执行文件,如:xx.exe
进程:进程是进程实体的运行过程,是系统进行资源分配和调度的一个独立单位。
同一个程序多次执行会对应多个进程。
进程的组成——PCB
以上这些信息都被保存在一个数据结构PCB (Process Control Block)中,即进程控制块
操作系统需要对各个并发运行的进程进行管理,但凡管理时所需要的信息,都会被放在PCB中
进程的组成——程序段、数据段
程序段:程序的代码(指令序列)
数据段:运行过程中产生的各种数据
程序段和数据段都是给进程自己用的
一个进程实体(进程映像)由PCB、程序段、数据段组成。进程是动态的,进程实体(进程映像)是静态的
进程的特征:
进程正在被创建时,它的状态是“创建态”,在这个阶段操作系统会为进程分配资源、初始化PCB。
当进程创建完成后,便进入“就绪态”,处于就绪态的进程已经具备运行条件,但由于没有空闲CPU,就暂时不能运行。
当CPU空闲时,操作系统就会选择一个就绪进程,让它上处理机运行;一个进程在CPU上运行,那么这个进程处于运行态
在进程运行的过程中,可能会请求等待某个事件的发生(如等待某种系统资源的分配,或者等待其他进程的响应)。在这个事件发生之前,进程无法继续往下执行,此时操作系统会让这个进程下CPU,并让它进入“阻塞态”;当CPU空闲时,又会选择另一个“就绪态”进程上CPU运行
一个进程可以执行 exit 系统调用,请求操作系统终止该进程。此时该进程会进入“终止态”,操作系统会让该进程下CPU,并回收内存空间等资源,最后还要回收该进程的PCB。当终止进程的工作完成之后,这个进程就彻底消失了
进程PCB中,会有一个变量 state 来表示进程的当前状态。如:1表示创建态、2表示就绪态、3表示运行态…
为了对同一个状态下的各个进程进行统一的管理,操作系统会将各个进程的PCB组织起来。
进程状态的转换
进程控制的主要功能是对系统中的所有进程实施有效的管理,它具有创建新进程、撤销已有进程、实现进程状态转换等功能。
进程控制需要使用“原语”实现,原语的执行具有原子性,它的运行必须是一气呵成,不可中断。如果不能“一气呵成”,就有可能导致操作系统中的某些关键数据结构信息不统一的情况,这会影响操作系统进行别的管理工作。
原语的“原子性”原理:他是使用“关中断指令”和“开中断指令”这两个特权指令实现原子性。正常情况:CPU每执行完一条指令都会例行检查是否有中断信号需要处理,如果有,则暂停运行当前这段程序,转而执行相应的中断处理程序。而CPU执行了“关中断指令”之后,就不再例行检查中断信号,直到执行“开中断信号指令”后才会恢复检查。关中断和开中断之间的指令就是不可中断的,因为他们不会检查是否有中断程序。
进程控制相关的原语:
CPU会设置很多“寄存器”,用来存放程序运行过程中所需的某些数据;常见的有:
总结:
无论哪个进程控制原语,要做的事情无非就是以下几种:
进程间通信(Inter-Process Communication, IPC)是指两个进程之间产生数据交互。
进程是分配系统资源的单位(包括内存地址空间),因此各进程拥有的内存地址空间相互独立。为了保证安全,一个进程不能直接访问另一个进程的地址空间;进程通信是需要操作系统支持。
基于存储区的共享:操作系统在内存中划出一块共享存储区,数据的形式、存放位置都由通信进程控制,而不是操作系统。这种共享方式速度很快,是一种高级通信方式。
为了避免错误,各个进程对共享空间的访问应该是互斥的;各个进程可以使用操作系统内核提供的同步互斥工具。(由通信进程自己负责实现互斥)
这种就是对共享空间做了限制,这种共享方式速度慢、限制多,是一种低级通信方式。
进程间的数据交换以格式化的消息(Message)为单位。进程通过操作系统提供的“发送消息/接收消息”两个原语进行数据交换。
格式化的消息包括消息头(发送进程ID、接受进程ID、消息长度等格式化的信息)和消息体两部分
消息发送进程要指明接收进程的ID。
进程P向进程Q发送消息:首先进程P执行发送原语,send(Q,msg),随后操作系统内核会把该消息挂入进程Q的消息队列,然后进程Q使用接收原语,receive(P,msg);最后消息从内核区复制到进程Q的地址空间。
通过“信箱”间接的通信;又称“信箱通信方式”。
进程P向进程Q发送消息:首先进程P在自己的地址空间完善要发送的消息内容,然后使用发送原语,send(A(A是信箱),msg);随后进程Q执行接受原语,receive(A,msg),从信箱A接受信息。
注意:允许多个进程往同一个信箱send发送消息,也可以多个进程从同一个信箱接受信息。
“管道”是一个特殊的共享文件,又名pipe文件。其实就是在内存中开辟一个大小固定的内存缓存区。
注意:
在很早没有引入进程之前,系统中各个程序只能串行执行(即很多功能不能同时享用,使用QQ的同时就不能听音乐)。有了进程后有些进程可能需要“同时”做很多事,而传统的进程只能串行地执行一系列程序,因此,引入了“线程”,来增加并发度。
引入线程后,线程成为了程序执行流的最小单位。
线程是一个基本的CPU执行单元,也是程序执行流的最小单位。引入线程之后,不仅是进程之间可以并发,进程内的各线程之间也可以并发,从而进一步提升了系统的并发度,使得一个进程内也可以并发处理各种任(如QQ视频、文字聊天、传文件)引入线程后,进程只作为除CPU之外的系统资源的分配单元(如打印机、内存地址空间等都是分配给进程的)。
线程则作为处理机的分配单元。
引入线程后的变化:
线程的属性:
背景知识:早期的操作是不支持线程,只支持进程;当时的线程是由线程库(就是一段代码逻辑的执行,简单的说就是通过代码实现)来实现的。
一个用户级线程映射到一个内核级线程。每个用户进程有与用户级线程同数量的内核级线程。
优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并行执行。
缺点:一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大
多个用户级线程映射到一个内核级线程。且一个进程只被分配一个内核级线程。
优点:用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高
缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可在多核处理机上并行运行。
多对多模型
n用户及线程映射到 m 个内核级线程(n >= m)。每个用户进程对应 m 个内核级线程。克服了多对一模型并发度不高的缺点(一个阻塞全体阻塞),又克服了一对一模型中一个用户进程占用太多内核级线程,开销大的缺点。
总结:
线程的组织和控制
当有一堆任务要处理,但由于资源有限,这些事情没法同时处理。这就需要确定某种规则来决定处理这些任务的顺序,这就是“调度”研究的问题。
按一定的原则从外存的作业后备队列中挑选一个作业调入内存,并创建进程。每个作业只调入一次,调出一次。作业调入时会建立PCB,调出时才撤销PCB。(作业就是指一个具体的任务)
内存不够时,可将某些进程的数据调出外存。等内存空闲或者进程需要运行时再重新调入内存。暂时调到外存等待的进程状态为挂起状态。被挂起的进程PCB会被组织成挂起队列
中级调度就是按照某种策略决定将哪个处于挂起状态的进程重新调入内存。一个进程可能会被多次调出、调入内存,因此中级调度发生的频率要比高级调度更高。
按照某种策略从就绪队列中选取一个进程,将处理机分配给它。
进程调度是操作系统中最基本的一种调度,在一般的操作系统中都必须配置进程调度。进程调度的频率很高,一般几十毫秒一次。
暂时调到外存等待的进程状态为挂起状态(挂起态,suspend);挂起态又可以进一步细分为就绪挂起、阻塞挂起两种状态。
“挂起”和“阻塞”的区别:
两种状态都是暂时不能获得CPU的服务,但挂起态是将进程映像调到外存去了,而阻塞态下进程映像还在内存中。有的操作系统会把就绪挂起、阻塞挂起分为两个挂起队列,甚至会根据阻塞原因不同再把阻塞挂起进程进一步细分为多个队列
进程调度(低级调度),就是按照某种算法从就绪队列中选择一个进程为其分配处理机。
需要进行进程调度与切换的情况:
不能进行进程调度与切换的情况:
临界资源:一个时间段内只允许一个进程使用的资源。各进程需要互斥地访问临界资源。
临界区:访问临界资源的那段代码。
内核程序临界区一般是用来访问某种内核数据结构的,比如进程的就绪队列(由各就绪进程的PCB组成)
实现简单、系统开销小但是无法及时处理紧急任务。适用于早期的批处理系统
可以优先处理更紧急的进程,也可实现让各进程按时间片轮流执行的功能(通过时钟中断)。适合于分时操作系统、实时操作系统
狭义的进程调度指的是从就绪队列中选中一个要运行的进程。(这个进程可以是刚刚被暂停执行的进程,也可能是另一个进程,后一种情况就需要进程切换)
进程切换是指一个进程让出处理机,由另一个进程占用处理机的过程。
广义的进程调度包含了选择一个进程和进程切换两个步骤
进程切换的过程:
注意:进程切换是有代价的,因此过于频繁的进行进程调度、切换,必然会使整个系统的效率降低,使系统大部分时间都花在了进程切换上,而真正用于进程执行的时间减少。
2、3由调度程序引起,调度程序决定了让哪个进程运行(调度算法)、运行时间
触发“调度程序”的事件:
不支持内核级线程的操作系统,调度程序的处理对象是进程;支持内核级线程的操作系统,调度程序的处理对象是线程。
闲逛进程:是调度程序永远的备胎,没有其它就绪进程时,运行闲逛进程(idle)。
闲逛进程的特性:优先级最低、能耗低、可以是0地址指令,占一个完整的指令周期
指CPU“忙碌”的时间占总时间的比例。
利用率=忙碌的时间/总时间
指单位时间内完成作业的数量
系统吞吐量=总共完成的作业/总共完成作业花费时间
指从作业被提交给系统开始,到作业完成为止的这段时间的间隔。它包括四个部分:作业在外存后备队列上等待作业调度(高级调度)的时间、进程在就绪队列上等待进程调度(低级调度)的时间、进程在CPU上执行的时间、进程等待I/O操作完成的时间。后三项在一个作业的整个处理过程中,可能发生多次。
周转时间=作业完成时间-作业提交时间(对于用户来说,更关心自己的单个作业的周转时间)
平均周转时间=各作业周转时间之和/作业数(对于操作系统来说,更关心的是系统的整体的表现,更关心所有作业周转时间的平均值)
带权周转时间=作业周转时间/作业实际运行的时间(一定>1)
平均带权周转时间=各作业带权周转时间之和/作业数
周转时间和带权周转时间都是越小越好
指进程/作业处于等待处理机状态时间之和,等待的时间越长,用户越不满意。
对于一个进程来说,等待时间就是指进程建立后等待被服务的时间之和,在等待I/O完成的期间其实进程也是被服务的,所以不计入等待时间。
对于作业来说,不仅要考虑建立进程后的等待时间,还要加上作业在外存后被队列中等待时间。
一个作业总共需要被CPU服务多久,被I/O设备服务多久一般是确定不变的,因此调度算法其实只会影响作业/进程的等待时间。当然,与前面指标类似,也有“平均等待时间”来评价整体
指从用户提交请求到首次产生响应所用的时间。
算法思想/规则:主要从”公平“的角度考虑,按照作业/进程到达的先后顺序进行服务。
用于作业调度时,考虑的是哪个作业先到达后备队列;用于进程调度时,考虑的是哪个进程先到达就绪队列
该算法是非抢占式的算法;不会导致饥饿(饥饿就是某进程/作业长期得不到服务)
优点:公平、算法实现简单
缺点:排在长作业(进程)后面的短作业需要等待很长时间,带权周转时间很大,对短作业来说用户体验不好。即,FCFS算法对长作业有利,对短作业不利。
算法思想/规则:追求最少的平均等待时间,最少的平均周转时间、最少的平均平均带权周转时间;最短的进程/作业优先得到服务(最短指的是服务时间最短)
用于进程调度时称为“短进程(SPF)优先算法”
SJF和SPF是非抢占式的算法,但是也有抢占式的——最短剩余时间优先算法(SRTN,ShortestRemainingTimeNext)
优点:“最短的”平均等待时间、平均周转时间
缺点:对短作业有利,对长作业不利;可能会产生饥饿现象
可能会导致饥饿现象,如果一直有短作业一直到来,可能长作业长时间得不到服务,产生“饥饿”现象。
抢占式的短作业优先算法又称“最短剩余时间优先算法”
注意:
算法思想/规则:要综合考虑作业/进程的等待时间和要求服务时间;在每次调度时要计算各个作业/进程的响应比,选择响应比最高的作业/进程为其服务。(既可用于进程调度,也可用于作业调度)
该算法是非抢占式的,只有当前运行进程/作业主动放弃处理机时,才需要调度,才需要计算响应比。
优点:综合考虑了等待时间和运行时间,等待时间相同时,要求服务时间短的优先(SJF的优点),服务相同时间时,等待时间越长的优先(FCFS的优点);该算法不会导致饥饿
以上三种算法主要关心对用户的公平性、平均周转时间、平均等待时间等评价系统整体性能的指标,但是不关心“响应时间”,也不区分任务的紧急程度,交互性很差。这三种算法适用于早期的批处理系统。
算法思想/规则:公平地、轮流地为各个进程服务,让每个进程在一定时间间隔内都可以得到响应;按照各进程到达就绪队列的顺序,轮流让各个进程执行一个时间片(如 100ms)。若进程未在一个时间片内执行完,则剥夺处理机,将进程重新放到就绪队列队尾重新排队。
用于进程调度,只有作业放入内存建立了相应的进程后,才能被分配处理机时间片
若进程未能在时间片内运行完,将被强行剥夺处理机使用权,因此时间片轮转调度算法属于抢占式的算法。由时钟装置发出时钟中断来通知CPU时间片已到。
优点:公平;响应快,适用于分时操作系统;
缺点:由于高频率的进程切换,因此有一定开销;不区分任务的紧急程度。
该算法不会导致饥饿。常用于分时操作系统,更注重“响应时间”,因而此处不计算周转时间。
注意:
算法思想/规则:随着实时操作系统的出现,越来越多的应用场景需要根据任务的紧急程度来决定执行顺序;每个作业/进程都有自己的优先级,调度时选择优先级最高的作业/进程。
该算法用于作业调度,也可用于进程调度。
该算法抢占式、非抢占式都有。做题时的区别在于:非抢占式只需在进程主动放弃处理机时进行调度即可,而抢占式还需在就绪队列变化时,检查是否会发生抢占。
非抢占式的优先级调度算法:每次调度时选择当前已到达且优先级最高的进程。当前进程主动放弃处理机时发生调度
抢占式的优先级调度算法:每次调度时选择当前已到达且优先级最高的进程。当前进程主动放弃处理机时发生调度。另外,当就绪队列发生改变时也需要检查是会发生抢占
优点:用优先级区分紧急程度、重要程度,适用于实时操作系统。可灵活地调整对各种作业/进程的偏好程度。
缺点:若源源不断地有高优先级进程到来,则可能导致饥饿
注意:
算法思想:对其他调度算法的折中权衡;
算法规则:
该算法用于进程调度。
抢占式的算法。在 k 级队列的进程运行过程中,若更上级的队列(1~k-1级)中进入了一个新进程,则由于新进程处于优先级更高的队列中,因此新进程会抢占处理机,原来运行的进程放回 k 级队列队尾。
优点:对各类型进程相对公平(FCFS的优点);每个新到达的进程都可以很快就得到响应(RR的优点);短进程只用较少的时间就可完成(SPF的优点);不必实现估计进程的运行时间(避免用户作假);可灵活地调整对各类进程的偏好程度,比如CPU密集型进程、I/O密集型进程(拓展:可以将因I/O而阻塞的进程重新放回原队列,这样I/O型进程就可以保持较高优先级。)
该算法会导致饥饿感。
注:比起早期的批处理操作系统来说,由于计算机造价大幅降低,因此之后出现的交互式操作系统(包括分时操作系统、实时操作系统等)更注重系统的响应时间、公平性、平衡性等指标。而这几种算法恰好也能较好地满足交互式系统的需求。因此这三种算法适合用于交互式系统。(比如UNIX使用的就是多级反馈队列调度算法)