本文主要涉及操作系统的简介、硬件结构、内存管理、进程管理、文件系统、设备管理等内容,可以作为学习操作系统的辅助文本记录。撰写本文的目的主要是针对操作系统整体做一个相对完整的梳理,以便后续回顾之用。
本文是第四篇,讲述操作系统的进程和线程的调度算法、同步互斥、通信、死锁等。
第一篇:操作系统(一)基础知识及操作系统启动
第二篇:操作系统(二)内存管理的基础知识
第三篇:操作系统(三)进程和线程的基础知识
在进程的生命周期中,当进程从一个运行状态到另外一状态变化的时候,其实会触发一次调度。
从就绪态 -> 运行态:当进程被创建时,会进入到就绪队列,操作系统会从就绪队列选择一个进程运行;
从运行态 -> 阻塞态:当进程发生 I/O 事件而阻塞时,操作系统必须选择另外一个进程运行;
从运行态 -> 结束态:当进程退出结束后,操作系统得从就绪队列选择另外一个进程运行;
非抢占系统
可抢占系统
中断请求被服务例程响应完成时
当前进程被抢占
进程的时间片用完
进程从等待切换到就绪
另外,如果硬件时钟提供某个频率的周期性中断,那么可以根据如何处理时钟中断 ,把调度算法分为两类:
调度原则:
原则一:如果运行的程序,发生了 I/O 事件的请求,那 CPU 使用率必然会很低,因为此时进程在阻塞等待硬盘的数据返回。这样的过程,势必会造成 CPU 突然的空闲。所以,为了提高 CPU 利用率,在这种发送 I/O 事件致使 CPU 空闲的情况下,调度程序需要从就绪队列中选择一个进程来运行。
原则二:有的程序执行某个任务花费的时间会比较长,如果这个程序一直占用着 CPU,会造成系统吞吐量(CPU 在单位时间内完成的进程数量)的降低。所以,要提高系统的吞吐率,调度程序要权衡长任务和短任务进程的运行完成数量。
原则三:从进程开始到结束的过程中,实际上是包含两个时间,分别是进程运行时间和进程等待时间,这两个时间总和就称为周转时间。进程的周转时间越小越好,如果进程的等待时间很长而运行时间很短,那周转时间就很长,这不是我们所期望的,调度程序应该避免这种情况发生。
原则四:处于就绪队列的进程,也不能等太久,当然希望这个等待的时间越短越好,这样可以使得进程更快的在 CPU 中执行。所以,就绪队列中进程的等待时间也是调度程序所需要考虑的原则。
原则五:对于鼠标、键盘这种交互式比较强的应用,我们当然希望它的响应时间越快越好,否则就会影响用户体验了。所以,对于交互式比较强的应用,响应时间也是调度程序需要考虑的原则。
针对上面的五种调度原则,总结成如下:
系统利用效率:
用户角度:
减少响应时间
及时处理用户的输入请求,尽快将输出反馈给用户
减少平均响应时间的波动
在交互系统中,可预测性比高差异低平均更重要
低延迟调度改善了用户的交互体验
增加吞吐量
减少开销(操作系统开销,上下文切换)
系统资源的高效利用(CPU,I/O设备)
减少等待时间
操作系统需要保证吞吐量不受用户交互的影响
依据进程进入就绪状态的先后顺序排列
进程进入等待或结束状态时,就绪队列中的下一个进程占用CPU
优点:
缺点:
I/O资源和CPU资源的利用率较低
选择就绪队列中执行时间最短进程占用CPU进入运行状态,这有助于提高系统的吞吐量
就绪队列按照预期的执行时间进行排序
优点:
缺点:
可能导致饥饿
连续的短进程流会使长进程无法获得CPU资源
需要预知未来
如何预估下一个CPU计算的持续时间
简单的办法:询问用户
用历史的执行时间来预估未来的执行时间
每次进行进程调度时,先计算「响应比优先级」,然后把「响应比优先级」最高的进程投入运行,「响应比优先级」的计算公式:
优先权 = 等待时间 + 要求服务时间 要求服务时间 优先权 = \frac{等待时间+要求服务时间}{要求服务时间} 优先权=要求服务时间等待时间+要求服务时间
时间片:分配CPU资源的基本时间单位
时间片结束时,按照FCFS算法切换到下一个就绪进程
RR算法开销
时间片过大
时间片太小
时间片长度选择
对于多用户计算机系统就有不同的看法了,它们希望调度是有优先级的,即希望调度程序能从就绪队列中选择最高优先级的进程进行运行,这称为最高优先级(Highest Priority First,HPF)调度算法。
该算法也有两种处理优先级高的方法,非抢占式和抢占式:
但是依然有缺点,可能会导致低优先级的进程永远不会运行。
FSS控制用户对系统资源的访问
一些用户组比其他用户组更加重要
保证不重要的组无法垄断资源
未使用的资源按比例分配
没有达到资源使用率目标的组获得更高的优先级
实时操作系统:正确性依赖时间和功能两方面的操作系统
实时操作系统的性能指标:时间约束的及时性(deadlines)(在规定时间完成任务);速度和平均性能相对不重要;
实时操作系统的特性:时间约束的可预测性,(可以知道在什么情况下,时间约束是可以达到的)。
实时任务: 一次计算、一次文件读取、一次信息传递等等
周期实时任务: 一系列相似的任务
硬实时(硬时限,Hard deadline):
软实时(软时限,Soft deadline):
**可调度性:**表示一个实时操作系统能够满足任务时限要求
多处理机调度的特征:
对称多处理器(SMP,Symmetric multiprocessing)调度
我们把一个进程到底放到哪一个处理器上运行?
静态进程分配
动态进程分配
操作系统中出现高优先级进程长时间等待低优先级进程所占用资源的现象
基于优先级的可抢占调度算法会存在优先级反置
处理:
独立的线程:
合作线程:
在多个线程中共享状态
不确定性
不可重现
不确定性和不可重现意味着 bug 可能是间歇性发生的
进程间合作的原因:
进程 / 线程,计算机 / 设备需要合作
优点 1:共享资源
一台电脑,多个用户
一个银行存款余额,多台 ATM 机
嵌入式系统(机器人控制:手臂和手的协调)
优点 2:加速
I/0 操作和计算可以重叠
多处理器 一 将程序分成多个部分井行执行
优点 3:模块化
将大程序分解成小程序
以编译为例,gcc 会调用 cpp, cc1, cc2. as, ld,使系统易于扩展
线程之间是可以共享进程的资源,比如代码段、堆空间、数据段、打开的文件等资源,但每个线程都有自己独立的栈空间。线程是调度的基本单位,进程则是资源分配的基本单位。
竞争条件(race condition),当多线程相互竞争操作共享变量时,由于运气不好,即在执行过程中发生了上下文切换,我们得到了错误的结果,事实上,每次运行都可能得到不同的结果,因此输出的结果存在不确定性(indeterminate)。
互斥(mutual exclusion): 一个进程占用资源,其他进程不能使用
死锁(deadlock): 多个进程各占部分资源,形成循环等待
饥饿(starvation): 其他进程可能轮流占用资源,一个进程一直得不到资源
原子操作(Atomic Operation): 指一次不存在任何中断或失败的操作
原子操作指令:
现代CPU体系结构都提供一些特殊的原子操作指令
测试和置位(Test-and-Set)指令
交换指令(exchange)
交换内存中的两个值
所谓同步,就是并发进程/线程在一些关键点上可能需要互相等待与互通消息,这种相互制约的等待与互通信息称为进程/线程同步。
临界区(critical section): 进程中访问临界资源的一段需要互斥执行的代码,任何时刻只允许一个进程在这其中执行。
进入区(entry section): 检查可否进入临界区的一段代码,如可进入,设置相应”正在访问临界区“标志
退出区(exit section): 清除"正在访问临界区"标志
剩余区(remainder section): 代码中的其余部分
1. 禁用硬件中断
没有中断、没有上下文切换,因此没有并发
硬件将中断处理延迟到中断被启用之后
现代计算机体系结构都提供指令来实现禁用中断
禁用中断后,进程无法被停止
2. 基于软件的同步解决方法
Peterson算法
Dekkers算法
3. 更高级的抽象方法
锁(lock):是一个抽象的数据结构,二进制变量(锁/解锁)
锁单独介绍。
常用的三种同步实现方法
使用加锁操作和解锁操作可以解决并发线程/进程的互斥问题。
任何想进入临界区的线程,必须先执行加锁操作。若加锁操作顺利通过,则线程可进入临界区;在完成对临界资源的访问后再执行解锁操作,以释放该临界资源。
自旋锁(Spin lock)
使用TS指令实现自旋锁,线程在等待时需要消耗CPU时间;
无忙等待锁
在获取不到锁的时候,不用自旋;而是将当前进程/线程放入到锁的等待队列,然后执行调度程序,把CPU让给其他进程/线程执行。
多线程并发导致资源竞争
信号量是操作系统提供的一种协调共享资源访问的方法。
信号量是一个抽象数据类型
由一个整型(sem)变量和两个原子操作组成
P()(Prolaag,荷兰语,尝试减少)
sem减1
如sem < 0. 进入等待否则继续
V() (Verhoog, 荷兰语,增加)
sem加1
sem$\leq$0,唤醒一个等待进程
信号量是被保护的整数变量
初始化完成后,只能通过P()和V()操作修改
由操作系统保证,PV操作是原子操作
信号量的分类
用信号量实现临界区的互斥访问
每类资源设置一个信号量,初值为1;
一个线程进入,信号量值为0,可以执行;
第二个线程进入,信号量为-1,等待。
必须 成对使用PV操作
用信号量实现条件同步
每个条件同步设置一个信号量,初值为0
有个线程想要申请,信号量变为-1,等待;
等到另一个线程执行了对应信号量的V操作,变为0;
等待的线程就可以继续执行。
不能避免 死锁
管程是一种用于并发编程的概念,它提供了一种结构化的方法来管理共享资源和协调并发执行的程序。管程通常由一个包含共享数据和用于操作这些数据的过程(也称为条件变量)组成,它可以帮助程序员更容易地编写并发程序,避免出现竞争条件(race condition)、死锁等问题。
作用:
每个进程的用户地址空间都是独立的,一般而言是不能互相访问的,但内核空间是每个进程都共享的,所以进程之间要通信必须通过内核。
进程通信是进程进行通信和同步的机制
IPC提供两个基本操作:
发送操作:send(message)
接收操作:receive(message)
进程通信流程
进程链路特征
物理:共享内存、硬件总线等
逻辑:逻辑属性等
通信链路的属性:
进程必须正确的命名对方
通过操作系统维护的消息队列实现进程间的消息接收和发送
通信链路的属性
通信流程
基本通信操作:
send(A, message) - 发送消息到队列A
receive(A, message) - 从队列A接收消息
进程通信可以划分为阻塞(同步)或非阻塞(异步)
阻塞通信:
阻塞发送:发送者在发送消息后进入等待,直到接收者成功收到
阻塞接收:接收方在请求接收消息后进入等待,直到成功接收到消息
非阻塞通信:
非阻塞发送:发送者在消息发送后,可以立即进行其他操作;
非阻塞接收:接收者在请求接收消息后,如果没有消息发送过来,接收者接收不到任何消息
进程通信的具体方法
信号:
进程间的软中断通知和处理机制
如:SIGKILL,SIGSTOP, SIGCONT等
信号的接收处理
捕获(Catch):执行进程指定的信号处理函数;
忽略(Ignore):执行操作系统指定的缺省处理
如:进程终止,进程挂起等
屏蔽(Mask):禁止进程接收和处理信号
可能是暂时的(当处理同样类型的信号)
不足:传送信息量小,只有一个信号类型
对于异常情况下的工作模式,就需要用「信号」的方式来通知进程。
在 Linux 操作系统中, 为了响应各种各样的事件,提供了几十种信号,分别代表不同的意义。我们可以通过 kill -l
命令,查看所有的信号
信号是进程间通信机制中唯一的异步通信机制,因为可以在任何时候发送信号给某一进程,一旦有信号产生,我们就有下面这几种,用户进程对信号的处理方式。
1.执行默认操作。Linux 对每种信号都规定了默认操作,例如,上面列表中的 SIGTERM 信号,就是终止进程的意思。
2.捕捉信号。我们可以为信号定义一个信号处理函数。当信号发生时,我们就执行相应的信号处理函数。
3.忽略信号。当我们不希望处理某些信号的时候,就可以忽略该信号,不做任何处理。有两个信号是应用进程无法捕捉和忽略的,即 SIGKILL
和 SEGSTOP
,它们用于在任何时候中断或结束某一进程。
sigkill和sigstop在linux操作系统中有什么区别和联系?
Sigkill和Sigstop都是Linux系统中的信号,但它们的含义和使用场景是不同的。
Sigkill信号的编号为9,表示强制杀死一个进程。当一个进程收到Sigkill信号时,该进程会立即停止运行,没有任何机会来处理该信号。实际上,Sigkill信号是操作系统保留的信号,无法被程序捕获或忽略,因为该信号会立即终止进程。
Sigstop信号的编号为17,表示暂时停止一个进程的执行。当一个进程收到Sigstop信号时,该进程会被挂起,直到接收到Sigcont信号后才能继续运行。与Sigkill信号不同,Sigstop信号可以被程序捕获和处理,以便在进程被挂起前执行一些清理操作。
通常情况下,我们应该尽量避免使用Sigkill信号来结束进程,因为这样可能会导致数据丢失或者其他不可预知的后果。而Sigstop信号则可以用于进程的调试或者控制,比如让某个进程暂停一段时间,以便我们进行相关操作。
进程通信的另一具体方法
|
这个就是Linux命令中的管道表示,他的功能它的功能是将前一个命令(ps auxf
)的输出,作为后一个命令(grep mysql
)的输入,从这功能描述,可以看出管道传输数据是单向的,如果想相互通信,我们需要创建两个管道才行。
ps auxf | grep mysql
同时,我们得知上面这种管道是没有名字,所以「|
」表示的管道称为匿名管道,用完了就销毁。
管道还有另外一个类型是命名管道,也被叫做 FIFO
,因为数据是先进先出的传输方式。
我们可以看出,管道这种通信方式效率低,不适合进程间频繁地交换数据。
其实,所谓的管道,就是内核里面的一串缓存。从管道的一段写入的数据,实际上是缓存在内核中的,另一端读取,也就是从内核中读取这段数据。另外,管道传输的数据是无格式的流且大小受限。
另外,对于命名管道,它可以在不相关的进程间也能相互通信。因为命令管道,提前创建了一个类型为管道的设备文件,在进程里只要使用这个设备文件,就可以相互通信。
命名管道突破了匿名管道只能在亲缘关系进程间的通信限制,因为使用命名管道的前提,需要在文件系统创建一个类型为 p 的设备文件,那么毫无关系的进程就可以通过这个设备文件进行通信。另外,不管是匿名管道还是命名管道,进程写入的数据都是缓存在内核中,另一个进程读取数据时候自然也是从内核中获取,同时通信数据都遵循先进先出原则,不支持 lseek 之类的文件定位操作。
消息队列:由操作系统维护的以字节序列为基本单位的间接通信机制
每个消息(Message)是一个字节序列
相同标识的消息组成按照先进先出顺序组成一个消息队列(MessageQueues)
消息队列是保存在内核中的消息链表,在发送数据时,会分成一个一个独立的数据单元,也就是消息体(数据块),消息体是用户自定义的数据类型,消息的发送方和接收方要约定好消息体的数据类型,所以每个消息体都是固定大小的存储块,不像管道是无格式的字节流数据。如果进程从消息队列中读取了消息体,内核就会把这个消息体删除。
消息队列生命周期随内核,如果没有释放消息队列或者没有关闭操作系统,消息队列会一直存在,而前面提到的匿名管道的生命周期,是随进程的创建而建立,随进程的结束而销毁。
消息这种模型,两个进程之间的通信就像平时发邮件一样,你来一封,我回一封,可以频繁沟通了。
但邮件的通信方式存在不足的地方有两点,一是通信不及时,二是附件也有大小限制,这同样也是消息队列通信不足的点。
消息队列不适合比较大数据的传输,因为在内核中每个消息体都有一个最大长度的限制,同时所有队列所包含的全部消息体的总长度也是有上限。在 Linux 内核中,会有两个宏定义 MSGMAX
和 MSGMNB
,它们以字节为单位,分别定义了一条消息的最大长度和一个队列的最大长度。
消息队列通信过程中,存在用户态与内核态之间的数据拷贝开销,因为进程写入数据到内核中的消息队列时,会发生从用户态拷贝数据到内核态的过程,同理另一进程读取内核中的消息数据时,会发生从内核态拷贝数据到用户态的过程。
共享内存是把同一个物理内存区域同时映射到多个进程的内存地址空间的通信机制。这样这个进程写入的东西,另外一个进程马上就能看到了,都不需要拷贝来拷贝去,传来传去,大大提高了进程间通信的速度。
进程:
每个进程都有私有内存地址空间
每个进程的内存地址空间需要明确设置共享内存段
线程:同一个进程中的线程总是共享相同的地址内存空间
优点:快速、方便地共享数据
不足:必须使用额外的同步机制来协调数据访问,以避免还没有写完就有别的进程来读
前面提到的管道、消息队列、共享内存、信号量和信号都是在同一台主机上进行进程间通信,那要想跨网络与不同主机上的进程之间通信,就需要 Socket 通信了。
实际上,Socket 通信不仅可以跨网络与不同主机的进程间通信,还可以在同主机上进程间通信。
我们来看看创建 socket 的系统调用:
int socket(int domain, int type, int protocal)
三个参数分别代表:
根据创建 socket 类型的不同,通信的方式也就不同:
由于竞争资源或者通信关系,两个或更多线程在执行中出现,永远相互等待只能由其他进程引发的事件
当两个线程为了保护两个不同的共享资源而使用了两个互斥锁,那么这两个互斥锁应用不当的时候,可能会造成两个线程都在等待对方释放锁,在没有外力的作用下,这些线程会一直相互等待,就没办法继续运行,这种情况就是发生了死锁。
资源分类
可重用资源(Reusable Resource)
资源不能被删除且在任何时刻都只能有一个进程使用
进程释放资源后,其他进程可以重用
示例:I/O设备,数据库、处理器等
可能出现死锁:占用部分资源而等待另一资源
消耗资源(Consumable resource)
资源创建和销毁
消耗资源示例:中断、信号等
可能出现死锁,进程间相互等待接收对方的消息
出现死锁的必要条件
死锁预防(Deadlock Prevention)
破坏四个必要条件之一,确保系统永远不会进入死锁状态
死锁避免(Deadlock Avoidance)
在使用之前判断,只允许不会出现死锁的进程请求资源
死锁检测和恢复(Deadlock Detection & Recovery)
在检测到运行系统进入到死锁状态后,进行恢复
由应用进程处理死锁
通常操作系统忽略死锁,包括UNIX等
采用某种策略,限制并发进程对资源的请求,使系统在任何时刻都不满足死锁的必要条件
互斥:将互斥的共享资源封装成可以同时访问
持有并等待:进程请求资源时,要求他不持有任何其他资源(必须一次性申请自己需要所有的资源,但资源利用率低)
非抢占:如进程请求不能立即分配的资源,就释放自己已经占有的资源
循环等待:对资源排序,要求进程按顺序请求资源, 使用资源有序分配法,来破环环路等待条件。
线程 A 和 线程 B 获取资源的顺序要一样,当线程 A 是先尝试获取资源 A,然后尝试获取资源 B 的时候,线程 B 同样也是先尝试获取资源 A,然后尝试获取资源 B。也就是说,线程 A 和 线程 B 总是以相同的顺序申请自己想要的资源。那么假如线程A获取了资源A之后,线程B尝试获取资源A的时候就会发现资源A被占用,互斥使其等待,破坏了环路等待条件,死锁不会发生。
利用额外的先验信息,在分配资源时判断是否会出现死锁,只在不会死锁时分配资源
银行家算法是一个避免死锁产生的算法。以银行借贷分配策略为基础,判断并保证系统处于安全状态
客户在第一次申请贷款时,声明所需最大资金量,在满足所有贷款要求并完成项目时,及时归还;
在客户贷款数量不超过银行拥有的最大值时,银行家尽量满足客户要求;
类比
银行家 – 操作系统
资金 — 资源
客户 – 申请资源的线程
数据结构
n = 线程数量,m = 资源类型数量
Max(总需求量): n *m的矩阵;
Available(剩余空闲量): 长度为m的向量
Allocation(已分配量):n*m矩阵;
Need(未来需要量): n*m的矩阵
允许系统进入死锁状态
维护系统的资源分配图
定期调用死锁检测算法来搜索图中是否存在死锁
出现死锁时,用死锁恢复机制进行恢复
死锁检测算法的使用:
死锁多久可能会发生?多少进程需要回滚
进程终止:终止所有的死锁进程,一次终止一个进程直到死锁消除
终止顺序:
进程的优先级;进程已经运行的时间和还需运行的时间;进程已占用的资源;进程完成需要的资源
本节主要操作系统的进程和线程的调度算法、同步互斥、通信、死锁等。
本主要文参考:
如果您觉得我写的不错,麻烦给我一个免费的赞!如果内容中有错误,也欢迎向我反馈。