作者:@阿亮joy.
专栏:《学会Linux》
座右铭:每个优秀的人都有一段沉默的时光,那段时光是付出了很多努力却得不到结果的日子,我们把它叫做扎根
操作系统的书籍一般都会给我们罗列出很多进程状态,比如:运行、新建、就绪、挂起、阻塞、等待和死亡等等。如此之多的概念,总会让我们学起来比较费劲。那操作系统会有如此之多的进程状态呢?其实是为了满足不同的运行场景。
对于人来说,对一件事的认识是不太可能建立在想象之上的。所以,我们先来了解一下操作系统的空间概念,看看普遍的操作系统层面是如何理解上面罗列的进程状态的。
运行、阻塞和挂起状态的讲解
以上是操作系统书籍对进程状态概念的定义,那么接下来我们就学习一下操作系统中具体的进程状态!
进程状态的描述
- R 运行状态(running) : 并不意味着进程一定在运行中,它表明进程要么是在运行中要么在运行队列里。
- S 睡眠状态(sleeping): 意味着进程在等待事件完成(这里的睡眠有时候也叫做可中断睡眠。
- D 磁盘休眠状态(Disk sleep)有时候也叫不可中断睡眠状态(uninterruptible sleep),在这个状态的进程通常会等待 IO 的结束。
- T 停止状态(stopped): 可以通过发送 SIGSTOP 信号给进程来停止 T 进程。这个被暂停的进程可以通过发送 SIGCONT 信号让进程继续运行。
- X 死亡状态(dead):这个状态只是一个返回状态,你不会在任务列表里看到这个状态。
在我们看来,我们的程序是一致在运行的,那为什么进程状态是休眠状态呢?其实是因为 printf 函数是将字符串打印到显示器(外设)上的,而显示器的速度是比较慢的,需要等待显示器就行要花比较长的时间(对 CPU 而言)。所以 99 % 的时间都是等 IO 就绪,1% 的时间在执行打印代码,所以我们查到的进程状态绝大多数是休眠状态。
注:需要访问外设的进程,其状态绝大多数时间是休眠状态 S,也是阻塞状态的一种。
kill - 19 PID #使处于运行状态的进程改为暂停状态
注:暂停状态也是阻塞状态的一种,处于暂停状态的进程不知道是否被挂起,由操作系统决定。
kill - 18 PID #使处于暂停状态的进程改为运行状态
可以看到,此时的运行状态和最开始的运行状态相比,少了一个 + 号。能通过 Ctrl + c 键杀死的进程是前台进程,不能通过 Ctrl + c 键杀死的进程是后台进程。前台进程的状态比后台进程的状态多了一个 + 号。只能通过kill -9 PID
来杀死后台进程。
注:在 Linux 系统中是看不到挂起状态的。因为用户只需要关心自己的进程是运行状态、休眠状态还是暂停状态,并不需要关心挂起状态。挂起状态是操作系统做内存管理将进程的代码和数据保存到磁盘上,我们并不需要知道,所以我们在 Linux 系统下是看不到挂起状态的。
上面提到的休眠状态 S 是浅度睡眠状态,该状态是可以被终止的!而深度睡眠状态是很少见的,常见于高 IO、高并发的场景。在该状态下的进程,无法被操作系统杀死,只能通过断点或者进程自己醒来来解决。深度睡眠的状态只见于高 IO 的情况,大家可以通过dd
指令浅浅地逝一下。
注:T(tracing stop) 是暂停状态的一种,该状态 t 表示该进程正在被追踪(调试)。
Makefile 新语法
操作系统的书籍上都会给我们介绍进程的死亡状态,而在 Linux 系统中,我们无法验证一个进程是否死亡。当进程死亡时,操作系统会立即或延迟进程占用的资源。
- 僵死状态(Zombies)是一个比较特殊的状态。当进程退出并且父进程(使用wait()系统调用,后面讲)没有读取到子进程退出的返回代码时就会产生僵死(尸)进程。
- 僵死进程会以终止状态保持在进程表中,并且会一直在等待父进程读取退出状态代码。
- 所以,只要子进程退出,父进程还在运行,但父进程没有读取子进程状态,子进程进入 Z 状态。
进程被创建出来,就为了帮助操作系统或者用户完成某些任务。那对于操作系统和用户来说,肯定会关心该进程把任务完成的如何。那么进程退出的时候,就不能立即释放该进程对应的资源,而应该保存一段时间,让父进程或者操作系统来读取进程退出结果。如果父进程不读取子进程的退出结果,就会造成僵尸进程。
如何创建处于僵尸状态的进程?只要子进程退出,父进程还在运行,但父进程没有读取子进程的状态,子进程就会进入僵尸状态 Z。
while :; do ps ajx | head -1 && ps ajx | grep myprocess | grep -v grep; sleep 1; done #自动化监控脚本
#-v选项 grep搜索时过滤掉指定关键词
注:僵尸进程是有很大危害的,这个问题到进程控制模块会讲解!
僵尸进程的危害
- 进程的退出状态必须被维持下去,因为他要告诉关心它的进程(父进程),你交给我的任务,我办的怎么样了。可父进程如果一直不读取,那子进程就一直处于 Z 状态。
- 维护退出状态本身就是要用数据维护,也属于进程基本信息,所以保存在 task_struct(PCB) 中。换句话说, Z 状态一直不退出, PCB 一直都要维护。
- 那一个父进程创建了很多子进程,就是不回收子进程,就会造成内存资源的浪费。因为数据结构对象本身就要占用内存,想想C中定义一个结构体变量(对象),是要在内存的某个位置进行开辟空间。
- 僵尸进程不解决会造成内存泄漏问题!!!
- 父进程如果提前退出,那么子进程后退出,进入 Z之后,那该如何处理呢?
- 父进程先退出,子进程就称之为 “孤儿进程”。
- 孤儿进程被1号 init 进程领养,当然要有 init 进程回收喽。
- 如果是前台进程创建的子进程变成了孤儿进程,那么该孤儿进程会自动变成后台进程。
输入 kill -9 父进程PID 杀死父进程后,子进程就会被1号进程领养。那为什么看不到父进程变成僵尸进程呢?因为父进程也有父进程,其父进程是 bash,将其资源回收了,所以我们就看不到父进程的僵尸状态了。
1号进程就是操作系统!
- CPU 资源分配的先后顺序,就是指进程的优先级(priority)。
- 优先权高的进程有优先执行权利。配置进程优先权对多任务环境的 Linux 很有用,可以改善系统性能。
- 还可以把进程运行到指定的 CPU 上,这样一来,把不重要的进程安排到某个CPU,可以大大改善系统整体性能。
优先级和权限的区别:权限是能不能的问题,而优先级是谁先谁后的问题。为什么要存在优先级?因为资源太少了。优先级本质是 PCB 中的一个或者几个整数数字。
ps -la #查看进程的优先级
- UID : 代表执行者的身份
- PID : 代表这个进程的代号
- PPID :代表这个进程是由哪个进程发展衍生而来的,亦即父进程的代号
- PRI :代表这个进程可被执行的优先级,其值越小越早被执行
- NI :代表这个进程的 nice 值
- PRI也还是比较好理解的,即进程的优先级,或者通俗点说就是程序被CPU执行的先后顺序,此值越小进程的优先级别越高。
- 那 NI 呢?就是我们所要说的 nice 值了,其表示进程可被执行的优先级的修正数值。
- 进程的 PRI 值越小就越快被执行,那么加入 nice 值后,将会使得 PRI 变为:PRI(new)=PRI(old)+nice
- 这样,当 nice 值为负值的时候,那么该程序将会优先级值将变小,即其优先级会变高,则其越快被执行。
- 所以在 Linux 系统下,调整进程优先级就是调整进程的 nice 值。
- nice 值的取值范围是 -20 至 19,一共 40 个级别。
- 需要强调一点的是,进程的 nice 值不是进程的优先级。他们不是一个概念,但是进程的 nice 值会影响到进程的优先级变化,可以理解 nice 值是进程优先级的修正值。
- 默认情况下,进程的 nice 值为 0,PRI(old) 为 80。
- sudo top
- 进入 top 后按 “r” –> 输入进程 PID –> 输入 nice 值
注:nice 值的设置范围是 -20 到 19,设置太大或太小都不会超过该范围。因为 nice 值太大或太小都会影响 CPU 调用进程的公平性。每次修改 nice 值,都是在 PRI = 80 的基础上修改的。
- 竞争性: 系统进程数目众多,而 CPU 资源只有少量,甚至 1 个,所以进程之间是具有竞争属性的。为了高效完成任务,更合理竞争相关资源,便具有了优先级。
- 独立性: 多进程运行,需要独享各种资源,多进程运行期间互不干扰。
- 并行: 多个进程在多个 CPU 下分别,同时进行运行,这称之为并行。
- 并发: 多个进程在一个 CPU 下采用进程切换的方式,在一段时间之内,让多个进程都得以推进,称之为并发。
注:CPU 调度进程的方式,并不是将该进程执行完再去执行另一个进程,而是采取时间片轮转的方式来调度进程的。也就是将时间段切分为很多的小时间片,这个时间片来调度这个进程,这个时间片过后,该进程执行完毕或者重新到运行队列中排队。到了下一个时间片,就会去调度另外一个进程。这样,在一段时间内,多个进程都能够得以推进,这也就是并发。
- CPU 内部只有一套寄存器硬件,CPU 中的寄存器 eip (pc 指针) 可以保存当前正在执行指令的下一条指令的地址,寄存器里面保存的数据是属于当前进程的。寄存器硬件不等于寄存器内的数据!
- CPU 调度进程需要做的三件事:取指令、分析指令和执行指令。
- 进程在运行的时候需要占用 CPU,但进程并不是一直要占用 CPU 到进程结束的! 进程在运行的时候都会有自己的时间片, 进程运行时一定会产生非常多的临时数据,也称为上下文,这些数据属于当前进程!当进程的时间片跑完了,该进程产生的临时数据需要保存到操作系统的段描述符中,这也称为上下文保护。当该进程再次运行起来时,需要将临时数据恢复,从上一次执行的地方开始运行起来,这也称为上下文恢复。
- 进程在切换的时候,要进行进程的上下文保护;当进程恢复运行的时候,要进行上下文的恢复!
- 寄存器内的数据只属于当前运行的进程。寄存器被所有进程共享,寄存器内的数据是每个进程各自私有的上下文数据。
本篇博客主要讲解了进程状态的普遍理解、Linux 系统的进程状态、僵尸进程、孤儿进程、进程优先级、并行和并发以及进程切换等。那么以上就是本篇博客的全部内容了,如果大家觉得有收获的话,可以点个三连支持一下!谢谢大家!❣️