深入解析进程

在现代计算机系统中,进程是一个核心概念,它代表了程序的执行实例。通过并发执行多个进程,计算机能够提高效率和资源利用率。

1. 进程的概念

进程是指在计算机系统中正在执行的程序的实例。每个进程都有自己的地址空间、寄存器集合、堆栈和文件描述符等资源。进程的创建和销毁由操作系统负责管理。进程可以独立运行,也可以与其他进程进行通信和协作。进程是操作系统分配资源的基本单位。

2. 进程在系统中的管理 

2.1  描述

进程是类似于对象,有一些属性,所以需要 像 类/结构体 这样的概念来描述它

操作系统大多是 C/C++实现的,所以进程的描述大多使用的是结构体 (没有Java写的操作系统)

表示进程信息的结构体,被称为 PCB (进程控制块, Process Control Block)这个概念在说有操作系统中是通用的,说有的操作系统中的进程都可以被称为PCB,不过具体对应的结构体名称可能会有不同,例如Linux 中该结构体名称 为 task_struct

2.2 组织 

在操作系统中所有进程都会被以一定的数据结构进行组织起来, 例如 在Linux 中,使用的是链表把所有的进程给串联起来,当我们看到任务管理器中的进程时,意味着系统内部就在遍历链表,并打印每个节点的相关信息。

如果运行一个新的程序,于是系统中就会多一个进程,多出的这个进程,就需要构造出一个新的 PCB 并且添加到链表上

如果某个运行的程序,退出了,就需要把对应的 PCB 从链表中删除, 并且销毁对应的 PCB 资源 

3. CPU的资源分配

一个CPU可能有一个核心可能有多个核心,在同一时刻,一个核心上只能有一个进程,以我的电脑为例:

深入解析进程_第1张图片

我的电脑有16个逻辑核心,也就是说,同一时刻我的电脑上只能运行16个进程,但是我电脑上却不止运行了16个进程,于是就引出了一个概念 分时复用(并发):让多个进程轮流在核心上运行。

假设只有一个核心,让进程1先执行一会,然后让进程2执行, 然后进程三执行.....然后又到进程1执行,以此类推,只要切换的速度足够快人是感知不到这个切换的过程的,于是在人眼中看起来,一个核心在同时执行多个进程,这就叫做并发

如果有多个核心 ,那么同时就可以有多个不同的进程,同时执行,这种同时执行不是靠快速切换来模拟出来的,称为“并行执行”  ,每个核心任然会进行分时复用。

现在的计算机执行过程 往往是 并行+并发 同时存在的, 两个进程是并行执行还是并发执行 是看系统的调度的,系统如何调度,取决于系统调度器模块的实现,常规手段是无法干预的。因此往往把“并行” 和 “并发” 统称为“并发”

深入解析进程_第2张图片

我们打开任务管理器看见进程所占的CPU百分比是单位时间内 该进程在CPU上执行的时间比例

 

4. PCB 中的核心属性

PCB 这个结构体,是一个非常庞大的结构体,有上百个属性,这里我们只需要了解几个重要的属性

4.1 进程标识符(Process Identifier,PID)

每个进程都有一个唯一的PID,用于标识和管理进程,此处是通过一个整数来进行区分的(从1开始累加),系统会保证同一个机器上,同一时间,每个进程的PID是唯一的,如果要对某个进程进行一定的操作,就可以用PID进行区分

深入解析进程_第3张图片 

例如:在任务管理器中选中某个进程点击结束任务,此时就是任务管理器获取到你选中的进程的PID 然后带哦用一个系统的 API 把 PID 作为参数传进去 从而完成这里的结束任务的操作。

4.2 内存指针

进程运行过程中,需要消耗一些系统资源,其中内存就是一种重要的资源。进程想要使用内存需要从系统这里申请,系统给进程分配了一块空间才能使用。每个进程都只能使用自己申请到的内存。

内存指针就是用来描述这个进程,能使用哪些内存。

当开始运行一个进程的时候,系统会先把这个执行文件包含的指令和数据先加载到内存中,然后再创建进程,让进程开始执行

4.3 文件描述符表 

进程经常要访问硬盘

操作系统对于硬盘这样的硬件设备进行了封装 ->"文件"

一个进程想要操作文件,需要先打开文件 ,打开文件就是 让进程在文件描述符表中分配一个表项(构造一个结构体)表示这个文件的相关信息,例如C语言中的 fopen函数

4.4 状态

描述,某个进程,是否能够 去 CPU上执行,比如某个进程 通过Scanner等待用户输入,但是用户什么时候输入是不确定的,所以在用户输入前就不能让这个进程在CPU上

此时这个进程的状态就被称为 “阻塞状态”

阻塞状态:当前进程不方便去CPU上执行,不应该去调度它

就绪状态:当前进程随时可以去CPU上执行,等待系统调用

4.5 优先级 

多个进程等待系统调度时,调度的先后顺序,在CPU上执行的时间长短都是可以调配的。

例如在你玩游戏时,当前运行的游戏,优先级肯定是比大多数进程更高的。

4.6 记账信息 

对每个进程在CPU上调度的时间进程一个统计 ,针对这个结果对进程的调度进行一个调整

4.7 上下文 

上下文是支持进程调度的重要信息,相当于游戏的存档和读档。

每个进程在运行过程中,会有很多的中间结果,在CPU的寄存器中,操作系统对进程的调度可以认为是随机的,任何一个进程执行到任何一条指令的时候都有可能被调度出CPU,上下文就可以保存当前进程执行的进度,确保下次该进程再次进出CPU执行时,能够从上次被调度出CPU时的进度开始执行。

例如:执行 3 + 14时,刚把 3 和 14 存到寄存器中,这个进程就被调度走了,等这个进程再次进入CPU执行时,就会直接执行后续的指令,不会再次执行 把3 和 14 存到寄存器的指令

当操作系统决定切换到另一个进程时,需要保存当前进程的上下文信息,并加载下一个进程的上下文。 

5. 进程间通信

多个进程之间需要进行通信和协作,以实现共享资源、数据传输和协同处理等目标。常见的进程间通信方法包括:

  1. 管道(Pipe):一种单向的通信方式,可以在具有亲缘关系的进程之间进行通信。
  2. 共享内存(Shared Memory):多个进程可以访问同一块共享内存,实现高速的数据传输和共享。
  3. 消息队列(Message Queue):多个进程可以通过消息队列进行异步通信,将消息发送到队列中,其他进程可以从队列中接收消息。
  4. 套接字(Socket):用于不同计算机之间的进程间通信,可以通过网络进行数据传输。

 

你可能感兴趣的:(java,linux,windows)