【Linux】进程篇Ⅱ:进程开始、进程终止、进程等待、程序替换

文章目录

  • 上接 进程篇Ⅰ:进程信息、进程状态、环境变量、进程地址空间
  • 五、fork 函数,创建进程
      • 写时拷贝
  • 六、进程终止
      • 1. 退出码
      • 2. 如何终止程序
  • 七、进程等待
      • 1. 概念
      • 2. wait 函数
        • waitpid 函数
      • 3. 阻塞等待
  • 八、程序替换
      • 1. execl
      • 2. execv
      • 3. execlp
      • 4. execvp
      • 5. execle
      • 6. execvpe 、execve
  • 一个简易的 shell


上接 进程篇Ⅰ:进程信息、进程状态、环境变量、进程地址空间

链接在此


五、fork 函数,创建进程


#include

pid_t fork(void);

返回值:

  • 子进程 返回 0
  • 父进程 返回 子进程 id
  • 出错 返回 -1

进程调用 fork,当控制转移到内核中的 fork 代码后,内核做:

  • 分配新的内存块和内核数据结构给子进程
  • 将父进程部分数据结构内容拷贝至子进程
  • 添加子进程到系统进程列表当中
  • fork返回,开始调度器调度

fork 之前,父进程独立执行,
fork 之后,父子两个执行流分别执行 fork 后面的代码。

注意,fork之后,谁先执行完全由调度器决定。

写时拷贝

通常,父子代码共享,父子再不写入时,数据也是共享的,当任意一方试图写入,便以写时拷贝的方式各自一份副
本。具体见下图:

【Linux】进程篇Ⅱ:进程开始、进程终止、进程等待、程序替换_第1张图片

fork常规用法

  • 一个父进程希望复制自己,使父子进程同时执行不同的代码段。例如,父进程等待客户端请求,生成子进程来处理请求。
  • 一个进程要执行一个不同的程序。例如子进程从fork返回后,调用exec函数。

fork调用失败的原因

  • 系统中有太多的进程
  • 实际用户的进程数超过了限制

六、进程终止


如何理解进程退出?

OS内少了一个进程,OS就要释放进程对应的内核数据结构 + 代码和数据(如果有独立的)

进程结束情况分类:

a. 执行完了,正常退出

  • 结果正确
  • 结果不正确

b. 崩溃了,进程异常 (通过 信号 的方式,后面更新)

  • 崩溃的本质: 进程因为某些原因,导致进程收到了来自操作系统的信号 kill -9

1. 退出码

我们说,进程是有退出码的。

比如 main 函数中的 return x; 正常执行完了

  • 结果正确,退出码为 0,
  • 结果不正确, 1、2、3、4 则表示不同的原因(供用户进行进程退出健康状态的判定)

echo $? 可以 查看 最近执行的进程的 退出码

echo $?

2. 如何终止程序

正常终止有三种方式:

① main 函数 return。

  • 其他函数return,仅仅代表该函数返回
  • 进程执行,本质是main执行流执行!

void exit(int status) 函数退出

  • 头文件 #include
  • status 代表就是进程的退出码
  • 等价于 main return XXX
  • 会刷新缓冲区、关闭流等
  • 其实 exit 函数 也是封装调用的 _exit 函数

void _exit(int status) 函数退出

  • 头文件 #include
  • status 代表就是进程的退出码
  • 直接退出程序,不处理缓冲区等

【Linux】进程篇Ⅱ:进程开始、进程终止、进程等待、程序替换_第2张图片

由此我们可以推测出的就是:
	缓冲区,一定不在 OS 内,不然肯定都能刷新了,事实上并没有
这是因为用户层和 OS 之间,还有一个 C库。(后面更新)

异常退出

  • ctrl + C 信号终止(信号!!后面更新)

七、进程等待


1. 概念

进程等待 就是 通过系统调用,获取 子进程 退出码 或者 退出信号 的方式,顺便释放内存问题。

进程等待的作用:

  • 避免内存泄漏

  • 获取子进程执行的结果(如果必要)

    • 对于进程退出的结果查验,我们通过的还是上述提过的 信号 + 退出码 的方案。

等待,实际上就是 父进程 对 子进程 的等待

2. wait 函数

pid_t wait(int *status)

头文件: #include
返回值:等待成功则返回 子进程 的 PID

waitpid 函数

pid_t waitpid(pid_t pid, int *status, int options);

头文件 #include

返回值:

  • > 0,success(返回的是对应子进程的 pid)
  • ==-1,failed(一般不会失败,pid 传错了会导致失败)
    == 0,在选项设置了 WNOHANG 的情况下,发现没有已退出的子进程可收集

参数 pid

  • >0,表示等待指定的子进程
  • ==-1,表示等待任一个子进程,与 wait 等效

参数 status:是一个输出型参数

  • 我们会想得到,子进程的退出状态,即 信号 + 返回码
    • 如何用一个整数 返回两个整数…?实际上这里的 status 是类似位图作用的。信号和返回码都不超过一定值,用一个整数位存储足够啦!(见下文)
  • WIFEXITED(status):若为正常终止子进程返回的状态,则为真。(查看进程是否是正常退出)
  • WEXITSTATUS(status):若 WIFEXITED 非零,提取子进程退出码。(查看进程的退出码)

参数 options

  • 0,默认父进程进行 阻塞等待
  • WNOHANG,父进程进行 非阻塞轮询

使用举例:

int status = 0;
pid_t ret_id = waitpid(id, &status, WNOHANG);
if(ret_id < 0)
{
    printf("waitpid error!\n");
    exit(1);
}
else if(ret_id == 0)	// 子进程还没结束
{
    RunTask();
    sleep(1);
    continue;
}
else					// 子进程结束了
{
    if(WIFEXITED(status))	// 正常退出
    {
        printf("wait success, child exit code: %d\n", WEXITSTATUS(status));
    }
    else					// 异常退出
    {
        printf("wait success, child exit signal: %d\n", status & 0x7F);
    }
    break;
}

status 记录 信号 和 退出码 的方式:
00000000 00000000 00000000 00000000

  • 高 16 位不需要
  • 低 16 位中,次低的 8 位(黑体比特位),储存 退出状态
  • 最低 7 位(斜体比特位),储存 终止信号
  • 第8位,是 core dump 标志(后面更新,信号篇)

想要自己访问 信号 和 退出码,我们用如下方式:

// 退出码
(status>>8) & 0xFF;
// 终止信号
 status & 0x7F;

所以,

父进程 如何拿到 子进程 的退出码和终止信号的呢?

实际上,进程的 PCB 中,就有这两个成员值。

struct task_struct
{
	// ...
	int exit_code;
	int exit_signal;
	
	task_struct* parent;
};
  • 当子进程执行完毕时 main 函数的退出码,写入 PCB 的 exit_code 里
  • 如果出异常,OS 会把遇到异常时的信号编号写到 PCB 的 exit_signal 里
  • 进程退出之后,OS 会将进程 PCB 维护起来,通过系统调用接口 waitpid / wait,就可以让用户拿到这些数据。

3. 阻塞等待

父进程在 wait 的时候,如果子进程没有退出,父进程只能一直调用 waitpid 进行等待,这就叫 阻塞等待

  • 可以理解为父进程从 R 状态,开始等待,进入 S 状态。
  • 这个等待不在运行队列,可以理解为在一个只有它一个节点的等待队列里等待。
  • 等待的同时,子进程的 CPB 中找到并挂接到父进程,直到子进程结束,父进程再回到运行队列(R 状态)

如果我们不想 阻塞等待,即 不想在 waitpid 处卡住呢?

  • 非阻塞轮询(WNOHANG,waitpid 的最后一个参数)
  • 故,我们在日常这样情况的时候,说 这个程序 夯住了

八、程序替换


用 fork 创建子进程后执行的是和父进程相同的程序(但有可能执行不同的代码分支),子进程往往要调用一种 exec 函数执行另一个程序。当进程调用一种 exec 函数时,该进程的用户空间代码和数据完全被新程序替换,从新程序的启动例程开始执行。调用 exec 并不创建新进程,所以调用 exec 前后该进程的 pid 并未改变。

exec 这一系统接口,也被叫做 加载器

【Linux】进程篇Ⅱ:进程开始、进程终止、进程等待、程序替换_第3张图片

简单来说:

  • 程序替换 不产生新的进程

  • 程序替换 是 整体替换,不能局部替换

  • 程序替换 只会影响 调用进程,因为 进程具有独立性(写时拷贝)

    • 加载拥有新代码的新进程哦!这说明了,在代码区,也可以发生写时拷贝!!!

接下来是 exec 系列函数,
头文件是#include

1. execl

记忆:l 代表 list,把参数一个一个列表一样的传给函数。

int execl(const char *path, const char *arg, ...)

返回值:

  • 成功时,发生整体替换,也不会有返回值
  • 失败时,会继续调用后面的代码,此时才有返回值,返回也有意义

参数 path:

  • 带路径的可执行程序

参数包:

  • 在命令行怎么执行这个命令,就以空格为分割,一个一个的传给 execl 就可以了。最后以 NULL 结尾。

ps:对于该函数不用进行返回值判断,只要继续向后运行了,就一定是失败的

使用举例

execl("/bin/ls", "ls", "-a", "-l", NULL);

2. execv

记忆:v 代表 vector,数组作为参数。

int execv(const char *path, char *const argv[])

返回值:

  • 成功时,发生整体替换,也不会有返回值
  • 失败时,会继续调用后面的代码,此时才有返回值,返回也有意义

参数 path:

  • 带路径的可执行程序

参数 argv:

  • 设置一个 char* const argv[] 的指针数组, 在命令行怎么执行这个命令,就以空格为分割,放入数组。最后以 NULL 结尾。

使用举例

char *const myargv[] = { "ls", "-a", "-l", NULL };

execv("/bin/ls", myargv);

3. execlp

记忆:不带 p 的需要指定程序路径,而带 p 的只需要指定程序名即可,系统会自动在环境变量 PATH 中查找。

int execlp(const char *file, const char *arg, ...)

返回值:

  • 成功时,发生整体替换,也不会有返回值
  • 失败时,会继续调用后面的代码,此时才有返回值,返回也有意义

参数 file:

  • 可执行程序名,该程序必须要在环境变量 PATH 中可以被调用

参数包:

  • 在命令行怎么执行这个命令,就以空格为分割,一个一个的传给 execl 就可以了。最后以 NULL 结尾。

使用举例

execlp("ls", "ls", "-a", "-l", NULL);

这里两个一样的参数,不要省略!!!即使有时候省略了也能跑,不要这样写!!

4. execvp

记忆: p,直接给数组名; v,以数组方式传参。

int execvp(const char *file, char *const argv[])

返回值:

  • 成功时,发生整体替换,也不会有返回值
  • 失败时,会继续调用后面的代码,此时才有返回值,返回也有意义

参数 file:

  • 可执行程序名,该程序必须要在环境变量 PATH 中可以被调用

参数 argv:

  • 设置一个 char* const argv[] 的指针数组, 在命令行怎么执行这个命令,就以空格为分割,放入数组。最后以 NULL 结尾。

使用举例

char *const myargv[] = { "ls", "-a", "-l", NULL };

execvp("ls", myargv);

5. execle

记忆: p,直接给数组名; v,以数组方式传参。

int execvp(const char *path, const char *arg, ..., char *const envp[])

返回值:

  • 成功时,发生整体替换,也不会有返回值
  • 失败时,会继续调用后面的代码,此时才有返回值,返回也有意义

参数 path:

  • 带路径的可执行程序

参数包:

  • 在命令行怎么执行这个命令,就以空格为分割,一个一个的传给 execl 就可以了。最后以 NULL 结尾。

参数 envp:

  • 自定义环境变量,并且是 覆盖式传入

引申另一个函数

int putenv(char *string)

头文件:#include

作用:把 参数位置 的字符串作为 环境变量,加入 PATH

使用举例

// 【系统环境变量】
extern char** environ;
/* 自定义环境变量
char *cosnt myenv[] = {
	"MYENV=ThisIsValue",
	NULL
};*/
// 【把自定义变量加入系统环境变量】
putenv("MYENV=ThisIsValue");	// 此时就被添加进 environ 里了

// 要求既传 系统的 又传 自定义的
execle("./otherproc", "otherproc", NULL, environ);

环境变量具有全局性,可以被子进程继承下去。 这句话如何深刻理解?

  • bash 是最父的父进程!
  • 他调用子进程的时候,只需要通过 exec 函数,
  • 传入相应的环境列表,子进程就共享了 bash 的环境变量!!!

实际上,也正是 OS 调用 exec,调用的我们写的 main 函数,main 函数的参数 envp 也就是 OS 传给我们的。

6. execvpe 、execve

不多说喽

int execvpe (const char* file, char *const argv[], char *const envp[])

int execve (const char* path, char *const argv[], char *const envp[])

这些 exec 函数,实际上,只有 execve 是系统调用,其余的 6 个都是这个调用的封装


一个简易的 shell


链接在此



如果本文对你有些帮助,请给个赞或收藏,你的支持是对作者大大莫大的鼓励!!(✿◡‿◡) 欢迎评论留言~~


你可能感兴趣的:(Linux,linux,运维,服务器)