LinuxC高级编程——进程
宗旨:技术的学习是有限的,分享的精神的无限的。
每个进程在内核中都有一个进程控制块( PCB)来维护进程相关的信息, Linux内核的 进程控制块是task_struct结构体。PCB包含的信息:
(1)进程id。系统中每个进程有唯一的id,在C语言中用pid_t类型表示,其实就是一个非负整 数。
(2)进程的状态,有运行、挂起、停止、僵尸等状态。
(3)进程切换时需要保存和恢复的一些CPU寄存器。 描述虚拟地址空间的信息。
(4)描述控制终端的信息。
(5)当前工作目录(Current Working Directory) 。
(6)umask掩码。
(7)文件描述符表,包含很多指向file结构体的指针。
(8)和信号相关的信息。 用户id和组id。
(9)控制终端、Session和进程组。
(10)进程可以使用的资源上限(Resource Limit)
一、环境变量
libc中定义的全局变量environ指向环境变量表, environ没有包含在任何头文件中,所以在使用时要用extern声明。
#include<stdio.h> int main(void) { extern char **environ; int i; for(i = 0; environ[i] != NULL; i++) { printf("%s\n", environ[i]); } return 0; }<span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);"> </span>
比较重要的环境变量:
PATH:可执行文件的搜索路径。
SHELL:当前SHELL,通常是/bin/bash。
TERM:当前终端类型。在图形界面下通常是xterm。
LANG:语言和locale,决定了字符编码以及时间、货币等信息的显示格式。
HOME:当前用户主目录的路径,很多程序需要在主目录下保存配置文件,使得每个用户在运行该程 序时都有自己的一套配置。
二、fork()系统调用
fork的作用是根据一个现有的进程复制出一个新 进程,原来的进程称为父进程(Parent Process) ,新进程称为子进程(Child Process)。系统中 同时运行着很多进程,这些进程都是从最初只有一个进程开始一个一个复制出来的。在Shell下输入 命令可以运行一个程序,是因为Shell进程在读取用户输入的命令之后会调用fork复制出一个新 的Shell进程,然后新的Shell进程调用exec执行新的程序。
例如:在Shell提示符下输入命令ls,首先fork创建子进程,这时父进程仍在执行/bin/bash程序,然后子进程调用exec执行新的程序/bin/ls
除了子进程和父进程的进程ID不同,其他资源一模一样。
——创建子进程
(1)函数原型:
#include<sys/types.h> #include <unistd.h> pid_t fork(void);
(2)参数——无
(3)返回值
fork调用失败则返回-1,返回进程pid,pid大于0:父进程;pid等于0:子进程。执行顺序不定,根据内核的调度算法。
特点:调用一次,返回两次。
setfollow-fork-mode child命令设置gdb在fork之后跟踪子进程( set follow-fork-mode
parent则是跟踪父进程),然后用run命令,看到的现象是父进程一直在运行
#include<sys/types.h> #include<unistd.h> #include<stdio.h> #include<stdlib.h> int main(void) { pid_t pid; char *message; int n; pid = fork(); if (pid < 0) { perror("fork failed"); exit(1); } if (pid == 0) { message = "This is the child\n"; n = 6; } else { message = "This is the parent\n"; n = 3; } for(; n > 0; n--) { printf(message); sleep(1); } return 0; }
三、exec函数族
用fork()创建子进程后执行的是个父进程一样的程序,子进程往往要调用一种exec函数以执行另一个程序。exec不创建新进程,所以进程id不变。
1、exec函数族详解
(1)、函数原型
#include<unistd.h> int execl(const char *path, const char *arg, ...); int execlp(const char *file, const char *arg, ...); int execle(const char *path, const char *arg, ..., char *const envp[]); int execv(const char *path, char *const argv[]); int execvp(const char *file, char *const argv[]); int execve(const char *path, char *const argv[], char *const envp[]);
(2)、参数——可变参数
(3)、返回值
这些函数如果调用成功则加载新的程序从启动代码开始执行,不再返回,如果调用出错则返回-1,所以exec函数只有出错的返回值而没有成功的返回值。
2、记忆这些函数的规则
(1)不带字母p(表示path)的exec函数第一个参数必须是程序的相对路径或绝对路径。
(2)对于带字母p的函数:如果参数中包含/,则将其视为路径名。否则视为不带路径的程序名,在PATH环境变量的目录列表中搜索这个程序。
(3)带有字母l(表示list)的exec函数要求将新程序的每个命令行参数都当作一个参数传给它,命令行参数的个数是可变的,因此函数原型中有...,...中的最后一个可变参数应该是NULL, 起sentinel的作用。
(4)对于带有字母v(表示vector)的函数,则应该先构造一个指向各参数的指针数组,然后将该数组的首地址当作参数传给它,数组中的最后一个指针也应该NULL,就像main函数的argv参数或者环境变量表一样。
(5)对于以e(表示environment)结尾的exec函数,可以把一份新的环境变量表传给它,其他exec函数 仍使用当前的环境变量表执行新程序。
只有execve是真正的系统调用,其它五个函数最终都调用execve。通过man可以验证,man 2 execve,其余的都是man 3。
char*const ps_argv[] = {"ps", "-o", "pid,ppid,pgrp,session,tpgid,comm", NULL}; char*const ps_envp[] = {"PATH=/bin:/usr/bin", "TERM=console", NULL}; execl("/bin/ps", "ps", "-o", "pid,ppid,pgrp,session,tpgid,comm", NULL); execv("/bin/ps", ps_argv); execle("/bin/ps", "ps", "-o", "pid,ppid,pgrp,session,tpgid,comm", NULL, ps_envp); execve("/bin/ps", ps_argv, ps_envp); execlp("ps", "ps", "-o", "pid,ppid,pgrp,session,tpgid,comm", NULL); execvp("ps", ps_argv);<span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);"> </span>
四、wait和waitpid函数
僵尸( Zombie)进程:一个进程已经终止,但是它的父进程尚未调用wait或waitpid对它进行清理,这时的进程状态称为僵尸进程。
(1)函数原型
#include<sys/types.h> #include <sys/wait.h> pid_t wait(int *status); pid_t waitpid(pid_t pid, int *status, int options);
(2)参数
(3)返回值
若调用成功则返回清理掉的子进程id,若调用出错则返回-1。父进程调用wait或waitpid时可能会: 阻塞(如果它的所有子进程都还在运行)。 带子进程的终止信息立即返回(如果一个子进程已终止,正等待父进程读取其终止信息)。 出错立即返回(如果它没有任何子进程)。
区别:如果父进程的所有子进程都还在运行,调用wait将使父进程阻塞,而调用waitpid时如果 在options参数中指定WNOHANG可以使父进程不阻塞而立即返回0。wait等待第一个终止的子进程,而waitpid可以通过pid参数指定等待哪一个子进程。
调用:pid = wait(NULL); // 如果成功,wait会返回被收集的子进程的进程ID,如果调用进程没有子进程,调用就会失败,此时wait返回-1,同时errno被置为ECHILD。
#include<sys/types.h> #include<sys/wait.h> #include<unistd.h> #include<stdio.h> #include<stdlib.h> int main(void) { pid_t pid; pid = fork(); if (pid < 0) { perror("fork failed"); exit(1); } if (pid == 0) { int i; for (i = 3; i > 0; i--) { printf("This is the child\n"); sleep(1); } exit(3); } else { int stat_val; waitpid(pid, &stat_val, 0); if (WIFEXITED(stat_val)) { printf("Child exited with code%d\n", WEXITSTATUS(stat_val)); } else if (WIFSIGNALED(stat_val)) { printf("Child terminated abnormally,signal %d\n", WTERMSIG(stat_val)); } } return 0; }