进程3.0——进程状态与僵尸进程、孤儿进程
进程状态
一个进程的生命周期可以划分为一组状态,这些状态刻画了整个进程。进程状态即体现一个进程的生命状态
一般来说,进程有五种状态:创建状态:进程在创建时需要申请一个空白PCB,向其中填写控制和管理进程的信息,完成资源分配。如果创建工作无法完成,比如资源无法满足,就无法被调度运行,把此时进程所处状态称为创建状态
就绪状态:进程已经准备好,已分配到所需资源,只要分配到CPU就能够立即运行
执行状态:进程处于就绪状态被调度后,进程进入执行状态
阻塞状态:正在执行的进程由于某些事件(I/O请求,申请缓存区失败)而暂时无法运行,进程受到阻塞。在满足请求时进入就绪状态等待系统调用
终止状态:进程结束,或出现错误,或被系统终止,进入终止状态。无法再执行
这五种状态的转换如图:
上面所说的是一个概念性质的,而具体在Linux里,进程的状态是如何定义的?在Linux内核里,进程有时候也叫做任务,下面是状态在kernel源码里的定义:
/** The task state array is a strange "bitmap" of* reasons to sleep. Thus "running" is zero, and* you can test for combinations of others with* simple bit tests.*/
static const char * const task_state_array[] = {
"R (running)", /* 0 */
"S (sleeping)", /* 1 */
"D (disk sleep)", /* 2 */
"T (stopped)", /* 4 */
"t (tracing stop)", /* 8 */
"X (dead)", /* 16 */
"Z (zombie)", /* 32 */
};
这些状态的具体含义是:R运行状态(running): 并不意味着进程一定在运行中,它表明进程要么是在运行中要么在运行队列 里。
S睡眠状态(sleeping): 意味着进程在等待事件完成(这里的睡眠有时候也叫做可中断睡眠 (interruptible sleep))。
D磁盘休眠状态(Disk sleep)有时候也叫不可中断睡眠状态(uninterruptible sleep),在这个状态的 进程通常会等待IO的结束。
T停止状态(stopped): 可以通过发送 SIGSTOP 信号给进程来停止(T)进程。这个被暂停的进程可 以通过发送 SIGCONT 信号让进程继续运行。
X死亡状态(dead):这个状态只是一个返回状态,你不会在任务列表里看到这个状态。
Z僵死状态(zombie):下文具体了解
父进程与子进程
在学习接下来的内容之前,需要对父进程和子进程有一个清晰的认识
在Linux里,除了进程0(即PID=0的进程)以外的所有进程都是由其他进程使用系统调用fork创建的,这里调用fork创建新进程的进程即为父进程,而相对应的为其创建出的进程则为子进程,因而除了进程0以外的进程都只有一个父进程,但一个进程可以有多个子进程。
fork函数包含在unistd.h库中,其最主要的特点是,调用一次,返回两次,当父进程fork()创建子进程失败时,fork()返回-1,当父进程fork()创建子进程成功时,此时,父进程会返回子进程的pid,而子进程返回的是0。所以可以根据返回值的不同让父进程和子进程执行不同的代码
如上图所示,当fork()函数调用后,父进程中的变量pid赋值成子进程的pid(pid>0),所以父进程会执行else里的代码,打印出"This is the parent",而子进程的变量pid赋值成0,所以子进程执行if(pid == 0)里的代码,打印出"This is the child"
现在我们知道,在Linux中,正常情况下,子进程是通过父进程创建的,子进程再创建新的子进程。但是子进程的结束和父进程的运行是一个异步过程,即父进程永远无法预测子进程到底什么时候结束。当一个进程完成它的工作终止之后,它的父进程需要调用wait()或者waitpid()系统调用取得子进程的终止状态
知道了这些,我们再来了解两种特殊的进程
僵尸进程当一个子进程结束运行(一般是调用exit、运行时发生致命错误或收到终止信号所导致)时,子进程的退出状态(返回值)会回报给操作系统,系统则以SIGCHLD信号将子进程被结束的事件告知父进程,此时子进程的进程控制块(PCB)仍驻留在内存中。一般来说,收到SIGCHLD后,父进程会使用wait系统调用以获取子进程的退出状态,然后内核就可以从内存中释放已结束的子进程的PCB;而如若父进程没有这么做的话,子进程的PCB就会一直驻留在内存中,也即成为僵尸进程
简单来说,当进程退出但是父进程并没有调用wait或waitpid获取子进程的状态信息时就会产生僵尸进程
上文中提到的进程的僵死状态Z(zombie)就是僵尸进程对应的状态
我们可以写一个程序来查看一下僵尸进程:
#include#include#include
int main(){
printf("pid = %d\n",getpid());
pid_t pid = fork();
if(pid < 0){
printf("fork error\n");
return -1;
}else if(pid == 0){
//这段代码只有子进程能够运行到,因为在子进程中fork的返回值为0 printf("This is the child!pid = %d\n",getpid());
sleep(5);
exit(0); //退出进程 }else if(pid > 0){
//这段代码只有父进程能运行到 printf("This is the parent!pid = %d\n",getpid());
}
//当fork成功时下面的代码父子进程都会运行到 while(1){
printf("-------------pid = %d\n",getpid());
sleep(1);
}
return 0;
}
程序的运行结果:
ubuntu@VM-0-7-ubuntu:~/c_practice$ ./zombie
pid = 24816
This is the parent!pid = 24816
-------------pid = 24816
This is the child!pid = 24817
-------------pid = 24816
-------------pid = 24816
.....
在程序开始运行时立即查看进程:
(这里我分别运行了两次,分别使用ps -ef和ps -aux查看了进程状态,所以两次的进程PID是不同的)
ubuntu@VM-0-7-ubuntu:~$ ps -ef | grep -v grep | grep zombie
ubuntu 23797 15818 0 14:53 pts/0 00:00:00 ./zombie
ubuntu 23798 23797 0 14:53 pts/0 00:00:00 ./zombie
ubuntu@VM-0-7-ubuntu:~$ ps -aux | grep -v grep | grep zombie
ubuntu 24288 0.0 0.0 4352 648 pts/0 S+ 14:56 0:00 ./zombie
ubuntu 24289 0.0 0.0 4352 80 pts/0 S+ 14:56 0:00 ./zombie
在进程运行五秒后再次查看进程:
ubuntu@VM-0-7-ubuntu:~$ ps -ef | grep -v grep | grep zombie
ubuntu 23797 15818 0 14:53 pts/0 00:00:00 ./zombie
ubuntu 23798 23797 0 14:53 pts/0 00:00:00 [zombie]
ubuntu@VM-0-7-ubuntu:~$ ps -aux | grep -v grep | grep zombie
ubuntu 24288 0.0 0.0 4352 648 pts/0 S+ 14:56 0:00 ./zombie
ubuntu 24289 0.0 0.0 0 0 pts/0 Z+ 14:56 0:00 [zombie]
可以看出当进程运行五秒后,子进程状态变成Z,就是僵死状态,子进程就成了僵尸进程
其实,僵尸进程是有危害的。进程的退出状态必须被维持下去,因为它要告诉关心它的进程(父进程),你交给我的任务,我办的怎么样了。可父进程如果一直不读取,那子进程就一直处于Z状态。维护退出状态本身就是要用数据维护,也属于进程基本信息,所以保存在task_struct(PCB)中,换句话说,当一个进程一直处于Z状态,那么它的PCB也就一直都要被维护。因为PCB本身就是一个结构体会占用空间,僵尸进程也就会造成资源浪费,所以我们应该避免僵尸进程的产生
孤儿进程
孤儿进程则是指当一个父进程退出,而它的一个或多个子进程还在运行,那么那些子进程将成为孤儿进程。孤儿进程将被init进程(进程号为1)所收养,并由init进程对它们完成状态收集工作。
来段代码:
#include#include#include#include
int main(){
pid_t pid;
pid = fork();
if(pid < 0){
perror("fork error");
exit(1);
}
if(pid == 0){
printf("This is the child!\n");
printf("pid = %d,ppid = %d\n",getpid(),getppid());//父进程退出前的pid和ppid sleep(5);
printf("\npid = %d,ppid = %d\n",getpid(),getppid());//父进程退出后的pid和ppid }else{
printf("This is the father!\n");
sleep(1);
printf("father process is exited!\n");
}
return 0;
}
运行结果:
ubuntu@VM-0-7-ubuntu:~/c_practice$ ./orphan
This is the father!
This is the child!
pid = 2338,ppid = 2337
father process is exited!
ubuntu@VM-0-7-ubuntu:~/c_practice$
pid = 2338,ppid = 1
我们可以看到结果和我们预见的是一样的,孤儿进程在父进程退出后会被init进程领养,直到自己运行结束为止。这个程序很容易理解,先输出子进程的pid和父进程的pid,再然后子进程开始睡眠父进程退出,这时候子进程变成孤儿进程,再次输出时,该进程的父进程变为init
孤儿进程由于有init进程循环的wait()回收资源,因此并没有什么危害