怎样避免产生僵尸进程

1.什么是僵尸进程?
In UNIX System terminology, a process that has terminated,but whose

parent has not yet waited for it, is called a zombie.

在UNIX 系统中,一个进程结束了,但是他的父进程没有等待(调用wait / waitpid)他,

那么他将变成一个僵尸进程.

但是如果该进程的父进程已经先结束了,那么该进程就不会变成僵尸进程,

因为每个进程结束的时候,系统都会扫描当前系统中所运行的所有进程,

看有没有哪个进程是刚刚结束的这个进程的子进程,如果是的话,就由Init

来接管他,成为他的父进程,从而保证每个进程都会有一个父进程.

而Init进程会自动wait 其子进程,因此被Init接管的所有进程都不会变成僵尸进程.

2. 僵尸进程的危害
由于子进程的结束和父进程的运行是一个异步过程,即父进程永远无法预测子进程

到底什么时候结束. 那么不会因为父进程太忙来不及waid子进程,或者说不知道

子进程什么时候结束,而丢失子进程结束时的状态信息呢?

不会.因为UNIX提供了一种机制可以保证 只要父进程想知道子进程结束时的状态信息,

就可以得到. 这种机制就是:

在每个进程退出的时候,内核释放该进程所有的资源,包括打开的文件,占用的内存等.

但是仍然为其保留一定的信息(包括进程号the process ID,退出状态the termination

status of the process,运行时间the amount of CPU time taken by the process等),

直到父进程通过wait / waitpid来取时才释放.

但这样就导致了问题,如果你进程不调用wait / waitpid的话, 那么保留的那段信息就不会

释放,其进程号就会一定被占用,但是系统所能使用的进程号是有限的,如果大量的产生

僵死进程,将因为没有可用的进程号而导致系统不能产生新的进程.

此即为僵尸进程的危害,应当避免.

3.僵尸进程的避免
1、父进程通过wait和waitpid等函数等待子进程结束,这会导致父进程挂起

2. 如果父进程很忙,那么可以用signal函数为SIGCHLD安装handler,因为子进程结束后,

父进程会收到该信号,可以在handler中调用wait回收


3. 如果父进程不关心子进程什么时候结束,那么可以用signal(SIGCHLD, SIG_IGN)

通知内核,自己对子进程的结束不感兴趣,那么子进程结束后,内核会回收,

并不再给父进程发送信号

4. 还有一些技巧,就是fork两次,父进程fork一个子进程,然后继续工作,子进程fork一

个孙进程后退出,那么孙进程被init接管,孙进程结束后,init会回收。不过子进程的回收

还要自己做。 下面就是Stevens给的采用两次folk避免僵尸进程的示例.
Example
Recall our discussion in Section 8.5 about zombie processes. If we want to write a process so that it forks a child but we don't want to wait for the child to complete and we don't want the child to become a zombie until we terminate, the trick is to call fork twice. The program in Figure 8.8 does this.

We call sleep in the second child to ensure that the first child terminates before printing the parent process ID. After a fork, either the parent or the child can continue executing; we never know which will resume execution first. If we didn't put the second child to sleep, and if it resumed execution after the fork before its parent, the parent process ID that it printed would be that of its parent, not process ID 1.[code]
#include "apue.h"
#include <sys/wait.h>

int
main(void)
...{
     pid_t    pid;

    if ((pid = fork()) < 0) ...{
         err_sys("fork error");
     } else if (pid == 0) ...{     /**//* first child */
        if ((pid = fork()) < 0)
             err_sys("fork error");
        else if (pid > 0)
             exit(0);    /**//* parent from second fork == first child */
        /**//*
          * We're the second child; our parent becomes init as soon
          * as our real parent calls exit() in the statement above.
          * Here's where we'd continue executing, knowing that when
          * we're done, init will reap our status.
         */
         sleep(2);
         printf("second child, parent pid = %d ", getppid());
         exit(0);
     }
   
    if (waitpid(pid, NULL, 0) != pid)  /**//* wait for first child */
         err_sys("waitpid error");

    /**//*
      * We're the parent (the original process); we continue executing,
      * knowing that we're not the parent of the second child.
     */
     exit(0);
}

[/code]

duanjigang



根据理论我们做个测试的例子。
子进程要执行的程序test_prog[code]
//test.c
#include <stdio.h>
int main()
{
        int i = 0;
        for (i = 0 ; i < 10; i++)
        {
                printf ("child time %d\n", i+1);
                sleep (1);
        }
        return 0;
}
[/code]父进程father的代码father.c[code]
#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>
int main()
{
        int pid = fork ();
        if (pid == 0)
        {
                system ("./test_prog");
                _exit (0);
        }else
        {
                int i = 0;
                /*
                                int status = 0;
                while (!waitpid(pid, &status, WNOHANG))
                {
                        printf ("father waiting%d\n", ++i);
                        sleep (1);
                }*/
                while (1)
                {
                        printf ("father waiting over%d\n", ++i);
                        sleep (1);
                }
                return 0;
        }

}
[/code]执行./father,当子进程退出后,由于父进程没有对它的退出进行关注,会出现僵尸进程[code]
20786 pts/0    00:00:00 father
20787 pts/0    00:00:00 father <defunct>
[/code]

duanjigang

如果你把上面father.c中的waitpid的注释打开,会出现如下现象。
子进程退出的一瞬间,父进程在sleep还未调用waitpid,这时会出现一个僵尸进程,但是马上这个僵尸进程就消失了。因为waitpid调用,子进程的资源的到释放了。
这时ps就只能看到一个正常的father进程了

duanjigang

另外你还可以让子进程多跑一会儿,父进程立马退出,就能看到子进程的父进程pid为1了,也就是被init进程接管了的现象,这些都能一一验证。
或者两次fork(),也就能看到对应的解释了。

你可能感兴趣的:(C++,c,unix,C#)