程序员必备知识——fork和exec函数详解


        在学习UNIX编程时,必须要学习的一个函数为fork函数。fork函数也为面试中必定要问的一个问题,尤其是在BAT的面试中,fork函数相关问题更为面试笔试必考知识点。究其原因:该函数为UNIX中派生新进程的唯一方法。不熟悉fork,就不可能熟悉多线程编程。因此掌握好fork函数,为程序员和准程序员必备技能。

1 fork函数原型

#include
pid_t fork(void);
返回:在子进程中返回0,在父进程中返回子进程的id,出错返回-1.
 
  

        如果之前从未接触过这个函数,那么理解fork函数的最困难之处在于调用它一次,它却返回两次它在调用进程(成为父进程)中返回一次,返回值为新派生进程(成为子进程)的进程ID号;在子进程中又返回一次,返回值为0.因此,返回值本身告知当前进程是子进程还是父进程。
        fork在子进程中返回0而不是父进程的ID的原因在于:任何子进程只有一个父进程,而且子进程总是可以通过调用getppid取得父进程的ID。相反,父进程可以有许多子进程,而且无法获得各个子进程的进程ID。如果父进程想要跟踪所有子进程的ID,那么它必须记录每次调用fork的返回值。

        父进程中调用fork之前打开所有的描述字在fork返回之后由子进程分享。我们将看到网络服务器便利用了这个特性:父进程调用accept之后调用fork。所接受的已连接的套接口随后就在父进程与子进程之间分享。通常情况下,子进程接着读和写这个套接口,父进程则关闭这个已连接套接口。

2 fork用法

        fork有两个典型的用法:
        1 一个进程创建一个自身的拷贝,这样每个拷贝都可以在另一个拷贝执行其他任务的同时处理各自的某个操作。这是网络服务器的典型用法。
        2 一个进程想要执行另一个程序。既然创建新进程的唯一方法为调用fork,该进程于是首先调用fork创建一个自身的拷贝,然后其中一个拷贝(通常为子进程)调用exec把自身替换成新的程序。这是诸如shell之类程序的典型用法。

3 exec函数

        存放在硬盘上的可执行文件能够被UNIX执行的唯一方法是:由一个现有进程调用六个exec函数中的某一个。exec把当前进程映像替换成新的进程文件,而且该新程序通常从main函数处开始执行。进程ID并不改变。我们称调用exec的进程为调用进程,称新执行的程序为新程序。

        六个exec函数的区别在于:(a)待执行的程序文件是由文件名还是由路径名指定;(b)新程序的参数是一一列出还是由一个指针数组来引用;(c)把调用进程的环境传递给新程序还是给新程序指定新的环境。

---------------------------------------------------------------------------
|#include
|int execl(const char *pathname, const char *arg0,.../* (char *)0 */);
|int execv(const char *pathname, char *const argv[]);
|int execle(const char *pathname, const char *arg0,.../* (char *)0,char *const envp[] */);
|int execve(const char *pathname, char *const argv[], char *const envp[]);
|int execlp(const char *filename, const char *arg0,.../* (char *)0 */);
|int execvp(const char *filename, char *const argv[]);
| 所有六个函数返回:-1——失败,无返回——成功
----------------------------------------------------------------------------

         这些函数只在出错时才返回到调用者。否则,控制将传递给新程序的起始点,通常就是main函数。
这六个函数之间的关系如下图所示。一般来说,只有 execve 是内核中的系统调用,其他五个都是调用 execve 的库函数。
程序员必备知识——fork和exec函数详解_第1张图片

         注意这六个函数的下列区别
        1 顶行三个函数把新程序的每个参数字符串指定成exec的一个独立参数,并以一个空指针结束可变数量的这些参数。底行三个函数都有一个作为exec参数的argv数组,其中含有指向新程序各个参数字符串的所有指针。既然没有指定参数字符串的数目,这个argv数组必须含有一个用于指定其末尾的空指针。
        2 左列两个函数指定一个filename参数。exec将使用当前的PATH环境变量把该文件名参数转换为一个路径名。然而如果这两个函数的filename参数中不论何处含有一个斜杠(/),PAHT变量就不再使用。右两列四个函数指定一个全限定的pathname参数。
        3 左两列四个函数不显式指定一个环境指针。相反,他们使用外部变量environ的当前值来构造一个传递给新程序的环境清单。右列两个函数显式指定一个环境清单,其envp指针数组必须以一个空指针结束。

你可能感兴趣的:(Linux)