fork()
和 exec()
,还可以通过第3个系统调用 wait()
,来等待其创建的子进程执行完成。
系统调用 fork()
用于创建新进程。
#include
#include
#include
int main(int argc, char *argv[]) {
printf("hello Randy (pid:%d) \n", (int)getpid());
int rc = fork();
if (rc < 0) // fork failed; exit
{
fprintf(stderr, "fork failed!\n");
exit(1);
} else if (rc == 0) { // child (new process)
printf("hello, I am child (pid:%d)\n", (int)getpid());
} else { // parent goes down this path (main)
printf("hello, I am parent of %d (pid:%d)\n", rc, (int)getpid());
}
return 0;
}
运行结果:
hello Randy (pid:12242)
hello, I am parent of 12243 (pid:12242)
hello, I am child (pid:12243)
fork()
系统调用,创建了1个新的线程。新创建的线程与调用线程几乎完全一样,对操作系统来说,有2个完全一样的程序在运行,并从fork()
系统调用中返回;fork()
系统调用返回,好像自己调用了fork()
;子进程并不是完全拷贝父进程:虽然子进程有自己的地址空间(拥有自己的私有内存)、寄存器、程序计数器等,但是它从fork()
返回的值是不同的。
父进程获得的返回值是子进程的PID,子进程获得的返回值是0。
CPU调度程序(scheduler)决定了某个时刻哪个进程被执行,所以父进程和子进程谁先打印不确定。
有时候父进程需要等待子进程执行完毕,由wait()
系统调用完成
#include
#include
#include
#include
int main(int argc, char *argv[]) {
printf("hello Randy (pid:%d) \n", (int)getpid());
int rc = fork();
if (rc < 0) // fork failed; exit
{
fprintf(stderr, "fork failed!\n");
exit(1);
} else if (rc == 0) { // child (new process)
printf("hello, I am child (pid:%d)\n", (int)getpid());
} else { // parent goes down this path (main)
int wc = wait(NULL);
printf("hello, I am parent of %d (wc:%d) (pid:%d)\n", rc, wc, (int)getpid());
}
return 0;
}
执行结果:
hello Randy (pid:14580)
hello, I am child (pid:14581)
hello, I am parent of 14581 (wc:14581) (pid:14580)
父进程调用wait()
,延迟自己的执行,直到子进程执行完毕,wait()
才返回父进程。
exec() 有几种变体:execl()、execle()、execlp()、execv()、execvp()。
这个系统调用可以让子进程执行与父进程不同的程序。
#include
#include
#include
#include
#include
int main(int argc, char *argv[]) {
printf("hello Randy (pid:%d) \n", (int)getpid());
int rc = fork();
if (rc < 0) // fork failed; exit
{
fprintf(stderr, "fork failed!\n");
exit(1);
} else if (rc == 0) { // child (new process)
printf("hello, I am child (pid:%d)\n", (int)getpid());
char *myargs[3];
myargs[0] = strdup("wc"); // program: "wc"(word count)
myargs[1] = strdup("fork.cpp"); // program: "wc"(word count)
myargs[2] = NULL; // program: "wc"(word count)
execvp(myargs[0], myargs); // runs word count
printf("this shouldn't print out");
} else { // parent goes down this path (main)
int wc = wait(NULL);
printf("hello, I am parent of %d (wc:%d) (pid:%d)\n", rc, wc, (int)getpid());
}
return 0;
}
执行结果:
./randy
hello Randy (pid:15334)
hello, I am child (pid:15335)
27 117 916 fork.cpp
hello, I am parent of 15335 (wc:15335) (pid:15334)
子进程调用execvp()
运行字符计数程序wc。
exec()
给定可执行程序的名称(如wc
)及需要的参数后,会从可执行程序中加载代码和静态数据,并用它覆写自己的代码段(以及静态数据),堆、栈及其他内存空间也会被重新初始化。
操作系统执行该程序,将参数通过argv
传递给该进程。
它并没有创建新进程,而是直接将当前运行的程序替换为不同的运行程序(wc)。
子进程执行exec()之后,几乎就像源程序从未运行过一样,对exec() 的成功调用永远不会返回。
这种分离的fork()和exec()的做法在构建UNIX shell 的时候非常有用,这给了shell 在fork之后 exec 之前运行代码的机会,这些代码可以在运行新程序之前改变环境,从而让其他功能易于实现。
比如:
wc fork.cpp > count_fork_cpp.txt
shell 是一个用户程序(包括 tcsh、bash、zsh等)
shell从wait()返回并再次输出一个提示符,等待用户输入下一条命令。
上面的例子,wc的结果被重定向到count_fork_cpp.txt中。
重定向的工作原理,是基于操作系统管理文件描述符方式的假设。
UNIX系统从0开始寻找可以使用的文件描述符。
下面的例子中STDOUT_FILENO将成为第一个可用的文件描述符,因此在open()被调用时,得到赋值。然后子进程向标准输出文件描述符的写入(如printf()),都会被透明地转向新打开的文件,若不是屏幕。
#include
#include
#include
#include
#include
#include
int main(int argc, char *argv[]) {
int rc = fork();
if (rc < 0) // fork failed; exit
{
fprintf(stderr, "fork failed!\n");
exit(1);
} else if (rc == 0) { // child : redict standard output to a file
close(STDOUT_FILENO);
open("./redirect.output", O_CREAT | O_WRONLY | O_TRUNC, S_IRWXU);
// now exec "wc"
printf("hello, I am child (pid:%d)\n", (int)getpid());
char *myargs[3];
myargs[0] = strdup("wc"); // program: "wc"(word count)
myargs[1] = strdup("fork.cpp"); // program: "wc"(word count)
myargs[2] = NULL; // program: "wc"(word count)
execvp(myargs[0], myargs); // runs word count
printf("this shouldn't print out");
} else { // parent goes down this path (main)
// printf("hello, I am parent of %d (pid:%d)\n", rc, (int)getpid());
int wc = wait(NULL);
printf("hello, I am parent of %d (wc:%d) (pid:%d)\n", rc, wc, (int)getpid());
}
return 0;
}
执行结果:
Randy@Jeff:~$ ./randy
hello, I am parent of 17118 (wc:17118) (pid:17117)
Randy@Jeff:~$ cat redirect.output
46 227 1592 fork.cpp
UNIX管道也是用类似的方式实现的,用的是pipe()系统调用。
一个进程的输出被连接到一个内核管道(pipe)上(队列),另一个进程的输入也被连接到了同一个管道上。
因此前一个进程的输出无缝地作为后一个进程的输入,许多命令可以用这种方式串联在一个,共同完成某项任务。如从一个文件中查找某个词,并统计其出现的次数:
grep -o randy file | wc -l