在Linux
内核中,无时无刻不维护着进程,从进程的创建到进程销毁,每一个环境都有着复杂的细节。本篇介绍Linux
内核如何创建进程,深入理解 fork
函数以及子进程的创建,对理解多进程开发也至关重要。
首先来看下fork() 函数,其作用是创建子进程。头文件与函数原型如下
#include
// 参数 : void
// 返回值: pid_t 创建的子进程ID
pid_t fork(void);
返回值:fork() 返回值会返回两次,分别在父进程和子进程中返回。
fork
的返回值来区分父进程与子进程。-1
,表示创建子进程失败,并设置 errorno
。如下面两种情况导致创建失败:errno
的值被设置为EAGAIN
errno
的值被设置为 ENOMEM
下面创建一个子进程,来说明父进程与子进程的执行顺序。
#include
#include
int main(){
// 创建进程
pid_t pid = fork();
// 判断当前进程是父进程 还是子进程
if (pid > 0){
// 进程号 > 0,即为子进程的进程号,当前为父进程
printf("pid: %d\n", pid);
printf("I am parent process, pid: %d, ppid: %d\n", getpid(), getppid());
}
else if (pid == 0){
// 进程号 == 0,表示当前为子进程
printf("I am child process, pid: %d, ppid: %d\n", getpid(), getppid());
}
for (int i = 0; i < 5; i++){
printf("pid: %d, i : %d\n", getpid(), i);
sleep(1);
}
return 0;
}
编译执行,可以看到,子进程创建成功,两个进程同时执行,父进程ID 为412552,子进程ID为512553,由于sleep() 函数,使得函数阻塞,所以父进程与子进程交替执行。
通过 fork函数创建进程后,可以通过返回值判断是父进程还是子进程。对于父进程与子进程如何执行,下面介绍fork函数调用后,父子进程如何执行,在进程中虚拟地址空间中如何体现。
首先,我们先看一下上述示例的执行顺序,父进程执行执行fork后,返回子进程ID,pid
大于0,所以输出 if(pid>0)
的内容。
子进程在创建成功后,在子进程中返回 0,从当前位置开始执行,所以 pid=0
会输出 else
语句。
对于虚拟空间地址来说,子进程会拷贝父进程的虚拟地址空间。所以,fork后子进程的用户区与父进程的用户区相同,也会拷贝内核区内容,仅仅是进程的 pid不同。
对于父进程中的栈空间的变量,也会原封不动的拷贝至子进程的栈空间中。但这两个变量互不影响,父进程改变变量不会影响子进程变量。看如下程序展示父子进程中栈空间变量的使用。
#include
#include
int main(){
// 创建进程
pid_t pid = fork();
// 局部变量
int num = 10;
// 判断当前进程是父进程 还是子进程
if (pid > 0){
// 进程号 > 0,即为子进程的进程号,当前为父进程
printf("I am parent process, pid: %d, ppid: %d\n", getpid(), getppid());
printf("parent process num : %d\n", num);
num += 10;
printf("parent process num + 10 : %d\n", num);
}
else if (pid == 0){
// 进程号 == 0,表示当前为子进程
printf("I am child process, pid: %d, ppid: %d\n", getpid(), getppid());
printf("child process num : %d\n", num);
num += 100;
printf("child process num + 100 : %d\n", num);
}
return 0;
}
编译执行,可以看到,父进程中的局部变量num
与子进程的局部变量互不影响。
实际上,准确的来说,Linux的fork
是通过 写时拷贝 (copy-on-write)实现。写时拷贝是一种可以推迟甚至不用避免拷贝的技术。更具体来讲,在执行fork语句后,内核并不复制父进程的整个地址空间,而是父子进程共享父进程的地址空间(此时父子进程对于地址空间是只读指令),在父进程或者子进程进行写指令时,子进程才会复制一份地址空间,从而使得父子进程拥有自己的虚拟地址空间,在自己的地址空间进行写操作。也就是说,资源的复制是在需要写入时才会进行,在此之前,只会以只读方式进行共享。
对于文件资源,fork之后的父子进程共享文件,fork之后的父进程与子进程的文件描述符表指向相同的文件表,引用计数增加,共享文件偏移指针。
在进行进程间通信时,不能使用变量共享,因为在父子进程之间的变量一旦发生变化,则子进程进行拷贝,成为父进程的副本,彼此之间互不影响。
fork函数就介绍到这里了,本篇介绍了创建子进程的过程,理解父子进程间虚拟地址空间的共享与复制。在多线程开发中,可以轻松分析父子进程的执行顺序与内存共享。
点关注,不迷路。一键三连是对我最大的支持,欢迎关注编程小镇,每天涨一点新姿势。