fork函数详解

首先了解什么是fork?

 

fork函数详解_第1张图片

一个进程,包括代码、数据和分配给进程的资源。fork()函数通过系统调用创建一个与原来进程几乎完全相同的进程,也就是两个进程可以做完全相同的事,但如果初始参数或者传入的变量不同,两个进程也可以做不同的事。
一个进程调用fork()函数后,系统先给新的进程分配资源,例如存储数据和代码的空间。然后把原来的进程的所有值都复制到新的新进程中,只有少数值与原来的进程的值不同。

上面的话通俗理解就是: fork是复制进程的函数,程序一开始就会产生一个进程,当这个进程(代码)执行到fork()时,fork就会复制一份原来的进程即就是创建一个新进程,我们称子进程,而原来的进程我们称为父进程,此时父子进程是共存的,他们一起向下执行代码。

注意的一点:就是调用fork函数之后,一定是两个进程同时执行fork函数之后的代码,而之前的代码以及由父进程执行完毕。

fork的特点:

首先明白linux中:

PID表示的进程号,是唯一的,一个PID只标识一个进程

PCB:进程控制块,进程控制块是用一个结构体struct task_struct来实现

fork函数详解_第2张图片

fork的返回值问题:

在父进程中,fork返回新创建子进程的进程ID;

在子进程中,fork返回0;

如果出现错误,fork返回一个负值;  

getppid():得到一个进程的父进程的PID;

getpid():得到当前进程的PID;

*注意:在fork函数执行完毕后,如果创建新进程成功,则出现两个进程,一个是子进程,一个是父进程。在子进程中,fork函数返回0,在父进程中,fork返回新创建子进程的进程ID。我们可以通过fork返回的值来判断当前进程是子进程还是父进程。

fork是把已有的进程复制一份,当然把PCB也复制了一份,然后申请一个PID

子进程的PID=父进程的PID+1;

fork函数详解_第3张图片

下面我们举一个简单的例子:

第一次看的时候非常的奇怪,一个函数返回两次?是的,在调用fork后,fork函数后面的所有代码会执行两遍。

#include 
#include 
#include 
/**
 *最基础的fork例子
 **/
int main(int argc, char const *argv[])
{
    pid_t pid;
    //判断1
    if ((pid=fork()) < 0)
    {
        perror("fork error");
    }
    //判断2
    else if (pid == 0)//子进程
    {
         printf("child getpid()=%d\n", getpid());
    }
    //判断3
    else if(pid > 0)//父进程
    {
        printf("parent getpid()=%d\n", getpid());
    }

    return 0;
}

结果如下:

parent getpid()=13725
child getpid()=13726

两个判断的代码都执行了,这是非常不可思议的,但fork函数确实实现了这样的功能。也就是在fork函数后面的代码都会执行2遍。 这就是为什么两个判断都会被执行的原因。
现在来梳理一下成功fork的执行流程
第一步: pid=fork(),如果成功那么pid就有一个非0正值。否则返回-1。
第二步: 因为pid>0,所以进入判断3。这是在父进程。
第三步: 父进程的代码执行完了,程序又会把fork后面的函数再执行一遍,此时pid的值变为0,所以进入判断2。

*注意:这里的pid_t类似一个类型,就像int型一样,int型定义的变量都是整型的,pid_t定义的类型都是进程号类型。这个语句的意思是定义了一个pid_t类型的变量pid,fork()函数返回一个进程号,这个进程号赋给了pid。pid_t在头文件types.h(sys/types.h)中定义

pid_t就是一个short类型变量,实际表示的是内核中的进程表的索引

试试判断下面代码:

  #include
  #include
  #include
   
   int main()
   {
      pid_t fpid;//fpid表示fork函数返回的值
      int count=0;
      fpid=fork();
      if(fpid<0)
          printf("error in fork!");
      else if(fpid==0)
      {
          printf("我是子进程,id:%d\n",getpid());
          count++;
      }
      else
      {
          printf("我是父进程,id:%d\n",getpid());
          count++;
      }
      printf("统计结果是:%d\n",count);
      exit(0);
  }

fork函数详解_第4张图片

 父子进程的调用流程:

下面我们讲解一下fork调用的细节

int main(){
	fork();//fork1
	fork();//fork2
	printf("love\n");
	return 0;
}

上述代码打印了4次love,创建了4个进程(1一个父进程,3个子进程)

fork函数详解_第5张图片

假设我们的main进程pid是1001,注意看左边的1,2,4进程其实都是main进程1001。进程3,6是同一个进程1002。所有一共有1001,1002,1003,1004四个进程。也就是只要数叶子节点就行了。其中1个是main进程,其它3个是子进程。有多少个进程就输出多少次hello字符串。也就是只有4,5,6,7执行了printf。

如果明白了上面的过程下面我给出四个例子和解释,可以自己先试着判断

eg1:

int main()
{
    int n=2;
    for(;i

fork函数详解_第6张图片

eg2:

int main()
{
    int n=2;
    for(;i

fork函数详解_第7张图片

eg3:

int main()
{
	fork()||fork();
	printf("A\n");
	exit(0);
	1)在父进程中,fork返回新创建子进程的进程ID;大于0的
    2)在子进程中,fork返回0;
    3)如果出现错误,fork返回一个负值;
}

结果打印3个A,共创建3个进程

fork()给子进程返回一个零值,而给父进程返回一个非零值

在main这个主进程中,首先执行 fork() || fork(), 左边的fork()返回一个非零值,根据||的短路原则,前面的表达式为真时,后面的表达式不执行,故包含main的这个主进程创建了一个子进程,

由于子进程会复制父进程,而且子进程会根据其返回值继续执行,就是说,在子进程中, fork() ||fork()这条语句 左边表达式的返回值是0, 所以||右边的表达式要执行,这时在子进程中又创建了一个进程,

即main进程->子进程->子进程,一共创建了3个进程。

fork函数详解_第8张图片  

eg4:

int main()
{
	fork()&&fork();
	printf("A\n");
	exit(0);
}

结果输出3个A,创建3个进程

fork函数详解_第9张图片

注意小tips:

父子进程相同:

  • 刚刚fork后,data段,text段,堆,栈,环境变量,全局变量,宿主目录位置,进程工作目录,信号处理方式

父子进程不同:

  • 进程id,返回值,各自父进程,进程创建时间,闹钟,未决信号

父子进程共享:

  • 文件描述符
  • mmap映射区
  • 读时共享,写时复制-----------------全局变量

对fork复制进程做了一个优化----写时拷贝技术。写时拷贝指的是两个任务可以同时自由读取内存,但任意一个任务试图对内存进行修改时,内存就会复制一份提供给修改方单独使用,以免影响到其他的任务使用。

fork函数详解_第10张图片

fork函数详解_第11张图片

特别的,fork之后父进程先执行还是子进程先执行不确定,取决于内核所使用的调度算法。

注意父进程多次fork后不加以控制,我们会发现打印结果不唯一,无序。是因为对于操作系统将代码交给cpu执行的时候产生的子进程相当于同时产生的,并发运行,他们站在同一起跑线上去争夺cpu,谁抢到了谁就去运行打印数据,这是与系统调度有关,想让他们有序,可以加入sleep函数让其休眠一下

看到这里相信对与fork就有了基本的了解,点赞收藏是对博主最大的支持!有任何问题欢迎评论区留言讨论! 

fork函数详解_第12张图片

往期回顾:Linux常用命令及操作演示(细节满满)

你可能感兴趣的:(Linux,linux,c语言,运维,开发语言,后端)