【linux基础】fork与vfork

fork

一个现有进程可以调用fork创建一个新进程。
返回值:子进程中返回0,父进程返回子进程ID,出错返回零。

子进程是父进程的副本
一个现有进程可以调用fork函数创建一个新进程。由fork创建的新进程被称为子进程(child process)。fork函数被调用一次但返回两次。两次返回的唯一区别是子进程中返回0值而 父进程中返回子进程ID。
子进程是 父进程的副本,它将获得父进程数据空间、堆、栈等资源的副本。注意,子进程持有的是上述 存储空间的"副本",这意味着父子进程间不共享这些存储空间。
UNIX将复制 父进程的 地址空间内容给子进程,因此,子进程有了独立的地址空间。在不同的UNIX (Like)系统下,我们无法确定fork之后是子进程先运行还是父进程先运行,这依赖于系统的实现。所以在移植代码的时候我们不应该对此作出任何的假设。

为什么fork会返回两次?
由于在复制时复制了 父进程的 堆栈段,所以两个进程都停留在fork函数中,等待返回。因此fork函数会返回两次,一次是在 父进程中返回,另一次是在子进程中返回,这两次的返回值是不一样的。过程如下图。

在fork函数执行完毕后,如果创建新进程成功,则出现两个进程,一个是子进程,一个是父进程。在子进程中,fork函数返回0,在父进程中,fork返回新创建子进程的进程ID。我们可以通过fork返回的值来判断当前进程是子进程还是父进程。
父进程的fork函数返回的值指向子进程的进程id, 因为子进程没有子进程,所以其fork函数返回的值为0.

调用fork之后,数据、 堆栈有两份,代码仍然为一份但是这个 代码段成为两个进程的共享代码段都从fork函数中返回,箭头表示各自的执行处。当父子进程有一个想要修改数据或者堆栈时,两个进程真正分裂。

fork的一个特性是父进程的所有打开文件描述符都被复制到子进程中。父子进程的每个相同的打开描述符共享一个文件表项。

在fork之后处理的文件描述符有两种常见的情况:
1.父进程等待子进程完成。在这种情况下,父进程无需对其描述符做任何处理。当子进程终止后,子进程对文件偏移量的修改已执行的更新。
2. 父子进程各自执行不同的程序段。这种情况下,在fork之后,父字进程各自关闭他们不需要使用的文件描述符,这样就不会干扰对方使件描用文件述符。 这种方法在网络服务进程中经常使用。

父子进程之间的区别:

  1. fork的返回值
  2. 进程ID不同
  3. 具有不同的父进程ID
  4. 子进程的tms_utime、 tms_stime、 tms_cutime及tms_ustime均被设置为0
  5. 父进程设置的文件锁不会被子进程继承
  6. 子进程的未处理闹钟被清除
  7. 子进程的未处理信号集被设置为空集

fork调用失败的原因:

  1. 系统中有太多的进程
  2. 实际用户的进程数超过了限制

vfork函数

vfork用于创建一个新进程,而该新进程的目的是exec一个新程序。 vfork与fork都创建一个子进程,但它不将父进程的地址空间复制到子进程中,因为子进程会立即调用exec,于是不会存访问该地址空间。相反,在子进程调用exec或exit之前,它在父进程的空间中运行,也就是说会更改父进程的数据段、栈和堆。vfork和fork另一区别在于: vfork保证子进程先运行,在它调用exec或( exit)之后父进程才可能被调度运行。

在UNIX中将创建进程分成了两部分:

fork():在新的地址空间中创建进程,读入可执行文件
exec():开始执行

fork():通过拷贝当前进程创建一个子进程,子进程和父进程的区别仅仅在于PID(每个进程唯一)和PPID(父进程的进程号)和某些资源统计量
exec():函数负责读取可执行文件并将其载入地址空间开始运行

Linux的fork()使用写时拷贝(COW,copy-on-write)页来实现。内核并不复制整个进程地址空间,而是让父进程和子进程共享一个地址空间,而只要页面被共享,它们就不能被修改。
无论父进程和子进程何时试图写一个共享的页面,就产生一个错误,这时内核就把这个页复制到一个新的页面中并标记为可写。原来的页面仍然是写保护的:当其它进程试图写入时,内核检查写进程是否是这个页面的唯一属主;如果是,它把这个页面标记为对这个进程是可写的

fork()的实际开销就是复制父进程的页表以及给子进程创建唯一的进程描述符

页表的机制相信大家都比较熟络了吧,这是内核管理内存的一种方法

vfork()除了不拷贝父进程的页表项外,vfork()和fork()功能相同:子进程作为父进程的一个单独的线程在他的地址空间里运行,父进程被阻塞,直到子进程退出exit()或执行exec()。子进程不能向地址空间写入。
总结就是
fork ():子进程拷贝父进程的数据段,代码段
vfork ( ):子进程与父进程共享数据段
fork ()父子进程的执行次序不确定
vfork 保证子进程先运行,在调用exec 或exit 之前与父进程数据是共享的,在它调用exec
或exit 之后父进程才可能被调度运行。
vfork ()保证子进程先运行,在她调用exec 或exit 之后父进程才可能被调度运行。如果在
调用这两个函数之前子进程依赖于父进程的进一步动作,则会导致死锁。

你可能感兴趣的:(linux,unix,服务器)