高级IO--五种IO模型

一、IO

1、IO介绍

I就是input输入,O就是output输出,一起就是基本输入输出设备;I/O也就是输入输出地址。每个设备都会有一个专用的I/O地址,用来处理自己的输入输出信息。I/O地址绝对不能重复,如果两个设备的I/O地址有冲突,系统硬件就不能正常工作。

2、IO模型

对于一次IO访问(以read举例),数据会先被拷贝到操作系统内核的缓冲区中,然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。所以说,当一个read操作发生时,它会经历两个阶段:
(1) 等待数据准备 (Waiting for the data to be ready)
(2)将数据从内核拷贝到进程中 (Copying the data from the kernel to the process)
在网络编程环境中,一次IO操作主要包括两个部分:等数据准备和搬迁数据,所以如果想要提高IO效率,就应该想办法让等的比重减少。

二、五种IO模型

正是因为IO操作的两个阶段,linux系统产生了下面五种网络模式的方案。

1、阻塞IO

在linux中,默认情况下所有的socket都是阻塞的,在内核数据准备好之前,系统调用会一直等待。具体流程如下:
高级IO--五种IO模型_第1张图片
(1)当用户进程调用了recvfrom这个系统调用,kernel就开始了IO的第一个阶段:准备数据(对于网络IO来说,很多时候数据在一开始还没有到达。比如,还没有收到一个完整的UDP包。这个时候kernel就要等待足够的数据到来)。这个过程需要等待,也就是说数据被拷贝到操作系统内核的缓冲区中是需要一个过程的。而在用户进程这边,整个进程会被阻塞(当然,是进程自己选择的阻塞)。
(2)当kernel一直等到数据准备好了,它就会将数据从kernel中拷贝到用户内存,然后kernel返回结果,用户进程才解除block的状态,重新运行起来。

2、非阻塞IO

如果内核还未将数据准备好,系统调用仍然会直接返回,并且返回EWOULDBLOCK错误码,具体执行过程如下:
高级IO--五种IO模型_第2张图片
(1)当用户进程发出read操作时,如果kernel中的数据还没有准备好,那么它并不会block用户进程,而是立刻返回一个error。
(2)从用户进程角度讲 ,它发起一个read操作后,并不需要等待,而是马上就得到了一个结果。用户进程判断结果是一个error时,它就知道数据还没有准备好,于是它可以再次发送read操作(这个反复尝试读写文件描述符的过程称为轮询)。
(3)一旦kernel中的数据准备好了,并且又再次收到了用户进程的system call,那么它马上就将数据拷贝到了用户内存,然后返回。

3、信号驱动IO

内核将数据准备好之后,使用SIGIO信号通知程序进行IO操作,其具体过程图如下:
高级IO--五种IO模型_第3张图片

(1)首先开启套接口信号驱动I/O功能,并通过系统调用sigaction执行一个信号处理函数(此系统调用立即返回,进程继续工作,它是非阻塞的)。
(2)当数据准备就绪时,就为该进程生成一个SIGIO信号,通过信号回调通知应用程序调用recvfrom来读取数据,并通知主循环函数处理数据。

4、IO多路转接

IO多路转接过程中依然是阻塞等待过程,但是与阻塞IO不同的是,它一次可以等待多个文件描述符,当其中任何一个文件描述符上的读或写事件就绪时就返回给用户进程继续工作,所以在效率上优于阻塞IO模型。具体流程图如下:
高级IO--五种IO模型_第4张图片
(1)Linux提供select/poll,进程通过将一个或多个fd传递给select或者poll系统调用,阻塞在select操作上,这样select/poll可以帮我们侦测多个fd是否处于就绪状态。(2)当有fd就绪时,立即回调函数rollback。

5、异步IO

由内核在数据完成拷贝时,通知应用程序。流程图如下:
高级IO--五种IO模型_第5张图片
(1)用户进程发起read操作之后,立刻就可以开始去做其它的事。
(2)而另一方面,从kernel的角度,当它受到一个asynchronous read之后,首先它会立刻返回,所以不会对用户进程产生任何block。
(3)然后,kernel会等待数据准备完成,然后将数据拷贝到用户内存,当这一切都完成之后,kernel会给用户进程发送一个signal,告诉它read操作完成了。
异步IO与信号驱动的区别:
信号驱动I/O由内核通知我们何时可以开始一个I/O操作;异步I/O模型由内核通知我们I/O操作何时已经完成。

三、总结

(1)任何IO过程中,都包含两个步骤。一是等待,二是拷贝。 在实际的应用场景中,等待消耗的时间往往都远远高于拷贝的时间。 所以,让IO更高效, 最核心的办法就是让等待的时间尽量少,也就是阻塞越少,理论上效率也是最优。
(2)阻塞和非阻塞的区别
调用blocking IO会一直block住对应的进程直到操作完成,而non-blocking IO在kernel还准备数据的情况下会立刻返回。

你可能感兴趣的:(高级IO--五种IO模型)