Linux的五种IO模型及同步和异步的区别

前置知识

 

缓存 I/O

缓存 I/O 又被称作标准 I/O,大多数文件系统的默认 I/O 操作都是缓存 I/O。在 Linux 的缓存 I/O 机制中,操作系统会将 I/O 的数据缓存在文件系统的页缓存( page cache )中,也就是说,数据会先被拷贝到操作系统内核的缓冲区中,然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。

缓存的两个阶段

  1. 等待数据准备(等待数据进入内核缓存)
  2. 将数据从内核缓存拷贝到进程内存中

进程的阻塞

正在执行的进程,由于期待的某些事件未发生,如请求系统资源失败、等待某种操作的完成、新数据尚未到达或无新工作做等,则由系统自动执行阻塞原语(Block),使自己由运行状态变为阻塞状态。可见,进程的阻塞是进程自身的一种主动行为,也因此只有处于运行态的进程(获得CPU),才可能将其转为阻塞状态。当进程进入阻塞状态,是不占用CPU资源的。

 

Linux的五种IO模型

 

阻塞 I/O

Linux的五种IO模型及同步和异步的区别_第1张图片

 

比较简单就不介绍了,有看过我之前的深入理解NIO系列就会懂

 

非阻塞 I/O

 Linux的五种IO模型及同步和异步的区别_第2张图片

 

 简单说就是用户进程需要不断的主动询问kernel数据好了没有。

 

I/O 多路复用

Linux的五种IO模型及同步和异步的区别_第3张图片

 

 我们的select、poll和epoll都属于IO多路复用的模型

这里提一下,它们都属于同步非阻塞IO,为什么同步我们后面会解释。

 

信号驱动式IO

Linux的五种IO模型及同步和异步的区别_第4张图片

首先我们允许Socket进行信号驱动IO,并安装一个信号处理函数,进程继续运行并不阻塞。当数据准备好时,进程会收到一个SIGIO信号,可以在信号处理函数中调用I/O操作函数处理数据。

 

异步 I/O

Linux的五种IO模型及同步和异步的区别_第5张图片

 

用户进程发起read操作之后,立刻就可以开始去做其它的事。而另一方面,从kernel的角度,当它受到一个asynchronous read之后,首先它会立刻返回,所以不会对用户进程产生任何block。然后,kernel会等待数据准备完成,然后将数据拷贝到用户内存,当这一切都完成之后,kernel会给用户进程发送一个signal,告诉它read操作完成了。

这就是我们本节的重点,我们心心念念的AIO了。虽然在第三节才讲有点晚,但是铺垫了这么多,我想要说的,就是AIO它到底异步在哪里?或者说什么是异步?

 

异步和同步的区别

 

在说明synchronous IO和asynchronous IO的区别之前,需要先给出两者的定义。POSIX的定义是这样子的:

  • A synchronous I/O operation causes the requesting process to be blocked until that I/O operation completes;
  • An asynchronous I/O operation does not cause the requesting process to be blocked;

两者的区别就在于synchronous IO做”IO operation”的时候会将process阻塞。按照这个定义,之前所述的blocking IO,non-blocking IO,IO multiplexing都属于同步IO。

有人会说,non-blocking IO并没有被block啊。这里有个非常“狡猾”的地方,定义中所指的”IO operation”是指真实的IO操作,就是例子中的recvfrom这个system call。non-blocking IO在执行recvfrom这个system call的时候,如果kernel的数据没有准备好,这时候不会block进程。但是,当kernel中数据准备好的时候,recvfrom会将数据从kernel拷贝到用户内存中,这个时候进程是被block了

而asynchronous IO则不一样,当进程发起IO 操作之后,就直接返回再也不理睬了,直到kernel发送一个信号,告诉进程说IO完成。在这整个过程中,进程完全没有被block。

 

Linux的五种IO模型及同步和异步的区别_第6张图片

通过上面的图片,可以发现non-blocking IO和asynchronous IO的区别还是很明显的。在non-blocking IO中,虽然进程大部分时间都不会被block,但是它仍然要求进程去主动的check,并且当数据准备完成以后,也需要进程主动的再次调用recvfrom来将数据拷贝到用户内存。而asynchronous IO则完全不同。它就像是用户进程将整个IO操作交给了他人(kernel)完成,然后他人做完后发信号通知。在此期间,用户进程不需要去检查IO操作的状态,也不需要主动的去拷贝数据。

 


 

参考资料:
https://segmentfault.com/a/1190000003063859
https://www.cnblogs.com/tianzeng/p/10779425.html

你可能感兴趣的:(Linux的五种IO模型及同步和异步的区别)