Java IO 1 涉及到的底层概念

Java io的接口经过了多次迭代,现在主要分为三部分,即java IO (since JDK1.0),java NIO(since JDK1.4),java NIO2(since JDK1.7)。
那么java为什么要将IO的接口分成这三部分呢,这三部分的接口又有什么不同呢?
它们背后的底层原理是什么,要怎么样理解才比较好呢?常常听到的阻塞,非阻塞,同步,异步的概念,到底它们是什么,之间有什么区别?
本文将试着根据相关的文档,用自己的语言来解释这些问题,希望对你有所启发。

一 涉及的对象

1) 用户进程和操作系统内核

Java 中的IO可以理解为是在Java程序和操作系统内核两个对象之间进行的。
后面所说的阻塞和非阻塞,同步和异步都是这两个对象相互作用的结果。在本文中,用户进程指的就是Java程序。

2) 程序空间和内核空间

Waiting for the data to be ready(等待数据到达内核缓冲区)

Copying the data from the kernel to the process(从内核缓冲区拷贝数据到程序缓冲区)

在Linux中,对于一次读取IO的操作,数据并不会直接拷贝到程序的程序缓冲区。

它首先会被拷贝到操作系统内核的缓冲区中,然后才会从操作系统内核的缓冲区拷贝到应用程序的缓冲区。

程序空间:分配给用户程序的内存空间。

内核空间:内核拥有的内存空间。

3) 阻塞和非阻塞

阻塞:用户进程进行系统调用后,用户进程一直处于锁定的状态,不能进行其他操作

非阻塞:用户进程进行系统调用后,用户进程没有被锁定,可以进行其他操作

阻塞和非阻塞说的是用户进程的状态,即用户进程是否被锁定

4) 同步和异步

A synchronous I/O operation causes the requesting process to be blocked until that I/O operation completes.
An asynchronous I/O operation does not cause the requesting process to be blocked.

一个同步的io操作会导致发起请求的进程阻塞直到这个io操作完成。一个异步的io操作不会导致请求的线程被阻塞。

同步:用户线程和io线程做同一件事(用户线程被阻塞,等待内核返回处理结果)

异步:用户线程和io线程做不同的事情(用户线程不被阻塞,做其他的事情,内核处理完成发送结果给用户线程)

5) 文件描述符

在Linux下面一切皆文件。文件描述符(file descriptor)是内核为文件所创建的索引,所有I/O操作都通过调用文件描述符(索引)来执行,包括下面我们要提到的socket。Linux刚启动的时候会自动设置0是标准输入,1是标准输出,2是标准错误。

二 uninx五种IO模型

1) blocking IO(阻塞IO)

Java IO 1 涉及到的底层概念_第1张图片
blocking-IO.png

调用过程:

  1. 用户进程调用一个recvfrom请求,内核收到这个请求之后没有立即返回,而是首先等待数据到达。

  2. 等数据到达之后,再进行数据拷贝,将数据从内核缓存区拷贝到用户进程缓存区,拷贝完成后返回给进程ok的消息。

上面整个过程都是阻塞的。

2) nonblocking IO(非阻塞IO)

Java IO 1 涉及到的底层概念_第2张图片
noblocking-IO.png

调用过程:

  1. 用户进程调用一个recvfrom请求,内核收到这个请求之后立即返回数据没有到达的消息。

  2. 用户进程收到消息后继续发送recvfrom请求,如果数据仍没有到达,内核继续返回没有到达的消息。

  3. 如此循环,直到数据到达内核。然后内核将收到的数据从内核缓存区拷贝到用户进程缓存区,拷贝完成后返回给进程ok的消息。

上面整个过程都是阻塞的。

3) IO multiplexing(IO复用) (select/poll/epoll)

Java IO 1 涉及到的底层概念_第3张图片
IO-multiplexing.png

调用过程:

  1. 用户进程通过调用select或poll或epoll去查询多个文件描述符的状态。

  2. 如果有一个文件描述符准备好了,内核就返回该文件描述符可读的消息。

  3. 用户进程调用一个recvfrom请求,内核收到请求后开始拷贝数据,将数据从内核缓存区拷贝到用户进程缓存区,拷贝完成后返回给进程ok的消息。

上面整个过程都是阻塞的。

  1. signal driven IO(信号驱动IO)
Java IO 1 涉及到的底层概念_第4张图片
signal-driven-IO.png

调用过程:

  1. 设置socket为一个信号驱动IO,并且通过sigaction system call安装一个signal handler。

  2. 数据准备好以后,一个SIGIO信号传送给用户进程通知数据已经准备好。

  3. 然后用户进程调用一个recvfrom请求,内核收到请求后开始拷贝数据,将数据从内核缓存区拷贝到用户进程缓存区,拷贝完成后返回给进程ok的消息。

步骤1因为是瞬时完成的,可以认为是非阻塞的。步骤2,3是阻塞的。

  1. asynchronous IO(异步IO)
Java IO 1 涉及到的底层概念_第5张图片
asynchronous-IO.png

调用过程:

  1. 用户进程发送一个aio_read的系统调用,内核立即返回响应。

  2. 用户进程收到响应,可以继续做自己的事(非阻塞)。

  3. 内核等待数据到达,完成数据拷贝后,发送消息给用户进程。

上面整个过程都是非阻塞的。

三 windowsIO模型

windwos IO模型感觉和linuxIO模型相似,感兴趣的同学可以看看这个

ps: 本文的图和英文引用部分来自参考文档3.中文引用部分来自文档1(参考文档写的比我好,建议大家多看看 :))

参考文档:

  1. Linux下的五种IO模型

  2. 从内核文件系统看文件读写过程

  3. Linux_Programming/UNIX Network Programming(Volume1,3rd).pdf

  4. 使用异步 I/O 大大提高应用程序的性能

你可能感兴趣的:(Java IO 1 涉及到的底层概念)