当学习了Java NIO和IO的API后,一个问题很快进入心中:

我应该在何时使用IO,何时使用NIO呢?

在本文中,我会尽量清晰地阐明Java NIO和IO的差异、它们的用例,以及它们如何影响您的代码设计。

Java NIO和IO的主要差异

下表总结了Java NIO和IO之间的主要差别,我会更详细地描述表中每部分的差异。

IO

NIO

面向流

面向缓冲

阻塞的IO

非阻塞IO

 

选择器

面向流与面向缓冲

Java NIO和IO之间第一个最大的区别是,IO是面向流的,其中NIO是面向缓冲区的。那么,者是什么意思?

Java IO面向流意味着每次从流中读一个或多个字节,直至读取所有字节,它们没有被缓存在任何地方。此外,不能前后移动流中的数据。如果需要前后移动从流中读取的数据,需要先将它缓存到一个缓冲区。

Java NIO的缓冲导向方法略有不同。数据读取到一个它以后处理的缓冲区,需要时,可在缓冲区中前后移动。这就增加了处理过程中的灵活性。但是,还需要检查,是否该缓冲区包含所有您需要充分处理的数据。而且,需确保当更多的数据读入缓冲区时,不要覆盖尚未处理的缓冲区数据。

阻塞与非阻塞IO

Java IO的各种流是阻塞的。这意味着,当一线程调用读read() 或 write()时,该线程被阻塞,直到有一些数据被读取,或数据完全写入。该线程在此期间不能再干任何事情。

Java NIO的非阻塞模式,使一个线程从某通道请求读取数据,仅得目前可用的,或若目前没有数据可用时,什么都没有。而不是保持线程阻塞,直至数据变得可供读取,该线程可以继续其他的事情。

非阻塞写也是如此。一线程请求写入一些数据到某通道,但不等待它完全写入,然后该线程同时可以去做别的事情。

线程将不是阻塞的IO空闲时间调用通常花费在其它通道在此期间的IO执行上,亦即,一个单独的线程现在可以管理多个输入和输出通道。

选择器

Java NIO的选择器允许一个单独的线程来监视多个输入通道,可以注册一个选择器的多个通道,然后使用一个单独的线程“选择”通道:已有输入可用于处理,或某通道已准备写入。这种选择机制,使得一个单独的线程很容易来管理多个通道。

NIO和IO如何影响应用程序的设计

无论您选择IO或NIO工具箱,可能会影响您应用程序设计的以下几个方面:

1.        对NIO或IO类的API调用。

2.        数据处理。

3.        用来处理数据的线程数。

API调用

当然,使用NIO的API调用时看起来与使用IO时有所不同,这也难怪,不是仅仅从一个InputStream逐字节读取,数据必须先读入缓冲区,然后从那里处理。

数据处理

使用纯粹的NIO设计相较IO设计,数据处理也受到影响。

在一IO设计,从一InputStream或 Reader逐字节读取。想象一下,正在处理一基于文本数据的行流,例如:

Name: Anna

Age: 25

Email: [email protected]

Phone: 1234567890

该文本行的流可以这样处理:

1
2
3
4
5
6
7
8
9
10
11
InputStream input = ... ; // get the InputStream from the client socket
  
BufferedReader reader = new BufferedReader( new InputStreamReader(input));
  
String nameLine   = reader.readLine();
  
String ageLine    = reader.readLine();
  
String emailLine  = reader.readLine();
  
String phoneLine  = reader.readLine();

请注意处理状态由程序执行多久决定确定。换句话说,一旦reader.readLine()方法返回,你就知道肯定文本行就已读完, readline()阻塞直到整行读完,此即原因。你也知道此行包含名称;同样,第二个readline()调用返回的时候,你知道这行包含年龄等。

正如你可以看到,该处理程序仅在有新数据读入时运行,并知道每步的数据是什么。一旦正在运行的县城已处理过读入的某些数据,该线程不会再回退数据(大多如此)。下图也说明了这条原则:

Java IO: 从阻塞流中读取数据

一个NIO实现会有所不同。下面是一个简单的例子:

1
2
3
ByteBuffer buffer = ByteBuffer.allocate( 48 );
  
int bytesRead = inChannel.read(buffer);

注意第二行,从通道读取字节到ByteBuffer。当这个方法调用返回时,你不知道你所需的所有数据是否在缓冲区内。你所知道的是,该缓冲区包含一些字节,这使得处理有点困难。

想象一下,如果第一次 read(buffer)调用后,所有读入缓冲区为半行,例如,“Name:An”,你能处理数据吗?显然不能,需要等待,直到整行数据读入缓存,在此之前,对数据的任何处理毫无意义。

所以,你怎么知道是否该缓冲区包含足够的数据可以处理呢?好了,你不知道。发现的方法只能查看缓冲区中的数据。其结果是,在知道数据是否在其中前,需要检查缓冲区几次。这不仅效率低下,而且可以使方案设计杂乱不堪。例如:

1
2
3
4
5
6
7
8
9
10
11
ByteBuffer buffer = ByteBuffer.allocate( 48 );
  
  
int bytesRead = inChannel.read(buffer);
  
  
while (! bufferFull(bytesRead) ) {
  
bytesRead = inChannel.read(buffer);
  
}

bufferFull()方法必须跟踪有多少数据读入缓冲区,并返回真或假,取决于缓冲区是否已满。换句话说,如果缓冲区准备好被处理,它被认为是满了。

bufferFull()方法扫描缓冲区,但必须保持在bufferFull()方法被调用之前状态相同。如果没有,下一个读入缓冲区的数据可能无法读到正确的位置。这是不可能的,但却是需要注意的又一问题。

如果缓冲区已满,它可以被处理。如果它不满,在特定的情况下,也许可以部分过处理其中存在的任何数据。许多情况下并非如此。

下图展示了“缓冲区数据循环就绪”:

Java NIO: 从通道读取数据直至所需数据在缓存区中

摘要

NIO可让您管理只使用一个(或几个)单线程管理多个通道(网络连接或文件),但付出的代价是,解析数据可能会比从一个阻塞流中读取数据时较为复杂。

如果需要管理成千上万打开的连接共存,每次只能发送小部分数据,例如聊天服务器,实现NIO的服务器可能是一个优势。同样,如果你需要保持许多打开的连接到其他计算机上,如P2P网络中,使用一个单独的线程来管理你所有出站连接,可能是一个优势。一个线程多个连接的设计方案如下图所示:

Java NIO: 单线程管理多连接

如果你有非常高的带宽更少的连接,一次发送大量的数据,也许典型的IO服务器实现可能的最佳契合。下图说明了一个典型的IO服务器设计:

Java IO: 典型IO 设计 –每线程处理一个连接