网络I/O有两个交互过程:
阶段1 wait for data 等待数据准备
阶段2 copy data from kernel to user 将数据从内核拷贝到用户进程中
(1)blocking IO - 阻塞IO:阻塞等待数据准备及拷贝返回
(2)nonblocking IO :循环访问数据是否准备好
(3)IO multiplexing - IO多路复用:轮循多个socekt连接数据是否就绪
(4)signal driven IO - 信号驱动IO:数据准备好再响应
(5)asynchronous IO - 异步IO:数据准备及拷贝工作都就绪才响应
一、基本概念描述
1.1 I/O简介
I/O即输入输出,是计算机与外界世界的一个借口。IO操作的实际主题是操作系统。在java编程中,一般使用流的方式来处理IO,所有的IO都被视作是单个字节的移动,通过stream对象一次移动一个字节。流IO负责把对象转换为字节,然后再转换为对象。
关于Java IO相关知识请参考我的另一篇文章:Java IO 详解
1.2 什么是NIO
NIO即New IO,这个库是在JDK1.4中才引入的。NIO和IO有相同的作用和目的,但实现方式不同,NIO主要用到的是块,所以NIO的效率要比IO高很多。
在Java API中提供了两套NIO,一套是针对标准输入输出NIO,另一套就是网络编程NIO,本篇文章重点介绍标NIO,关于网络编程NIO请见Java NIO详解(二)。
1.3 流与块的比较
NIO和IO最大的区别是数据打包和传输方式。IO是以流的方式处理数据,而NIO是以块的方式处理数据。
面向流的IO一次一个字节的处理数据,一个输入流产生一个字节,一个输出流就消费一个字节。为流式数据创建过滤器就变得非常容易,链接几个过滤器,以便对数据进行处理非常方便而简单,但是面向流的IO通常处理的很慢。
面向块的IO系统以块的形式处理数据。每一个操作都在一步中产生或消费一个数据块。按块要比按流快的多,但面向块的IO缺少了面向流IO所具有的有雅兴和简单性。
二、NIO基础
Buffer和Channel是标准NIO中的核心对象(网络NIO中还有个Selector核心对象,具体请参考Java NIO详解(二)),几乎每一个IO操作中都会用到它们。
Channel是对原IO中流的模拟,任何来源和目的数据都必须通过一个Channel对象。一个Buffer实质上是一个容器对象,发给Channel的所有对象都必须先放到Buffer中;同样的,从Channel中读取的任何数据都要读到Buffer中。
2.1 关于Buffer
Buffer是一个对象,它包含一些要写入或读出的数据。在NIO中,数据是放入buffer对象的,而在IO中,数据是直接写入或者读到Stream对象的。应用程序不能直接对 Channel 进行读写操作,而必须通过 Buffer 来进行,即 Channel 是通过 Buffer 来读写数据的。
在NIO中,所有的数据都是用Buffer处理的,它是NIO读写数据的中转池。Buffer实质上是一个数组,通常是一个字节数据,但也可以是其他类型的数组。但一个缓冲区不仅仅是一个数组,重要的是它提供了对数据的结构化访问,而且还可以跟踪系统的读写进程。
使用 Buffer 读写数据一般遵循以下四个步骤:
写入数据到 Buffer;
调用 flip() 方法;
从 Buffer 中读取数据;
调用 clear() 方法或者 compact() 方法。
当向 Buffer 写入数据时,Buffer 会记录下写了多少数据。一旦要读取数据,需要通过 flip() 方法将 Buffer 从写模式切换到读模式。在读模式下,可以读取之前写入到 Buffer 的所有数据。
一旦读完了所有的数据,就需要清空缓冲区,让它可以再次被写入。有两种方式能清空缓冲区:调用 clear() 或 compact() 方法。clear() 方法会清空整个缓冲区。compact() 方法只会清除已经读过的数据。任何未读的数据都被移到缓冲区的起始处,新写入的数据将放到缓冲区未读数据的后面。
.3 关于Channel
Channel是一个对象,可以通过它读取和写入数据。可以把它看做IO中的流。但是它和流相比还有一些不同:
Channel是双向的,既可以读又可以写,而流是单向的
Channel可以进行异步的读写
对Channel的读写必须通过buffer对象
正如上面提到的,所有数据都通过Buffer对象处理,所以,您永远不会将字节直接写入到Channel中,相反,您是将数据写入到Buffer中;同样,您也不会从Channel中读取字节,而是将数据从Channel读入Buffer,再从Buffer获取这个字节。
因为Channel是双向的,所以Channel可以比流更好地反映出底层操作系统的真实情况。特别是在Unix模型中,底层操作系统通常都是双向的。
在Java NIO中Channel主要有如下几种类型:
FileChannel:从文件读取数据的
DatagramChannel:读写UDP网络协议数据
SocketChannel:读写TCP网络协议数据
ServerSocketChannel:可以监听TCP连接
异步IO
异步 I/O 是一种没有阻塞地读写数据的方法。通常,在代码进行 read() 调用时,代码会阻塞直至有可供读取的数据。同样, write()调用将会阻塞直至数据能够写入,关于同步的IO请参考另一篇文章Java IO。
另一方面,异步 I/O 调用不但不会阻塞,相反,您可以注册对特定 I/O 事件诸如数据可读、新连接到来等等,而在发生这样感兴趣的事件时,系统将会告诉您。
异步 I/O 的一个优势在于,它允许您同时根据大量的输入和输出执行 I/O。同步程序常常要求助于轮询,或者创建许许多多的线程以处理大量的连接。使用异步 I/O,您可以监听任何数量的通道上的事件,不用轮询,也不用额外的线程。
Selector
在我的JavaNIO详解(一)中已经详细介绍了Java NIO三个核心对象中的Buffer和Channel,现在我们就重点介绍一下第三个核心对象Selector。Selector是一个对象,它可以注册到很多个Channel上,监听各个Channel上发生的事件,并且能够根据事件情况决定Channel读写。这样,通过一个线程管理多个Channel,就可以处理大量网络连接了。
采用Selector模式的的好处
有了Selector,我们就可以利用一个线程来处理所有的channels。线程之间的切换对操作系统来说代价是很高的,并且每个线程也会占用一定的系统资源。所以,对系统来说使用的线程越少越好。
但是,需要记住,现代的操作系统和CPU在多任务方面表现的越来越好,所以多线程的开销随着时间的推移,变得越来越小了。实际上,如果一个CPU有多个内核,不使用多任务可能是在浪费CPU能力。不管怎么说,关于那种设计的讨论应该放在另一篇不同的文章中。在这里,只要知道使用Selector能够处理多个通道就足够了。
下面这幅图展示了一个线程处理3个 Channel的情况:
一、初步了解Netty
Netty是一个NIO的编程框架,Netty是非常容易和快速开发出网络应用程序的,它提供了一种全新的形式来方便你编写网络应用:它提供了对一些对复杂问题的抽象,提供了一套非常容易使用的api来把我们的业务逻辑和纯粹处理网络的代码分离开来。因为Betty是基于NIO,因此它的整个API都是异步的。
Netty简化了基于TCP和UDP的编程,但是你仍可以用它的底层的API做一些底层处理,因为Netty提供了一系列高抽象的API。
Netty有一系列丰富的特性,让我们来看一下它的强大之处:
有一套统一的API来处理异步和同步编程模式
使用非常灵活
简单但却强大的线程机制
业务组件分离方便重用
极小的缩减不必要的Memory Copy
Netty开始-理解Netty的设计理念NIONetty开始-理解Netty的设计理念NIO
二、异步编程模式设计
一般来说网络编程都会面临着并发问题,那么我们就来看一下为何异步编程模式会很好的解决这个问题,其实这也就诠释了netty背后的设计思想。
在现在,瓶颈总是在IO处理上,异步的处理方式就是你可以不用一直等待任务(IO)处理完成,而是在任务进行的时候还可以做其它事情。那么如何实现这个呢?让我们来认识一下实现异步的两种处理方式:
CallBack:回调是异步处理经常用到的编程模式,回调函数通常被绑定到一个方法上,并且在方法完成之后才执行,这种处理方式在javascript当中得到了充分的运用。回调给我们带来的难题是当一个问题处理过程中涉及很多回调时,代码是很难读的。
Futures:Futures是一种抽象,它代表一个事情的执行过程中的一些关键点,我们通过Future就可以知道任务的执行情况,比如当任务没完成时我们可以做一些其它事情。它给我们带来的难题是我们需要去判断future的值来确定任务的执行状态。
其实这两者很难界定那个好或坏,其实Netty中这两者都有用到。
异步模式(NIO)和非异步模式(BIO)(N可以理解为non-blocking或new)
Block IO会对每个连接创建一个线程,因此这极大限制了JVM创建线程的数量(当然线程池可缓解这个问题,但是也仅仅是缓解),如图所示:
NIO会通过专门的Selector来管理请求,然后可由一个线程来处理请求,如图所示:
在NIO中,不得不提到的是关于抽象的数据容器ByteBuffer,ByteBuffer允许相同的数据在不同ByteBuffer之间共享而不需要再拷贝一次来处理。Slicing-ByteBuffer允许创建一个新的ByteBuffer通过暴露一个子边界的形式共享原ByteBuffer的数据,这就大大减少了在数据处理过程中内存的copy(Zero-copy)。ByteBuffer通过一些索引来记录读写的信息,当你向其中写数据时,它会自动跟踪你写到ByteBuffer的位置,类似,他也会自动跟踪你读的位置。而且ByteBuffer还提供了很多方法让你切换读写模式(flip)或者清空(clear)或者压缩(compact)等。
关于Selectors,NIOAPI通过selector来处理网络事件和数据。一个Channel代表一个网络连接。Selector的作用就是来决定这些Channel是否已准备好读或者写操作,一个selector可以处理很多连接请求,这就解决了为一个连接创建一个线程的问题。要想用一个selector需要以下步骤:
1.创建一个或多个selector用来给打开的channels注册。
2.当一个channel注册后,就需要来确定哪种事件需要你监听,通常有四种事件:
OP_ACCEPT
OP_CONNECT
OP_READ
OP_WRITE
3.当channels被注册后,你需要调用Selector.select()方法来阻塞直到上述事件发生。
4.当方法没有阻塞时,你会获得所有SelectionKey实例,这些实例包含了已注册channel的引用和其状态,这样你就可以做你的操作了。
三、Netty VS JavaNIO
1.跨平台性和通用型
NIO某些底层的操作依赖于操作系统,因此,你写的NIO程序有可能在windows上运行良好,但到了Linux可能会出现问题。 Java6和Java7对NIO提供了不同的解决方案,两个API是不通用的。
2.拓展了ByteBuffer
Netty提供了对ByteBuffer的封装类ByteBuf,拓展了JDK中ByteBuffer的功能,增强了易用性。
3. 数据拆分和聚集
很多时候我们想把数据分割成独立的Bytebuffer来处理,比如Http协议Header放到一个buffer中,而Body放到另一个buffer中。很不幸,对于这种处理方式直到Java7才出现,而且如果处理不当,会极易造成OutOfMemoryError。
Scattering And Gathering:
4.解决了著名的epoll bug
转载请说明出处,原文链接:http://blog.csdn.net/suifeng3051/article/details/23348587