前言

参考资料：

《Netty In Action》；
B站《尚硅谷 Netty 视频教程》；

本系列为 Netty 学习笔记，本篇介绍总结Java NIO 网络编程。Netty 作为一个异步的、事件驱动的网络应用程序框架，也是基于NIO的客户、服务器端的编程框架。其对 Java NIO 底层 API 进行了封装，因此有必要对 Java 网络编程做个大概了解。本篇将重点放在 NIO 网络编程模型上，对 BIO 及 AIO 仅做简要说明；

1. Java 网络编程

最早期的 Java API（java.net）只支持由本地系统套接字库提供的阻塞函数，其弊端有：
- 一个线程只能处理一条连接；
- 在任何时候都可能有大量线程处于休眠状态，可能造成资源浪费；
- 需要为每个线程的调用栈分配内存；
- 上下文切换带来的开销会很麻烦；
2002年，JDK 1.4 在 java.nio 包中引入非阻塞 IO（NIO）。使用事件通知 API 以确定在一组非阻塞套接字中有哪些已经就绪能够进行 IO 相关的操作；
非阻塞 IO 的优势有：
- 使用较少线程便可处理许多连接，减少了内存管理和上下文切换带来的开销；
- 没有 IO 操作需要处理时，线程可以被用于其他任务；
Java 支持3中网络编程模式：BIO(同步阻塞型)、NIO(同步非阻塞型)、AIO(异步非阻塞型)；
- BIO：适用于连接数目较小且固定的架构；
- NIO：适用于链接数量多且连接比较短的架构；
- AIO：适用于连接数目多且连接比较长的架构；
BIO 以流的方式处理书局，NIO 以块的方式处理书局，块 IO 的效率比流 IO 高很多；

1.1 Javs NIO 基本介绍

NIO 的三大核心部分部分：Channel(通道)、Buffer(缓冲区)、Selector(选择器)；
- 每个 Channel 都会对应一个 Buffer；
- Selector 对应一个线程，一个线程对应多个 Channel；
- 多个 Channel 可以注册到一个 Selector；
- 程序切换到哪个 Channel 由事件 Event 决定；
- Selector 会根据不同的事件，在各个通道上切换；
- Buffer 就是一个内存块，底层是一个数组；
- 数据的读取和写入通过 Buffer，与 BIO 不同。BIO 要么是输入流，要么是输出流，不能双向，而 NIO 的 Buffer 是双向的；
- Channel 也是双向的，可以反映底层操作系统的情况；底层的操作系统通道就是双向的；

NIO的三大核心组件.png

NIO 是面向缓冲区，或者面向块编程的；
NIO 可以做到用一个线程来处理多个操作；
HTTP 2.0 使用了多路复用技术，做到同一个连接并发处理多个请求；

1.2 缓冲区 Buffer

缓冲区本质是一个可以读写的内存块，可以理解成一个容器对象，该对象提供一组方法，可以更轻松地使用内存块；
缓冲期内置了一些机制，能够跟踪和记录缓冲区的状态变化情况；
Channel 提供从文件、网络读取数据的通道，但读取或写入的数据必须经由 Buffer；
Buffer 有四个通用属性：
- capacity：容量，即可以容纳的最大数据量；在缓存区创建时被设定并且不能改变；
- limit：表示缓冲区当前的终点，不能对缓冲区中超过Limit的部分进行读写（相当于哨兵）。而且Limit是可以修改的；
- position：当前的读/写位置，下一个要被读或写的元素的索引，每次读写缓冲区数据时都会改变改值，为下次读写作准备；
- mark：标记；

Buffer 类的通用方法：

public abstract class Buffer {
    //JDK1.4时，引入的api
    public final int capacity()//返回此缓冲区的容量
    public final int position()//返回此缓冲区的位置
    public final Buffer position (int newPositio)//设置此缓冲区的位置
    public final int limit()//返回此缓冲区的限制
    public final Buffer limit (int newLimit)//设置此缓冲区的限制
    public final Buffer mark()//在此缓冲区的位置设置标记
    public final Buffer reset()//将此缓冲区的位置重置为以前标记的位置
    public final Buffer clear()//清除此缓冲区, 即将各个标记恢复到初始状态，但是数据并没有真正擦除, 后面操作会覆盖
    public final Buffer flip()//反转此缓冲区
    public final Buffer rewind()//重绕此缓冲区
    public final int remaining()//返回当前位置与限制之间的元素数
    public final boolean hasRemaining()//告知在当前位置和限制之间是否有元素
    public abstract boolean isReadOnly();//告知此缓冲区是否为只读缓冲区

    //JDK1.6时引入的api
    public abstract boolean hasArray();//告知此缓冲区是否具有可访问的底层实现数组
    public abstract Object array();//返回此缓冲区的底层实现数组
    public abstract int arrayOffset();//返回此缓冲区的底层实现数组中第一个缓冲区元素的偏移量
    public abstract boolean isDirect();//告知此缓冲区是否为直接缓冲区
}

Buffer 类及其子类：

buffer 类及其子类.png

1.2 通道 Channel

BIO 中的 stream 是单向的，例如 FileInputStream 对象只能进行读取数据的操作，而 NIO 中的通道(Channel)是双向的，可以读操作，也可以写操作;
Channel 在 NIO 中是一个接口 public interface Channel extends Closeable{}；
常用的 Channel 类有： FileChannel 、 DatagramChannel 、 ServerSocketChannel 和 SocketChannel：

Channel 类及其子类.png
NIO 还支持通过多个 Buffer(即 Buffer 数组) 完成读写操作，即 Scattering 和 Gathering；

1.3 选择器 Selector

Java 的 NIO，用非阻塞的 IO 方式。可以用一个线程，处理多个的客户端连接，就会使用到 Selector(选择器)；
Selector 能够检测多个注册的通道上是否有事件发生；
如果有事件发生，便获取事件然后针对每个事件进行相应的处理。这样就可以只用一个单线程去管理多个通道，也就是管理多个连接和请求（IO多路复用技术）；
Netty 的 IO 线程 NioEventLoop 聚合了 Selector(选择器，也叫多路复用器)，可以同时并发处理成百上千个客户端连接；

1.4 NIO 非阻塞网络编程原理分析

当客户端连接时，会通过 ServerSocketChannel 得到 SocketChannel；
将 socketChannel 注册到 Selector 上（register 方法）；
注册后返回一个 SelectionKey，会和该 Selector 关联(集合)；
Selector 进行监听（select 方法），对于有事件发生的通道，将对应的 SelectionKey 加入到内部集合中并返回；
再通过 SelectionKey 反向获取 SocketChannel （方法 channel）；
可以通过得到的 channel，完成业务处理；

NIO 非阻塞网络编程原理分析.png

2. 线程模型概述

目前存在的线程模型有：
- 传统阻塞 IO 服务模型；
- Reactor 模式；根据 Reactor 的数量和处理资源池线程的数量不同，有3种典型的实现：
  - 单 Reactor 单线程；
  - 单 Reactor 多线程；
  - 主从 Reactor 多线程；
Netty 主要基于主从 Reactor 多线程模型做了一定的改进，其中主从 Reactor 多线程模型有多个 Reactor；

2.1 传统阻塞 IO 服务模型

特点：
- 采用阻塞 IO 模式获取输入的数据；
- 每个连接都需要独立的线程完成数据的输入，业务处理，数据返回；
问题：
- 当并发数很大，就会创建大量的线程，占用很大系统资源；
- 连接创建后，如果当前线程暂时没有数据可读，该线程会阻塞在 read 操作，造成线程资源浪费；

传统阻塞 IO 服务模型.png

黄色的框表示对象，蓝色的框表示线程，白色的框表示方法(API)；

2.2 Reactor 模式

Reactor 模式又称：反应器模式、分发者模式(Dispatcher)、通知者模式(Notifier)；
特点：
- 基于 IO 复用模型：多个连接共用一个阻塞对象，应用程序只需要在一个阻塞对象等待，无需阻塞等待所有连接。当某个连接有新的数据可以处理时，操作系统通知应用程序，线程从阻塞状态返回，开始进行业务处理；
- 基于线程池复用线程资源：不必再为每个连接创建线程，将连接完成后的业务处理任务分配给线程进行处理；
说明：
- 通过一个或多个输入同时传递给服务处理器 ServiceHandler 的模式(基于事件驱动)；
- 服务器端程序处理传入的多个请求，并将它们同步分派到相应的处理线程，因此 Reactor 模式也叫 Dispatcher 模式；
- Reactor 模式使用IO复用监听事件，收到事件后，分发给某个线程(进程)，这点就是网络服务器高并发处理关键；
核心组成：
- Reactor：即：服务处理器 ServiceHandler：在一个单独的线程中运行，负责监听和分发事件，分发给适当的处理程序来对 IO 事件做出反应。它就像公司的电话接线员，它接听来自客户的电话并将线路转移到适当的联系人；
- Handlers：即：事件处理器 EventHandler：处理程序执行 I/O 事件要完成的实际事件，类似于客户想要与之交谈的公司中的实际官员。Reactor 通过调度适当的处理程序来响应 I/O 事件，处理程序执行非阻塞操作；
优点：
- 响应快，不必为单个同步时间所阻塞，虽然 Reactor 本身依然是同步的；
- 可以最大程度的避免复杂的多线程及同步问题，并且避免了多线程/进程的切换开销；
- 扩展性好，可以方便的通过增加 Reactor 实例个数来充分利用 CPU 资源；
- 复用性好，Reactor 模型本身与具体事件处理逻辑无关，具有很高的复用性；
  
  Reactor 模式.png

黄色的框表示对象，蓝色的框表示线程，白色的框表示方法(API)；

2.3 单 Reactor 单线程模式

方案说明：
- Select 是前面 IO 复用模型介绍的标准网络编程 API，可以实现应用程序通过一个阻塞对象监听多路连接请求；
- Reactor 对象通过 select 监控客户端请求事件。收到事件后，通过 dispatch 进行分发；
- 如果建立连接请求，则 Acceptor 通过 accept 处理连接请求，然后创建一个 Handler 对象处理完成连接后的各种事件；
- 如果不是连接请求，则由 Reactor 分发调用连接对应的 handler 来处理；
- Handler 会完成：read → 业务处理 → send 的完整业务流程；
优点：
- 模型简单，没有多线程、进程通信、竞争的问题，全部都在一个线程中完成；
缺点：
- 性能问题，只有一个线程，无法完全发挥多核 CPU 的性能。Handler 在处理某个连接上的业务时，整个进程无法处理其他连接事件，很容易导致性能瓶颈；
- 可靠性问题，线程意外终止，或者进入死循环，会导致整个系统通信模块不可用，不能接收和处理外部消息，造成节点故障；
应用场景：
- 客户端的数量有限，业务处理非常快速。如：Redis 在业务处理的时间复杂度 O(1) 的情况；

单 Reactor 单线程模式.png

黄色的框表示对象，蓝色的框表示线程，白色的框表示方法(API)；

2.4 单 Reactor 多线程模式

方案说明：
- Reactor 对象通过 select 监控客户端请求事件，收到事件后，通过 dispatch 进行分发；
- 如果建立连接请求, 则 Acceptor 通过 accept 处理连接请求，然后创建一个 Handler 对象处理完成连接后的各种事件；
- 如果不是连接请求，则由 Reactor 通过 dispatch 分发调用连接对应的 Handler 来处理；
- Handler 只负责响应事件，不做具体的业务处理，通过 read 读取数据后，会分发给后面的 Worker 线程池的某个线程处理业务；
- Worker 线程池会分配独立线程完成真正的业务，并将结果返回给 Handler；
- Handler 收到响应后，通过 send 将结果返回给 Client（图中未标出）；
优点：
- 可以充分的利用多核 cpu 的处理能力；
缺点：
- 多线程数据共享和访问比较复杂；
- Reactor 处理所有的事件的监听和响应，在单线程运行、高并发场景容易出现性能瓶颈；
  
  单 Reactor 多线程模式.png
- 黄色的框表示对象，蓝色的框表示线程，白色的框表示方法(API)；

2.5 主从 Reactor 多线程模式

方案说明：
- Reactor 主线程 MainReactor 对象通过 select 监听连接事件。收到事件后，通过 Acceptor 处理连接事件；
- 当 Acceptor 处理连接事件后，MainReactor 将连接分配给 SubReactor（多个）；
- SubReactor 将连接加入到连接队列进行监听，并创建 Handler 进行各种事件处理；
- 当有新事件发生时， Subreactor 就会调用对应的 Handler 处理；
- Handler 先 read 读取数据，然后分发给后面的 Worker 线程池处理；
- Worker 线程池分配独立的 Worker 线程进行业务处理，并返回结果；
- Handler 收到响应的结果后，再通过 send 将结果返回给 Client；
- Reactor 主线程可以对应多个 Reactor 子线程，即 MainRecator 可以关联多个 SubReactor；
优点：
- 父线程与子线程的数据交互简单职责明确，父线程只需要接收新连接，子线程完成后续的业务处理；
- 父线程与子线程的数据交互简单，Reactor 主线程只需要把新连接传给子线程，子线程无需返回数据；
缺点：
- 编程复杂度较高；
应用场景：
- 这种模型在许多项目中广泛使用，包括 Nginx 主从 Reactor 多进程模型，Memcached 主从多线程，Netty 主从多线程模型的支持；

主从 Reactor 多线程模式.png

黄色的框表示对象，蓝色的框表示线程，白色的框表示方法(API)；

2.6 Netty 模型

Netty 主要基于主从 Reactors 多线程模型做了一定的改进，其中主从 Reactor 多线程模型有多个 Reactor；
方案说明：
- Netty 抽象出两组线程池： BossGroup 专门负责接收客户端的连接、WorkerGroup 专门负责网络的读写；
- BossGroup 和 WorkerGroup 类型都是 NioEventLoopGroup 。NioEventLoopGroup 相当于一个事件循环组，这个组中含有多个事件循环，每一个事件循环是 NioEventLoop；
- NioEventLoop 表示一个不断循环的执行处理任务的线程，每个 NioEventLoop 都有一个 Selector，用于监听绑定在其上的 socket 的网络通讯；
- 每个 Boss NioEventLoop 循环执行的步骤有 3 步：
  - 轮询 accept 事件；
  - 处理 accept 事件，与 Client 建立连接，生成 NioScocketChannel，并将其注册到某个 Worker NIOEventLoop 上的 Selector；
  - 处理任务队列的其他任务，即 runAllTasks；
- 每个 Worker NIOEventLoop 循环执行的步骤有 3 步：
  - 轮询 read、write 事件；
  - 在对应 NioScocketChannel上进行处理 IO 事件，即 read、write 事件；
  - 处理任务队列的其他任务，即 runAllTasks；
- 每个 WorkerNIOEventLoop 处理业务时，会使用 pipeline(管道)，pipeline 中包含了 channel，即通过 pipeline 可以获取到对应通道，管道中维护了很多的处理器；

Netty 模型.png

Netty | 第1章 Java NIO 网络编程《Netty In Action》

前言