Netty源码分析——拆包器之LengthFieldBasedFrameDecoder

基于Netty源代码版本：netty-all-4.1.33.Final

前言

什么是粘包、拆包
粘包、拆包是Socket编程中最常遇见的一个问题，本文来研究一下Netty是如何解决粘包、拆包的，首先我们从什么是粘包、拆包开始说起：

TCP是个"流"协议，所谓流，就是没有界限的一串数据，TCP底层并不了解上层业务的具体含义，它会根据TCP缓冲区的实际情况进行包的划分，所以在业务上：

一个完整的包可能会被TCP拆分为多个包进行发送（拆包）

多个小的包也有可能被封装成一个大的包进行发送（粘包）
这就是所谓的TCP粘包与拆包

下图演示了粘包、拆包的场景：

基本上有四种情况：

Data1、Data2都分开发送到了Server端，没有产生粘包与拆包的情况
Data1、Data2数据粘在了一起，打成了一个大的包发送到了Server端，这种情况就是粘包
Data1被分成Data1_1与Data1_2，Data1_1先到服务端，Data1_2与Data2再到服务端，这种情况就是拆包
Data2被分成Data2_1与Data2_2，Data1与Data2_1先到服务端，Data2_2再到服务端，同上，这也是一种拆包的场景

粘包、拆包产生的原因
上面我们详细了解了TCP粘包与拆包，那么粘包与拆包为什么会发生呢，大致上有三种原因：

应用程序写入的字节大小大于Socket发送缓冲区大小
进行MSS大小的TCP，MSS是最大报文段长度的缩写，是TCP报文段中的数据字段最大长度，MSS=TCP报文段长度-TCP首部长度
以太网的Payload大于MTU，进行IP分片，MTU是最大传输单元的缩写，以太网的MTU为1500字节

粘包、拆包解决策略
由于底层的TCP无法理解上层的业务数据，所以在底层是无法保证数据包不被拆分和重组的，这个问题只能通过上层的应用协议栈设计来解决，根据业界的主流协议的解决方案，可以归纳如下：

消息定长，例如每个报文的大小固定为200字节，如果不够空位补空格
包尾增加回车换行符进行分割，例如FTP协议
将消息分为消息头和消息体，消息头中包含表示长度的字段，通常涉及思路为消息头的第一个字段使用int32来表示消息的总长度
更复杂的应用层协议

Netty中内置了多个编解码器，可以很简单的处理包界限问题。典型的几个：

LengthFieldBasedFrameDecoder
通过在包头增加消息体长度的解码器，解析数据时首先获取首部长度，然后定长读取socket中的数据。
LineBasedFrameDecoder
换行符解码器，报文尾部增加固定换行符rn，解析数据时以换行符作为报文结尾。
DelimiterBasedFrameDecoder
分隔符解码器，使用特定分隔符作为报文的结尾，解析数据时以定义的分隔符作为报文结尾
FixedLengthFrameDecoder
定长解码器，这个最简单，消息体固定长度，解析数据时按长度读取即可

正文

本篇文章主要是介绍使用LengthFieldBasedFrameDecoder解码器自定义协议。通常，协议的格式如下:

LengthFieldBasedFrameDecoder是netty解决拆包粘包问题的一个重要的类，主要结构就是header+body结构。我们只需要传入正确的参数就可以发送和接收正确的数据，那么重点就在于这几个参数的意义。下面我们就具体了解一下这几个参数的意义。先来看一下LengthFieldBasedFrameDecoder主要的构造方法：

public LengthFieldBasedFrameDecoder(
        int maxFrameLength,
        int lengthFieldOffset, int lengthFieldLength,
        int lengthAdjustment, int initialBytesToStrip) {
    this(
            maxFrameLength,
            lengthFieldOffset, lengthFieldLength, lengthAdjustment,
            initialBytesToStrip, true);
}

那么这几个重要的参数如下：

maxFrameLength：最大帧长度。也就是可以接收的数据的最大长度。如果超过，此次数据会被丢弃。
lengthFieldOffset：长度域偏移。就是说数据开始的几个字节可能不是表示数据长度，需要后移几个字节才是长度域。
lengthFieldLength：长度域字节数。用几个字节来表示数据长度。
lengthAdjustment：数据长度修正。因为长度域指定的长度可以使header+body的整个长度，也可以只是body的长度。如果表示header+body的整个长度，那么我们需要修正数据长度。
initialBytesToStrip：跳过的字节数。如果你需要接收header+body的所有数据，此值就是0，如果你只想接收body数据，那么需要跳过header所占用的字节数。

下面我们根据几个例子的使用来具体说明这几个参数的使用。

LengthFieldBasedFrameDecoder 的用法

需求1

长度域为2个字节，我们要求发送和接收的数据如下所示：

发送的数据 (14 bytes)          接收到数据 (14 bytes)
+--------+----------------+      +--------+----------------+
| Length | Actual Content |----->| Length | Actual Content |
|  12    | "HELLO, WORLD" |      |   12   | "HELLO, WORLD" |
+--------+----------------+      +--------+----------------+

留心的你肯定发现了，长度域只是实际内容的长度，不包括长度域的长度。下面是参数的值：

lengthFieldOffset=0：开始的2个字节就是长度域，所以不需要长度域偏移。
lengthFieldLength=2：长度域2个字节。
lengthAdjustment=0：数据长度修正为0，因为长度域只包含数据的长度，所以不需要修正。
initialBytesToStrip=0：发送和接收的数据完全一致，所以不需要跳过任何字节。

需求2

长度域为2个字节，我们要求发送和接收的数据如下所示：

发送的数据 (14 bytes)        接收到数据 (12 bytes)
+--------+----------------+      +----------------+
| Length | Actual Content |----->| Actual Content |
|  12    | "HELLO, WORLD" |      | "HELLO, WORLD" |
+--------+----------------+      +----------------+

参数值如下：

lengthFieldOffset=0：开始的2个字节就是长度域，所以不需要长度域偏移。
lengthFieldLength=2：长度域2个字节。
lengthAdjustment=0：数据长度修正为0，因为长度域只包含数据的长度，所以不需要修正。
initialBytesToStrip=2：我们发现接收的数据没有长度域的数据，所以要跳过长度域的2个字节。

需求3

长度域为2个字节，我们要求发送和接收的数据如下所示：

BEFORE DECODE (14 bytes)         AFTER DECODE (14 bytes)
+--------+----------------+      +--------+----------------+
| Length | Actual Content |----->| Length | Actual Content |
| 14     | "HELLO, WORLD" |      |  14    | "HELLO, WORLD" |
+--------+----------------+      +--------+----------------+

留心的你肯定又发现了，长度域表示的长度是总长度也就是header+body的总长度。参数如下：

lengthFieldOffset=0：开始的2个字节就是长度域，所以不需要长度域偏移。
lengthFieldLength=2：长度域2个字节。
lengthAdjustment=-2：因为长度域为总长度，所以我们需要修正数据长度，也就是减去2。
initialBytesToStrip=0：我们发现接收的数据没有长度域的数据，所以要跳过长度域的2个字节。

需求4

长度域为2个字节，我们要求发送和接收的数据如下所示：

BEFORE DECODE (17 bytes)                      AFTER DECODE (17 bytes)
+----------+----------+----------------+      +----------+----------+----------------+
| meta     |  Length  | Actual Content |----->| meta | Length | Actual Content |
|  0xCAFE  | 12       | "HELLO, WORLD" |      |  0xCAFE  | 12       | "HELLO, WORLD" |
+----------+----------+----------------+      +----------+----------+----------------+

我们发现，数据的结构有点变化，变成了 meta+header+body的结构。meta一般表示元数据，魔数等。我们定义这里meta有三个字节。参数如下：

lengthFieldOffset=3：开始的3个字节是meta，然后才是长度域，所以长度域偏移为3。
lengthFieldLength=2：长度域2个字节。
lengthAdjustment=0：长度域指定的长度位数据长度，所以数据长度不需要修正。
initialBytesToStrip=0：发送和接收数据相同，不需要跳过数据。

需求5

长度域为2个字节，我们要求发送和接收的数据如下所示：

BEFORE DECODE (17 bytes)                      AFTER DECODE (17 bytes)
+----------+----------+----------------+      +----------+----------+----------------+
|  Length  | meta     | Actual Content |----->| Length | meta | Actual Content |
|   12     |  0xCAFE  | "HELLO, WORLD" |      |    12    |  0xCAFE  | "HELLO, WORLD" |
+----------+----------+----------------+      +----------+----------+----------------+

我们发现，数据的结构有点变化，变成了 header+meta+body的结构。meta一般表示元数据，魔数等。我们定义这里meta有三个字节。参数如下：

lengthFieldOffset=0：开始的2个字节就是长度域，所以不需要长度域偏移。
lengthFieldLength=2：长度域2个字节。
lengthAdjustment=3：我们需要把meta+body当做body处理，所以数据长度需要加3。
initialBytesToStrip=0：发送和接收数据相同，不需要跳过数据。

需求6

长度域为2个字节，我们要求发送和接收的数据如下所示：

BEFORE DECODE (16 bytes)                    AFTER DECODE (13 bytes)
+------+--------+------+----------------+      +------+----------------+
| HDR1 | Length | HDR2 | Actual Content |----->| HDR2 | Actual Content |
| 0xCA | 0x000C | 0xFE | "HELLO, WORLD" |      | 0xFE | "HELLO, WORLD" |
+------+--------+------+----------------+      +------+----------------+

我们发现，数据的结构有点变化，变成了 hdr1+header+hdr2+body的结构。我们定义这里hdr1和hdr2都只有1个字节。参数如下：

lengthFieldOffset=1：开始的1个字节是长度域，所以需要设置长度域偏移为1。
lengthFieldLength=2：长度域2个字节。
lengthAdjustment=1：我们需要把hdr2+body当做body处理，所以数据长度需要加1。
initialBytesToStrip=3：接收数据不包括hdr1和长度域相同，所以需要跳过3个字节。

LengthFieldBasedFrameDecoder 源码剖析

实现拆包抽象

在前面的文章中我们知道，具体的拆包协议只需要实现

void decode(ChannelHandlerContext ctx, ByteBuf in, List

Netty源码分析——拆包器之LengthFieldBasedFrameDecoder

前言

正文

LengthFieldBasedFrameDecoder 的用法

需求1

需求2

需求3

需求4

需求5

需求6

LengthFieldBasedFrameDecoder 源码剖析

实现拆包抽象

获取frame长度

获取需要待拆包的包大小

跳过指定字节长度

抽取frame

自定义解码器

协议实体的定义

服务器端

服务端的实现

自定义解码器MyProtocolDecoder

服务端Hanlder

客户端和客户端Handler

客户端编码器

客户端Handler

你可能感兴趣的:(Netty源码分析——拆包器之LengthFieldBasedFrameDecoder)