通信协议:通信双方事先商量好的暗语。在TCP网络编程中,发送方和接收方的数据包格式都是二进制,发送方先将对象转化为二进制流发送给接收方,接收方获取二进制流后根据协议解析成对象。
当前通用的协议包括:HTTP、HTTPS、JSON-RPC、FTP、IMAP、Protobuf等。考虑到通信协议兼容性好、易于维护,在满足业务场景和性能需求时推荐采用通用协议,通信协议不满足要求时可以自定义通信协议。自定义通信协议的好处在于:
一个完备的通信协议需要具备以下基本要素:
以下是一个较为通用的协议示例:
+---------------------------------------------------------------+
| 魔数 2byte | 协议版本号 1byte | 序列化算法 1byte | 报文类型 1byte |
+---------------------------------------------------------------+
| 状态 1byte | 保留字段 4byte | 数据长度 4byte |
+---------------------------------------------------------------+
| 数据内容 (长度不定) |
+---------------------------------------------------------------+
Netty提供了丰富的编解码抽象类,用于我们更为方便地基于这些抽象类扩展实现自定义通信协议。
Netty编码类抽象类:
Netty解码类抽象类:
Netty中的编解码器分为一次编解码和二次编解码。以解码为例,一次解码器用于解决TCP拆包/粘包问题,解析得到字节数据。如果需要对解析后的字节数据做对象转换,需要使用二次解码器。同理,编码器是相反过程。
抽象编码类是ChannelOutboundHandler的抽象实现,处理的是出站数据
MessageToByteEncoder类
MessageToByteEncoder重写了ChannelOutboundHandler的write()方法,该方法内的encode()抽象方法用于数据编码,仅需要继承MessageToByteEncoder类并实现encode()即可自定义编码逻辑。
@Override
public void write(ChannelHandlerContext ctx, Object msg, ChannelPromise promise) throws Exception {
ByteBuf buf = null;
try {
if (acceptOutboundMessage(msg)) { // 1. 消息类型是否匹配
@SuppressWarnings("unchecked")
I cast = (I) msg;
buf = allocateBuffer(ctx, cast, preferDirect); // 2. 分配 ByteBuf 资源
try {
encode(ctx, cast, buf); // 3. 执行 encode 方法完成数据编码
} finally {
ReferenceCountUtil.release(cast);
}
if (buf.isReadable()) {
ctx.write(buf, promise); // 4. 向后传递写事件
} else {
buf.release();
ctx.write(Unpooled.EMPTY_BUFFER, promise);
}
buf = null;
} else {
ctx.write(msg, promise);
}
} catch (EncoderException e) {
throw e;
} catch (Throwable e) {
throw new EncoderException(e);
} finally {
if (buf != null) {
buf.release();
}
}
}
write()方法的主要逻辑如下:
编码器无需关注拆包/粘包问题,以下为一个自定义编码类:
public class StringToByteEncoder extends MessageToByteEncoder<String> {
@Override
protected void encode(ChannelHandlerContext channelHandlerContext, String data, ByteBuf byteBuf) throws Exception {
byteBuf.writeBytes(data.getBytes());
}
}
MessageToMessageEncoder类
与MessageToByteEncoder类似,同样可以继承MessageToMessageEncoder类并实现encode()方法实现自定义编码。但是MessageToMessageEncoder用于将一个格式的消息转换为另一个格式的消息,这里的第二个Message可以是任意一个对象,如果该对象是ByteBuf类型,MessageToMessageEncoder的实现逻辑基本上与MessageToByteEncoder一致
MessageToMessageEncoder的实现类包括:StringEncoder、LineEncoder、Base64Encoder等。以StringEncoder类为例,查看encode()方法:将CharSequence类型转换为ByteBuf类型,结合StringDecoder可以实现String类型的编解码。
@Override
protected void encode(ChannelHandlerContext ctx, CharSequence msg, List<Object> out) throws Exception {
if (msg.length() == 0) {
return;
}
out.add(ByteBufUtil.encodeString(ctx.alloc(), CharBuffer.wrap(msg), charset));
}
抽象解码类是ChannelInboundHandler的抽象类实现,处理的是入站数据。解码器需要考虑拆包/粘包问题。由于接收方可能没有收到完整消息,解码框架需要对入站的数据做缓冲操作,直至收到完整的消息。
ByteToMessageDecoder类
public abstract class ByteToMessageDecoder extends ChannelInboundHandlerAdapter {
protected abstract void decode(ChannelHandlerContext ctx, ByteBuf in, List<Object> out) throws Exception;
protected void decodeLast(ChannelHandlerContext ctx, ByteBuf in, List<Object> out) throws Exception {
if (in.isReadable()) {
decodeRemovalReentryProtection(ctx, in, out);
}
}
}
ByteToMessageDecoder类中包含decode()抽象方法,可以通过继承ByteToMessageDecoder并实现该方法完成自定义解码。decode()在调用时需要传入ByteBuf以及用来添加解码后消息的List列表。由于拆包/粘包问题,ByteBuf中可能包含多个有效报文,或者不够一个完整的报文,因此Netty会重复会调用decode()方法,直到解码出新的完整报文可以添加到List中,或者ByteBuf中没有更多可读的数据为止。如果List不为空,将会传递给下一个ChannelInboundHandler。
ByteToMessageDecoder中还有一个decodeLast()方法,该方法会在Channel关闭后被调用一次,主要用于处理ByteBuf最后剩余的字节数据。Netty中decodeLast()方法默认只是简单调用一下decode()方法,有特殊也无需求也可以重写decodeLast()。
ByteToMessageDecoder有一个抽象子类ReplyingDecoder,他封装了缓冲区的管理,读取缓冲区时无需再对字节长度进行校验。因为如果没有足够长度的字节数据,ReplyingDecoder会终止解码操作。一般不推荐使用ReplyingDecoder类,因为其性能相较直接使用ByteToMessageDecoder要慢。
MessageToMessageDecoder类
该类的作用与ByteToMessageDecoder类似,都是将一种消息解码为另一种消息,但是第一个Message可以是任意一个对象,而且MessageToMessageDecoder不会对数据报文进行缓存。推荐先使用ByteToMessageDecoder解析TCP协议,解决拆包/粘包问题,然后用MessageToMessageDecoder做数据对象的转换。