耗费三年终于把Netty进阶之路文档给整理完了 -阿里资深架构师

Netty 基础概念

Netty 简介

Netty 是一个 NIO 客户端服务器框架,可快速轻松地开发网络应用程序,例如协议服务器和客户端。它极大地简化和简化了网络编程,例如 TCP 和 UDP 套接字服务器。

“快速简便”并不意味着最终的应用程序将遭受可维护性或性能问题的困扰。Netty 经过精心设计,结合了许多协议(例如FTP,SMTP,HTTP 以及各种基于二进制和文本的旧式协议)的实施经验。结果,Netty 成功地找到了一种无需妥协即可轻松实现开发,性能,稳定性和灵活性的方法。

在java界,netty无疑是开发网络应用的拿手菜。你不需要太多关注复杂的nio模型和底层网络的细节,使用其丰富的接口,可以很容易的实现复杂的通讯功能。
和golang的网络模块相比,netty还是太过臃肿。不过java类框架就是这样,属于那种离了IDE就无法存活的编码语言。
最新的netty版本将模块分的非常细,如果不清楚每个模块都有什么内容,直接使用netty-all即可。
单纯从使用方面来说,netty是非常简单的,掌握ByteBuf、Channel、Pipeline、Event模型等,就可以进行开发了。你会发现面试netty相关知识,没得聊。但Netty与其他开发模式很大不同,最主要的就是其异步化。异步化造成的后果就是编程模型的不同,同时有调试上的困难,对编码的要求比较高,因为bug的代价与业务代码的bug代价不可同日而语。
但从项目来说,麻雀虽小五脏俱全,从业务层到服务网关,以及各种技术保障,包括监控和配置,都是需要考虑的因素。netty本身占比很小。

本文中的案例涵盖了Netty 的启动和停止、内存、并发多线程、性能、可靠性、安全等方面,囊括了Netty绝大多数常用的功能及容易让人犯错的地方。在案例的分析过程中,还穿插讲解了Netty的问题定位思路、方法、技巧,以及解决问题使用的相关工具,对于在实际工作中用好Netty具有很大的帮助和启发作用。

目录

耗费三年终于把Netty进阶之路文档给整理完了 -阿里资深架构师_第1张图片

主要内容

第1章Netty服务端意外退出案例;本章通过两个简单的案例分析,引出了信号量、Java Daemon 线程及Netty 优雅退出相关知识。在实际项目中,知识往往是交叉在一起的,要想熟练掌握Netty服务端的启动和退出,编写更优雅和健壮的代码,需要重点掌握如下几个知识点:

(1)操作系统的信号量和JavaDeamon线程工作机制。

(2) Netty 的NioEventLoop线程工作原理。

(3) Netty 优雅退出相关的几个核心类库。

第2章Netty客户端连接池资源泄漏案例;本章分析了一个生产环境Netty客户端连接池资源泄漏案例,详细讲解了Netty 客户端创建的流程和工作原理,以及在实际项目中如何正确地实现连接池,避免发生并发安全和资源不当释放等问题。

耗费三年终于把Netty进阶之路文档给整理完了 -阿里资深架构师_第2张图片

第3章Netty内存池泄漏疑云案例;Netty内存池是一把双刃剑,使用得当会在很大程度上提升系统的性能,但是误用则会带来内存泄漏问题。从表面上看,只要遵循主动申请和释放原则即可,但是由于内存的申请和释放可能由Netty框架隐性完成,增加了内存管理的复杂性。

通过学习Netty 收发消息的ByteBuf 申请和释放机制,可以避免在项目中因误用ByteBuf而发生内存泄漏。在熟悉了ByteBuf的申请和释放机制后,通过对Netty内存池工作原理和关键源码的分析,读者可以更好地掌握Netty内存池的使用方法。

耗费三年终于把Netty进阶之路文档给整理完了 -阿里资深架构师_第3张图片

第4章ByteBuf故障排查案例;ByteBuf的申请和释放可能会跨Netty 的NioEventLoop 和业务线程,跨线程操作ByteBuf时一定要谨慎,防止发生并发安全和非法引用问题。另外,由于ByteBuf 的实现类非常多,不同的实现功能特性存在差异,用户在使用时一定要认真阅读API Doc 说明,必要时要看源码,防止误用导致出现功能和性能问题。

耗费三年终于把Netty进阶之路文档给整理完了 -阿里资深架构师_第4张图片

第5章Netty发送队列积压导致内存泄漏案例;本章通过发送队列积压案例,对Netty的消息发送原理和源码进行了深入讲解,熟悉了Netty 的发送队列工作机制、高低水位机制等,就可以在实际项目中更好地利用这些功能,提升基于Netty构建的通信框架的可靠性。

耗费三年终于把Netty进阶之路文档给整理完了 -阿里资深架构师_第5张图片

第6章API网关高并发压测性能波动案例;对于高并发接入的API网关类产品,需要谨慎处理消息的内存申请和释放,减少不必要的申请(例如透传类场景),同时要防止内存空间的浪费。借鉴Netty请求消息读取的内存申请策略和动态扩容机制,并用在实际项目中,可以得到较大的性能提升。

耗费三年终于把Netty进阶之路文档给整理完了 -阿里资深架构师_第6张图片

第7章Netty ChannelHandler并发安全案例;ChannelHandler是用户最常用的接口,掌握了ChannelHandler 及ChannelPipeline 工作原理,就清楚了什么时候该使用共享的ChannelHandler,什么时候该对ChannelHandler做并发保护。无论缺少保护还是过度保护,都会给业务带来副作用,甚至严重的功能或性能问题,因此ChannelHandler的并发安全性是非常重要的。

耗费三年终于把Netty进阶之路文档给整理完了 -阿里资深架构师_第7张图片

第8章车联网服务端接收不到车载终端消息案例;当Netty服务端接收不到消息时,首先需要检查是客户端没有发送到服务端,还是服务端没有读取消息。导致服务端无法读取消息的原因有很多,常见的包括GC导致的应用线程暂停、服务端的NioEventLoop线程被意外阻塞等。通过网络I/O线程和业务逻辑线程分离,可以实现双方的并行处理,提升系统的可靠性。对于用户而言,在编写代码时,始终需要考虑NioEventLoop线程是否会被业务代码阻塞,只有消除所有可能导致的阻塞点,才能保证程序稳定运行。

耗费三年终于把Netty进阶之路文档给整理完了 -阿里资深架构师_第8张图片

第9章Netty 3.X版本升级案例;就Netty而言,掌握线程模型的重要性不亚于熟练使用它的API和功能。很多时候业务遇到的功能、性能等问题,都是由于缺乏对Netty线程模型和原理的理解导致的。对Netty的版本升级需要从功能、兼容性和性能等多个角度进行综合考虑,切不可只盯着API和功能变更这个“芝麻”,而丢掉了线程模型和性能这个“西瓜”。API的变更会导致编译错误,但是性能下降却隐藏于无形之中,稍不留意就会中招。对于强调快速交付和敏捷开发的互联网类应用,升级的时候尤其要小心,不能功能调通后简单验证就匆忙,上线。

耗费三年终于把Netty进阶之路文档给整理完了 -阿里资深架构师_第9张图片

第10章Netty并发失效导致性能下降案例;Netty框架本身实现了高性能的网络读写操作,但是后端业务逻辑执行却是影响性能的关键要素,如果直接将复杂的业务逻辑操作放在I/O线程中完成,一些同步阻塞操作可能会导致I/O线程被阻塞。当把业务逻辑单独拆分到业务线程池中进行处理,与I/0线程隔离时,不同的业务线程模型对性能的影响也非常大。Netty 提供了默认的并行调度ChannelHandler的能力,但是如果使用不当,也会带来性能问题。对于业务自定义实现的线程池,如果追求更高的性能,就需要在消除或者减轻锁竞争上下工夫,线程绑定技术是一个不错的选择,但是也需要根据业务实际场景来实现,例如TCP长连接就可以使用Channelld做Key,如果是短连接,客户端的端口是随机变化的,则不适合使用Channelld。

耗费三年终于把Netty进阶之路文档给整理完了 -阿里资深架构师_第10张图片

第11章loT百万长连接性能调优案例;除了通过操作系统内核参数、Netty框架和JVM调优来提升单节点处理性能,还可以通过分布式集群的方式提升整个服务端的处理能力,把性能的压力分散到各个节点上。除了可以降低单个节点的风险,也可以利用云平台的弹性伸缩实现服务端的快速扩容,以应对突发的流量洪峰。如果每个节点负担过重,一旦某个节点宕机,流量会瞬间转移到其他节点,导致其他节点超负荷运行,系统的可靠性降低。通过“分布式+弹性伸缩”构建可平滑扩容的IoT服务端,是未来的一.种主流模式。

耗费三年终于把Netty进阶之路文档给整理完了 -阿里资深架构师_第11张图片

第12章静态检查修改不当引|起性能下降案例;静态检查本来是为了提升代码质量,但是由于盲目按照工具的建议做修改,对业务运行态的关键代码路径及上下文场景都不清楚,最终导致了严重的性能问题。由于Netty通常被用于高性能的通信框架,所以任何涉及性能的修改一定要谨慎,修改之后需要结合业务场景做相应的性能测试,以验证修改是否合理。

耗费三年终于把Netty进阶之路文档给整理完了 -阿里资深架构师_第12张图片

第13章Netty性能统计误区案例;当我们对服务调用时延进行精细化分析时,需要把Netty通信框架底层的处理耗时数据也采集并进行分析,由于Netty的I/O操作都是异步的,因此不能像传统同步调用那样做性能数据统计,需要注册性能统计监听器,在异步回调中完成计数。另外,Netty 的1/0线程池、消息发送队列等实现比较特殊,与传统的Tomcat等框架实现策略不同,因此Netty的关键性能数据采集不能照搬JDK和Tomcat的做法。

耗费三年终于把Netty进阶之路文档给整理完了 -阿里资深架构师_第13张图片

第14章gRPC的Netty HTTP/2实践案例;Netty 4.1 提供了完整的HTTP/2协议栈,用户可以基于Netty 4.1 框架快速开发支持HTTP/2的服务端应用。通过学习Netty HTTP/2协议栈在gRPC中的应用,可以掌握HTTP/2客户端和服务端的创建、HTTP/2消息的收发及序列化和反序列化等功能,学习和借鉴gRPC HTTP/2处理的优点,可以在实际项目中少走很多弯路。

耗费三年终于把Netty进阶之路文档给整理完了 -阿里资深架构师_第14张图片

第15章Netty事件触发策略使用不当案例;在通常情况下,在做功能测试或者并发压力不大时,HTTP请求消息可以一次性接收完成,此时ChannelHandler的channelReadComplete方法会被调用一次,但是当一个整包消息经过多次读取才能完成解码时,channelReadComplete方法就会被调用多次。如果业务的功能正确性依赖channelReadComplete方法的调用次数,当客户端并发压力大或者采用chunked 编码时,功能就会出错。因此,需要熟悉和掌握Netty 的事件触发机制及ChannelHandler的调用策略,这样才能防止在生产环境中“踩坑”。

耗费三年终于把Netty进阶之路文档给整理完了 -阿里资深架构师_第15张图片

第16章Netty流量整形应用案例;流量整形与流控的最大区别在于,流控会拒绝消息,流量整形不拒绝和丢弃消息,无论接收量多大,它总能以近似恒定的速度下发消息,跟变压器的原理和功能类似。

耗费三年终于把Netty进阶之路文档给整理完了 -阿里资深架构师_第16张图片

第17章Netty SSL应用案例;当存在跨网络边界的RPC调用时,往往需要通过TLS/SSL对传输通道进行加密,以防止请求和响应消息中的敏感数据泄露。通过Netty提供的SslHandler可以方便地实现单向和双向认证,对于有较高性能诉求的场景,可以使用OpenSSL引擎来提升SSL/TLS的通信性能。

耗费三年终于把Netty进阶之路文档给整理完了 -阿里资深架构师_第17张图片

第18章Netty HTTPS服务端高并发宕机案例;随着信息安全和个人隐私数据保护的加强,越来越多的RPC框架开始支持SSL/TLS传输通道加密,表面上增加数据加解密功能只对系统的性能有一些影响,但实际上系统的可靠性也会面临比较大的挑战,特别是高并发、低时延类的业务,一.旦发生批量服务调用超时,就会导致大量的SSL链路重建,在业务高峰期,如果服务端可靠性设计欠缺,很有可能宕机,导致业务中断。

针对HTTPS服务的优化,除了功能上加强可靠性设计,更需要从架构层面做系统性的优化,借鉴gRPC的设计理念,基于HTTP/2构建异步流式RPC调用是个不错的选择。

耗费三年终于把Netty进阶之路文档给整理完了 -阿里资深架构师_第18张图片

第19章MQTT服务接入超时案例;可靠性设计的关键在于对非预期异常场景的保护,应用层协议栈会考虑应用协议异常时通信双方应该怎么正确处理异常,但是对于那些不遵循协议规范实现的客户端,协议规范是无法强制约束对方的,特别是在物联网应用中,面对各种厂家的不同终端设备接入,服务端需要应对各种异常。只有可靠性做得足够好,MQTT服务才能更从容地应对海量设备的接入。

耗费三年终于把Netty进阶之路文档给整理完了 -阿里资深架构师_第19张图片

第20章Netty实践总结;在实际项目中仅仅会用Netty是远远不够的,由于Netty承担了RPC调用工作,一旦发生问题会导致RPC或者微服务调用失败,由此引起的业务中断后果很严重。除了实践,需要熟练掌握Netty的核心类库和关键调度流程,这样才能得心应手地解决各种问题。

耗费三年终于把Netty进阶之路文档给整理完了 -阿里资深架构师_第20张图片

本文适合架构师、设计师、开发工程师、测试工程师,以及对Java NIO框架、Netty感兴趣的其他相关人士阅读。

希望大家能够仔细揣摩本文的所有内容,争取都能够完全掌握甚至精通,这样子不至于在今后的社会中处于劣势状态,永远走在前面,也希望大家能够推陈出新,形成自己的一套知识框架。

大家加油努力学习吧!!

你可能感兴趣的:(java,网络,后端,学习,netty)