阿里巴巴集团有国内最大规模的Java系统,几万台的应用服务器规模也空前庞大,目前主要使用的应用服务器有Tomcat,JBoss和Jetty三种。阿里巴巴自从2004年开始转向Java技术平台后,先后经历了从WebLogic到Jboss和Tomcat迁移。到了2008年,随着更为轻量级的Tomcat和Jetty容器的迅速发展,越来越多的应用系统开始尝试使用Tomcat或Jetty作为底层应用服务器。2013年上半年,阿里巴巴集团中间件成立了独立的应用服务器团队,主要面向整个集团进行应用服务器相关的工作,目前在公司内部主推Tomcat服务器。
本文将从中间件团队在2013年双十一大促前针对应用服务器上进行的工作展开,重点讲解Tomcat监控诊断工具,以及Pandora隔离技术两方面内容。更多关于应用服务器的内容,可以到中间件团队博客( http://jm.taobao.org)上查看。
Tomcat Monitor模块是一个Tomcat的监控和诊断模块,提供了一些基本的工具,可以对Tomcat的连接池、线程、内存、类加载以及JVM相关等进行监控和诊断。Tomcat Monitor的出现,解决了广大开发人员无法快速定位线上问题的尴尬问题,同时也帮助开发人员能够通过简单且统一的命令行工具来排查问题、查看程序运行时状态,而不需要使用各种包括jmap、jstat和BTrace等工具。
Tomcat Monitor模块集成于Tomcat服务器内部,能够对线程、连接池、内存和类加载等方面进行详细且实时的监控与诊断。
图6-1-查看Tomcat连接基本状态
图6-2-检测慢连接
图6-3-线程死锁检测
可以看出,线程 pool-1-thread-1 和 pool-1-thread-2 发生死锁.下面两行清晰描述了死锁原因:
thread-2 阻塞在被 thread-1 锁住的对象 java.lang.String@114a3c6 上,
thread-1 阻塞在被 thread-2 锁住的对象 java.lang.String@c4cee 上,
两个线程互相等待, 导致死锁.
输出结果还显示了发生死锁的线程堆栈, 以便开发人员进一步排查发生死锁的原因.
显示最近一段时间 cpu% 持续过高的线程列表, 及其最近一次统计的 cpu%.
图6-6-检测类加载情况
针对应用服务器的监控和诊断,后续的发展规划是在目前Tomcat Monitor的基础上,集成其他诸如 HouseMD这样优秀的Java监控与诊断工具,使得不同的工具能够以一种统一方式给开发人员使用。同时,还会和公司内部已经成熟的监控报警系统打通,作为数据提供方来帮助更深入的监控应用的运行情况。
Pandora,中文名潘多拉,是阿里中间件团队打造的,基于HSF隔离技术构建的全新一代隔离容器。从解决二方包依赖冲突出发,致力于统一管理通用的二方包,包括方便的二方包升级管理,监控和管理,建立统一的二方包扩展编程方式等。基于Pandora容器基础上进行改造而来的Pandora-Framework,是一个类OSGi的模块化运行框架。它的产出,使得OSGi这个一直以来隐藏在应用服务器和IDE工具中的神秘技术,第一次在生产环境中走入了我们的前台应用系统。2013年9月在共享业务交易流程系统上线以来,目前将逐步应用于整个阿里交易流程系统,构建了交易系统的模块化运行环境。
功能介绍
这里重点讲解下Pandora容器针对交易系统在双十一之前进行的模块化改造。谈到模块化,相信很多读者都会在第一时间联想到OSGi。没错,OSGi(JSR 291)是Open Services Gateway initiative的缩写,为系统的模块化开发定义了一个基础规范和架构模型。迄今为止,在一些著名的IDE产品(Eclipse是第一个也是目前最成熟的OSGi实践者)和应用服务器厂商(IBM、BEA、Oracle)中都已经采用了OSGi来创建“微内核与插件”的软件架构,这样一来,这些IDE和容器就可以被更好的模块化,并且可以在运行时被动态装配。
显然,模块化和动态化,是OSGi最显著的两大特性。模块化,尤其是他的隔离机制,基本得到了大家的认可,但是针对动态化这个特性,是公认的OSGi中最具争议的地方。
因此,Panodrar容器废弃了OSGi框架,只是引入了OSGi隔离机制的思想,自己重新实现了ClassLoader的隔离,形成了一个全新的轻量级的隔离容器。如图6-7所示。
图6-7-Pandora体系结构
下面重点从Bundle和类加载两方面来讲解下Pandora针对业务模块化的改造。
首先引入了Bundle的概念,使得业务系统内部逻辑能够按照bundle为单元进行组织。同时提供了Maven插件用于bundle的生成,使得一个标准的Maven Web工程能够按照子工程为单位进行无缝迁移。
类加载机制是模块化隔离的核心。根据业务系统模块化的需要,我们需要设计一种既要使bundle具有严格的私密性,又要使bundle和主应用以及bundle之间具有灵活的互通性,因此重新设计了类加载机制。大体的类加载可以分为以下三步:
第一步:尝试从import中加载。 Pandora在加载bundle的类的时候,首先会判断当前类是否需要从其他bundle中获取一些共享类。 第二步:尝试从bundle自己类路径下进行类加载。 Bundle的私有性需求已经规定了,每个bundle都应该有能力和外部业务系统环境隔离开来,因此一些三方包的加载,bundle自身目录下的都会优先于业务系统环境。 第三步:尝试从外部三方容器中加载。 如果bundle声明了需要从外部三方容器的biz classloader中来加载这个类,那么会尝试从这个biz classloader中去加载。
总的来说,Pandora的这次改造,伴随着阿里交易系统第三次大规模的改造升级过程,不仅满足了业务模块化改造的需求,同时也使得Pandora容器在原有解决二方包问题的基础上,新增解决业务系统模块化改造需求的能力。传统IT公司的出现与发展远早于互联网,因此,很多早期的应用服务器,包括WebLogic和WebSphere在内,更多都是为大型的单机的系统设计,尤其是从运维角度来说,都已经无法满足互联网时代大规模分布式系统。越来越多的互联网应用转移到了以Tomcat、Jboss和Jetty等为代表的轻量级的应用服务器上。然而,随着互联网应用多样性的不断发展,分布式系统规模的不断增大,尤其是移动互联网时代的到来,目前的主流服务器可能都无法满足未来日益变化需求,因此我们还正在探索下一代应用服务器的路上。
系列文章:
《 中间件技术及双十一实践之中间件总体介绍》 http://jm-blog.aliapp.com/?p=3359
《 中间件技术及双十一实践之软负载篇》 http://jm-blog.aliapp.com/?p=3450
《 中间件技术及双十一实践·服务框架篇》 http://jm-blog.aliapp.com/?p=3462
《 中间件技术及双十一实践·EagleEye篇》 http://jm-blog.aliapp.com/?p=3465
《中间件技术及双十一实践·消息中间件篇》http://jm-blog.aliapp.com/?p=3483
《中间件技术及双十一实践·数据篇》http://jm-blog.aliapp.com/?p=3490
《中间件技术及双十一实践·应用服务器篇》http://jm-blog.aliapp.com/?p=3495
如果觉得内容还行,请分享给更多的人…
转发:中间件技术及双十一实践之中间件总体介绍
转发:中间件技术及双十一实践之软负载篇
转发:中间件技术及双十一实践·服务框架篇
转发:中间件技术及双十一实践·EagleEye篇
转发:中间件技术及双十一实践·消息中间件篇