作者在某厂从事opendaylight-sdn的研究。opendaylight是基于OSGI架构的。所以最近一直在研究OSGI的优势。有兴趣的可以一起交流。
所有做Java服务器的都知道spring的两大优势:IOC与AOP。自从OSGI借鉴了spring dm以后,加入了blueprint。从此以后OSGI的IOC与spring的IOC就很相似了。那么OSGI的优势是什么呢?从一开始发布OSGI,引以为傲的两大特点:模块化与热部署(动态化)。使用bundle做模块化管理,osgi做的很成熟。但是热部署并没有想象的那么好用。
OSGI热部署存在哪些问题呢?
一、(基本概念,熟悉的人可以跳过)OSGi的核心组件Bundle,与java中jar包的差别就是元数据配置:
常用的Bundle元数据定义:
a) Bundle-Activator:定义Activator的实现全限定类名称,此类必须实现BundleActivator接口,并实现start和stop方法。当Bundle被OSGi容器启动或停止时就会去调用start和stop方法。Bundle-Activator并非是必须的,只有在需要初始化或是销毁资源时才有用,并且不推荐在start方法中进行复杂的处理,以免加重OSGi容器启动的负担。在Spring DM中,ApplicationContext的创建和销毁就是在extender中通过实现BundleActivator接口实现的。
b) Bundle-Classpath:有些jar文件是某个Bundle专属的,此时就应该把这些jar包设置到Bundle的classpath中。比如JDBC驱动等Jar包。
c) Bundle-ManifestVersion:设置Bundle所遵循的OSGi规范版本,目前情况下应该将该值设置为2,表示OSGi R4版本。
d) Bundle-Name:必须的,Bundle的名称,与Bundle-SymbolicName对应,Bundle-Name类似于name,而Bundle-SymbolicName类似于id。
e) Bundle-SymbolicName:必须的,Bundle的唯一标识名,一般推荐采用类包的机制,保证其唯一性。
f) Bundle-Version:必须的,Bundle的版本号,可用于在import-package中进行过滤。
g) Export-Package:Bundle对外公开的可被其他Bundle导入的包。
h) Import-Package:Bundle需要导入的包。Bundle自身使用到的所有依赖类必须被Import进来,否则就会在OSGi容器启动时抛出NoClassDefFoundException或ClassNotFoundException异常。
i) Require-Bundle:Bundle引用到的其他Bundle,应该将该属性值设置为被引用Bundle的Bundle-SymbolicName属性。
j) Fragment-Host:指定被附属的Bundle的Bundle-SymbolicName,在前面部分已经进行了详细的讨论。
二、OSGi组件的热部署
一般Java的热部署(在不重启JVM的情况下替换class文件)只能适用于方法体的修改,如果是更大的类结构的修改则需要自定义类加载器,而OSGi号称可以实现模块的热部署,但再实际用时也有不少注意事项:
OSGi最吸引人的特性除了模块化之外,就是动态化了,在我之前写的OSGi实战以及进阶两篇Opendoc中,都有相关的示例,但不知道大家有没有注意,在两篇Opendoc中都未提及到bundle本身的更新,而基本都是以新增服务实现的bundle以及停止服务时限的bundle为例,并且相对而言是个比较简单的例子,动态化在java界更明确的词也许是hot deployment,而hot deployment的实现并不容易,同样,即使你采用OSGi,但也不代表你的应用就具备了hot deployment的能力,在hot deployment上,完美的结果就是当更新完成后,新的执行请求就在新的代码逻辑上正确的执行,就像没发生过更新这回事样,但实际要做到这样的效果,远没这么容易,即使是基于OSGi也同样如此,No magic & no silver bullet,在本篇blog中我们就来具体的看看。
OSGi以Bundle为粒度来实现动态化,也就是说,如果要更新一个类,需要做的是更新整个Bundle,虽然比直接部署一个类麻烦了点,但也还算是不错的了,更新的方法有两种,一种是直接update该bundle(在MANIFEST.MF中增加Bundle-UpdateLocation来指定Bundle更新时所使用的文件);另外一种是先uninstall旧的bundle,然后再安装并启动新的bundle,无论是哪种方法,对于OSGi的应用而言,问题就在于package的类的改变以及bundle中OSGi服务实现的改变。
在Equinox中,当update一个Bundle时,如果这个Bundle中有对外暴露的package,如果这个Bundle是singleton模式,在update后仍然保留了同样的Bundle SymbolicName的话,其实是无法update成功的,会报出一个已经有相同的Singleton的Bundle存在,因此update这种方法仅适用于没有对外暴露package的bundle,如bundle没有对外暴露的package,Equinox则可正常的完成update过程,通常来讲,不对外暴露package的bundle都是一些对外暴露OSGi服务或者使用OSGi服务的类,对于对于暴露OSGi服务的类而言,在update过程中将会把依赖了此OSGi服务的OSGi组件的实例销毁(递归),等当前bundle更新并启动完毕后,会重新实例化该OSGi组件,同时将新的服务实现对象设置进去,对于仅使用其他Bundle提供的OSGi服务的类而言则很简单了,在启动此bundle时自然会设置进来,同时也不会影响外部bundle。
从上可见,通过update方式来完成Bundle的更新受到了很大的限制,毕竟大部分时候Bundle都是singleton的,并且在更新的时候也是不会去改变其Bundle SymbolicName。
因此,在Equinox中要实现Bundle的更新,通常都使用另外一种方法,就是uninstall,然后再install并start更新后的bundle。
当uninstall时,如果此bundle有对外暴露的package,并且有使用这些package的bundle,那么Equinox会保留此Bundle的classloader,也就是说原来使用了这些package的bundle仍将使用之前bundle的类,这也是为什么一个Bundle uninstall了之后,其他Bundle仍然可使用该Bundle中export的类,要想让Bundle对外export的package的引用也失效并且切换到新的bundle中export的package,必须执行refresh动作,refresh时equinox将会找到之前uninstall没完全成功的bundle,并递归找到使用了这个bundle中package的bundle,将这些bundle的状态也置为unresolve,并解除对之前uninstall没完全成功的bundle的classloader的引用,这样被uninstall的bundle的class就能被GC卸载了,在此之后,Equinox会尝试再次去resolve之前设置为unresolve的bundle,如果resolve不了则会调用这些bundle的stop方法,卸载其对外提供的OSGi服务以及引用的OSGi服务,同时将其状态置为INSTALLED;但在uninstall时,对OSGi服务的处理方法则不太一样,此Bundle中所引用的OSGi服务会被释放,对外提供的OSGi服务也会注销,这会造成引用了这些OSGi服务的Bundle的OSGi组件(递归)的实例会被销毁。
完成了以上的动作后,可以安装新的bundle,安装新bundle时,其实就是做了些解析bundle的事情,直到start bundle时,才开始resolve过程,所谓resolve就是找到bundle对外提供的package、需要引用的package等,同时创建bundle的classloader,在这个过程,equinox也会对系统中所有unresolved的bundle进行resolve,如能够resolve则将其状态转化为resolved,最后调用BundleContext的start来完成bundle的启动,这个过程仅仅是在配置了BundleActivator的情况下才有意义,DS则完成此bundle中引用的OSGi服务或对外提供OSGi服务的组件的条件的检测,以判断这些组件是否可实例化,如有新的OSGi服务可对外提供,那么DS会检测此时其他Bundle中的OSGi组件是否需要被激活,或者是否需要调用其他Bundle中OSGi组件的set方法。
根据以上这样的描述,可以看出,在OSGi中如果要更新没有对外提供package的Bundle是比较容易的,update以及uninstallàstart都是可选的方法,而对于对外提供了package的Bundle而言,则相对复杂很多,只能选择uninstallàrefreshàstart来完成。
从两个纬度来看OSGi的动态化,对于有export-package Bundle的更新,OSGi将会重建更新的bundle以及引用了此bundle的package的ClassLoader,而对于OSGi服务组件的更新,OSGi则会重新创建引用了此OSGi服务的组件的实例,并通过unset这样的方法通知原来的组件释放对OSGi服务的引用,同时通过set方法来给新创建的实例注入更新后的OSGi服务组件实例,其实这也是hot deployment中常见的对于引用变更的处理方法。
但从上面也可以看出,OSGi并没有提供对象状态保留的处理,这也就意味着,基本上在一次更新后,此次更新的Bundle以及相关的bundle因为classloader的重建,其对象的状态数据都丢失了,不过对于更新的仅为提供或引用OSGi服务的Bundle而言,则稍微好点,毕竟只是影响到了递归的引用了OSGi服务的组件,组件由于重建实例,而导致状态数据丢失,这个倒是可以通过将服务的引用数量设置为cardinality=”0..1”或cardinality=”0..n”来解决,设置成这样的条件后,即使引用了需要更新的Bundle中提供的OSGi服务,其OSGi服务组件实例也不会被重建,这对于需要将OSGi服务引用提供给外部使用的系统而言,无疑非常有帮助。
根据以上所述,可以看到,即使是基于OSGi,要实现hot deployment还是比较麻烦的,No magic and no silver bullet,J,尤其是要注意classloader的重建以及OSGi服务组件实例的重建,否则很有可能会造成在更新后系统的异常,在基于OSGi实现hot deployment时,要合理的规划系统,常见的一些较好的实践方法有:
l 接口和实现分离
避免因为实现逻辑要更新,而造成其他引用了此Bundle export出去接口所在的package而导致classloader的重建。
l 对于需要保留状态数据的OSGi服务尽量避免引用其他bundle export-package中的类
这也是为了避免这些类所在的bundle的classloader重建,毕竟OSGi服务组件类可以通过设置cardinality来保持组件实例的不变。
l 服务组件采用cardinality=”0..1”或cardinality=”0..n”来设置对OSGi服务的引用
避免服务组件实例的重建,毕竟这是个递归过程,影响还是很大的,而且谁也不敢肯定这么多的服务组件实例的重建是不是会造成系统的异常现象。
在这种情况下,尤其要注意unset中的处理以及当没有可用服务情况下的处理,避免出现NPE。
l 尽量采用OSGi服务组件服务方式,而不是直接的类方式
由于类方式的更新成本实在是比较的高,毕竟那需要classloader的重建,但是有些类确实是没办法的,对于这些类要尽量的保证稳态。
l 严格的版本控制
毕竟接口的更新影响是很大的,因为所有实现接口的类都得改变,因此需要严格的制定版本规范,并在引用package时按照版本规范指定相应的版本范围。
三、OSGi的问题及失败案例
淘宝HSF组件中间版本做过OSGi的尝试,最终还是因为它的使用它的代价大于好处而放弃。
在改造这个基础产品时,我看到的使用OSGi的问题是:
1. 对没有接触过OSGi的Java开发而言开发习惯绝对是巨大的挑战
通常都会使用Maven来管理Java工程,肯定很希望mvn eclipse:clean eclipse:eclipse就可以生成导进eclipse里没问题的project吧,但对于OSGi而言,如果是依赖外部的非OSGi Bundle的jar,那么则需要在META-INF/MANIFEST.MF里写明,也就是不是仅仅修改pom.xml就可以的;另外一点是OSGi对于其他bundle的jar的依赖,不是通过pom.xml去增加依赖,而是直接import package或require-bundle之类的,并且要求这个bundle是已经安装了的(可以想象,如果是业务型的应用,那得装多少bundle…),否则在eclipse之类的ide里再去import什么的时候会找不到,同时为了确保mvn clean package之类的还是能用,因此会被逼在开发的时候要同时维护pom、MANIFEST.MF。
上面的这两个问题要解决好,可以通过开发IDE插件,但这个插件是不太好做的…
而OSGi的classloader机制则会给初入门的带来很多疑惑,会觉得经常碰到各种各样的class找不到等问题。
测试也是个麻烦,因为得把所有的bundle都装进framework,否则单元测试就得全部靠mock了。
另外一点在文件的依赖上就更折腾了,OSGi只能是通过require-bundle来去获取需要依赖的文件,否则是做不了的。
2. 动态化
OSGi确实具备了很强的动态化机制,但这里的要求是必须对OSGi bundle/OSGi Declarative Services的生命周期管理机制非常清楚,否则设计出来的系统其实是完全不可动态化的,具体的细节大家可以看看我的另一篇文章:《OSGI 动态化深入分析》
而仅仅借助OSGi的动态化机制,其实是不足以实现真正的热部署的,这里的一个原因是通常代码里是带状态信息的,或者说一些全局变量信息,而OSGi的替换其实主要是通过创建新对象实例,然后替换引用的方式来实现,这也就意味着对于有状态信息的,得自己处理好状态的保存以及还原,否则是会有问题的,我而要做到这一点 系统变得超级复杂。
另外还有个更麻烦的是,如果应用是OSGi和非OSGi混用,又要做动态化,那就得让非OSGi拿到的只是一个OSGi里对象的一个假的引用,以便随时替换,这个改造起来就更麻烦了。
并且要做到真正的完全动态是不行的,也就意味着动态化这特性基本就是个玩具,如果是为了隔离可以自己做一个简单的classloader隔离机制。
总结哪些场景选择OSGi时
如果你的场景不是对动态化(并且是无状态的那种动态化)有强烈的需求,那不要选OSGi。
仅仅是为了模块化,隔离这些,还不如自己做一个简单的实现,并且可以遵守现在的开发习惯,不要去挑战众多人的开发习惯和通用的知识体系,那对系统维护来说绝对会是一个灾难,只能说或许等到将来Java从语言级支持了可能才OK。如果是开源的项目使用了osgi框架,例如Apache的opendaylight。那就另说。
至于为什么众多的AS(例如Weblogic、JBoss)这些会选择基于OSGi,我觉得有一点很重要的是在没有选OSGi之前,他们对外提供的(销售的)版本是打包性质的,不能由用户来选择,这显然对销售会有限制,而如果能提供插件样的选择,则是一件好事,另外一个选择的原因很有可能是他们认为OSGi会成为语言级的标准,那意义就比较大了,不过可惜从目前来看,这估计不太可能。
至于众多人爱的eclipse,为什么选用OSGi,很大程度是看中了OSGi的动态化,以及减少了自己制定一个插件标准的折腾,eclipse这类插件的场景相对是比较好发挥动态化的(因为插件之间的交互依赖通常不多),尤其是在新装/停止一个插件时,更新会比较麻烦一些。