正文开始前的废话:
这里的程序即包括b/s的web application,也包括standalone的类c/s的java application。
为什么要自我重启?
场景1:分布式环境中,一般会有很多应用(即包括c/s的java application,又有b/s的web application)部署在不同的环境中,为了管理方便,通常会把一些公用的配置,比如:报警发邮件用的邮箱账号/密码/smtp信息,公用的ftp账号信息,甚至jdbc的连接串信息等,统一放在某个位置(共享的网络存储目录、redis缓存、database、zookeeper、远程service中均可),这样管理起来比较方便。象邮箱账号这些信息还好,各应用订阅配置的变化,发现变化时,如果是spring环境,直接调用applicationContext.refresh(),配置就会重新刷新。但是对于数据源这种特殊配置,就比较难弄了,要考虑连接池中已经连接成功的connection对象,已经通过旧的datasource查出来的数据,跟旧datasource关联的sqlSesstionFactory,Mapper实例等等,要全部换血,很难保证,最好的办法就是让程序重启。
场景2:写程序嘛,有隐藏的bug在所难免,绝对零bug的程序还是很罕见的,如果随着程序运行时间的不断增加,程序性能越来越差或假死,需要重启一下,通常需要远程连撞到linux,敲命令kill进程,再重启java application,这对于不熟悉linux的新手管理人员,一来可能比较陌生,二来未必有执行权限,所以通过一个友好的监控管理界面,点击下重启按钮,让指定的程序重启,会更容易让人接受。
正文开始:
一、程序如何知道自己需要重启?
显然,如果有一个程序,用户想正常关闭的时候,程序又自动重启,如此循环,这就成关不掉的恶意程序了。
所以,程序应该由单独的进程监听并接收特定的指令,而不影响用户正常关闭程序,思路:
程序启动时,生成一个唯一的uuid(或其它标识,只要保证全局唯一就行),然后向zookeeper注册一个临时节点。
比如:
/app/uuid-1
这样监控中心,只要扫描/app下有多少临时节点,就知道当前运行了哪些应用。
管理员从监控中心希望将某个应用重启时,可以向zookeeper写一个节点
/command/uuid-1 节点的内容,约定为:restart
应用启动后,监听/command/uuid-1 节点的数据变化,一旦发现有restart的数据内容,即认为收到了重启指令,然后就按下面的处理,自我毁灭,重新投胎转世。
二、java application的重启
网上的样例代码:
1 2 3 4 5 6 7 8 9 10 11 12 13 |
|
可以改进的地方:
a) sleep(10000) 即等待10秒,等自己的『分身』启动好以后,再把自己的『真身』给杀死。这里的10秒,其实也是拍脑袋定的,如果追求完美的话,理论上讲,只要系统进程中出现了新启动的『分身』,就可以将『真身』人道毁灭了。
问题:如果知道『分身』已经启动完成?
答案:java可以获取 jps -l 的输出,知道当前所有的java进程,这样就可以知道指定的应用有没有启动。可以在重启前,获取一次jps -l 的输出,重启后,再执行一次jps -l 的输出,对比二次输出,如果发现多出一个新的指定进程名,就表示『分身』启动完成,可以结束自己。
附:java代码获取jps输出
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 |
|
b) java -jar xxx.jar 这里也不太好,一是xxx.jar是字符串,编译期发现不了错误,二是路径是相对路径,就算启动成功了,最终jps显示的进程名是jar,看不出实际对应的是啥程序(详情可参考 设置 java -jar 的进程显示名称 ),可以代码获取当前程序的实际路径
1 2 3 4 5 6 7 |
|
OSUtil代码从这里获取
三、 web application的重启
这里只讨论部署在jboss上的解决方案,
jboss CLI 命令行接口学习(适用JBOSS EAP 6.2+)
Jboss EAP:native management API学习
这二篇文章中,已经给出了用编码或shell命令来控制jboss的方法,所以web application的按需重启思路就有了: