storm进程正常运行一段时间shut down,运维方式

storm启动一段时间后,无征兆的停止了,然后nimbus,supervisor,ui所有的worker都stop了。

我用的storm是0.8.2版本的

 

nimbus中留下的log如下

2014-02-19 17:05:35 nimbus [INFO] Shutting down master
2014-02-19 17:05:35 ClientCnxn [INFO] EventThread shut down
2014-02-19 17:05:35 ZooKeeper [INFO] Session: 0x14395fa892b0032 closed
2014-02-19 17:05:35 nimbus [INFO] Shut down master

 

看到storm作者的wiki Fault-tolerance 

中间有一句话:the Nimbus and Supervisor daemons must be run under supervision using a tool like daemontools or monit.

所以nimbus,supervisor和ui进程都用daemontools管理起来,这样意外进程终止的时候,可以自动重启进程。

daemontools管理进程的配置可以参见之前的一个博文 daemontools管理fast-fail的zookeeper

你可能感兴趣的:(storm)