Storm【底层细节】 - Storm在Zookeeper之中的结构

本章主题:图解Storm在Zookeeper之中保存。

        

    简介:

     我们知道,Twitter Storm的所有状态信息都是保存在Zookeeper 之中的,在前面的有关kafka的文章之中,我们知道kafka也将信息保存在Zookeeper之中,还有其他类似的组件:如double,hbase等。存在对Zookeeper的依赖。

         

   细节:

       nimbus通过在Zookeeper上面写状态信息来分配任务,Supervisor,task通过Zookeeper中读取状态来领取自己的任务,与此同时Nimbus在不断的读取 Supervisor,task发送给nimbus的心跳信号,以便能够准确的监控到集群的状态。从而可以重新来启动一些 ”挂掉“的任务。

  

     具体的源代码是 backtype.storm.cluster

/-{storm-zk-root}           -- storm在zookeeper上的根
  |                            目录
  |
  |-/assignments            -- topology的任务分配信息
  |   |
  |   |-/{topology-id}      -- 这个下面保存的是每个
  |                            topology的assignments
  |                            信息包括: 对应的
  |                            nimbus上的代码目录,所有
  |                            task的启动时间,
  |                            每个task与机器、端口的映射
  |
  |-/tasks                  -- 所有的task
  |   |
  |   |-/{topology-id}      -- 这个目录下面id为
  |       |                    {topology-id}的topology
  |       |                    所对应的所有的task-id
  |       |
  |       |-/{task-id}      -- 这个文件里面保存的是这个
  |                            task对应的component-id:
  |                            可能是spout-id或者bolt-id
  |
  |-/storms                 -- 这个目录保存所有正在运行
  |   |                        的topology的id
  |   |
  |   |-/{topology-id}      -- 这个文件保存这个topology
  |                            的一些信息,包括topology的
  |                            名字,topology开始运行的时
  |                            间以及这个topology的状态
  |                            (具体看StormBase类)
  |
  |-/supervisors            -- 这个目录保存所有的supervisor
  |   |                        的心跳信息
  |   |
  |   |-/{supervisor-id}    -- 这个文件保存的是supervisor
  |                            的心跳信息包括:心跳时间,主
  |                            机名,这个supervisor上worker
  |                            的端口号运行时间
  |                            (具体看SupervisorInfo类)
  |
  |-/taskbeats              -- 所有task的心跳
  |   |
  |   |-/{topology-id}      -- 这个目录保存这个topology的所
  |       |                    有的task的心跳信息
  |       |
  |       |-/{task-id}      -- task的心跳信息,包括心跳的时
  |                            间,task运行时间以及一些统计
  |                            信息
  |
  |-/taskerrors             -- 所有task所产生的error信息
      |
      |-/{topology-id}      -- 这个目录保存这个topology下面
          |                    每个task的出错信息
          |
          |-/{task-id}      -- 这个task的出错信息

 

在这里,额外感谢徐明明的用心~ 感谢分享。


你可能感兴趣的:(Storm【底层细节】 - Storm在Zookeeper之中的结构)