xiaqian0917

storm启动supervisor源码分析-supervisor.clj

supervisor是storm集群重要组成部分，supervisor主要负责管理各个"工作节点"。supervisor与zookeeper进行通信，通过zookeeper的"watch机制"可以感知到是否有新的任务需要认领或哪些任务被重新分配。我们可以通用执行bin/storm supervisor >/dev/null 2>&1 &来启动supervisor。bin/storm是一个python脚本，在这个脚本中定义了一个supervisor函数：

supervisor函数

 
    def  
    supervisor( 
    klass 
    = 
    "backtype.storm.daemon.supervisor" 
    ): 
    
    """Syntax: [storm supervisor] 
    
       Launches the supervisor daemon. This command should be run  
    
       under supervision with a tool like daemontools or monit.  
    
       See Setting up a Storm cluster for more information. 
    
       (https://github.com/nathanmarz/storm/wiki/Setting-up-a-Storm-cluster) 
    
       """ 
    
    cppaths  
    =  
    [ 
    STORM_DIR  
    +  
    "/log4j" 
    ,  
    STORM_DIR  
    +  
    "/conf" 
    ] 
    
    jvmopts  
    =  
    parse_args( 
    confvalue( 
    "supervisor.childopts" 
    ,  
    cppaths))  
    +  
    [ 
    
    "-Dlogfile.name=supervisor.log" 
    , 
    
    "-Dlog4j.configuration=storm.log.properties" 
    , 
    
    ] 
    
    exec_storm_class( 
    
    klass 
    ,  
    
    jvmtype 
    = 
    "-server" 
    ,  
    
    extrajars 
    = 
    cppaths 
    ,  
    
    jvmopts 
    = 
    jvmopts)

klass参数的默认值为backtype.storm.daemon.supervisor，backtype.storm.daemon.supervisor标识一个java类。STORM_DIR标识storm的安装目录，cppaths集合存放了log4j配置文件路径和storm配置文件storm.yaml路径，jvmopts存放传递给jvm的参数，包括log4j配文件路径、storm.yaml路径、log4j日志名称和log4j配置文件名称。exec_storm_class函数的逻辑比较简单，具体实现如下：

exec_storm_class函数

 
    def  
    exec_storm_class( 
    klass 
    ,  
    jvmtype 
    = 
    "-server" 
    ,  
    jvmopts 
    = 
    [],  
    extrajars 
    = 
    [],  
    args 
    = 
    [],  
    fork 
    = 
    False 
    ):   
    
     
    global  
    CONFFILE   
    
     
    all_args  
    =  
    [   
    
         
    "java" 
    ,  
    jvmtype 
    ,  
    get_config_opts 
    (),   
    
         
    "-Dstorm.home="  
    +  
    STORM_DIR 
    ,    
    
         
    "-Djava.library.path="  
    +  
    confvalue( 
    "java.library.path" 
    ,  
    extrajars 
    ),   
    
         
    "-Dstorm.conf.file="  
    +  
    CONFFILE 
    ,   
    
         
    "-cp" 
    ,  
    get_classpath( 
    extrajars 
    ),   
    
     
    ]  
    +  
    jvmopts  
    +  
    [ 
    klass 
    ]  
    +  
    list( 
    args)   
    
     
    print  
    "Running: "  
    +  
    " " 
    . 
    join( 
    all_args)   
    
     
    if  
    fork 
    :   
    
         
    os 
    . 
    spawnvp( 
    os 
    . 
    P_WAIT 
    ,  
    "java" 
    ,  
    all_args)   
    
     
    else 
    :   
    
         
    os 
    . 
    execvp( 
    "java" 
    ,  
    all_args)  
    # replaces the current process and never returns 
   

get_config_opts()获取jvm的默认配置信息，confvalue("java.library.path", extrajars)获取storm使用的本地库JZMQ加载路径，get_classpath(extrajars)获取所有依赖jar包的完整路径，然后拼接一个java -cp命令运行klass的main方法。klass默认值为backtype.storm.daemon.supervisor，所以exec_storm_class函数最终调用backtype.storm.daemon.supervisor类的main方法。
backtype.storm.daemon.supervisor类定义在supervisor.clj文件中，定义如下：

backtype.storm.daemon.supervisor类

     (ns  
    backtype.storm.daemon.supervisor 
    
  ( 
    :import  
    [ 
    backtype.storm.scheduler  
    ISupervisor 
    ]) 
    
  ( 
    :use  
    [ 
    backtype.storm  
    bootstrap 
    ]) 
    
  ( 
    :use  
    [ 
    backtype.storm.daemon  
    common 
    ]) 
    
  ( 
    :require  
    [ 
    backtype.storm.daemon  
    [ 
    worker  
    :as  
    worker 
    ]]) 
    
  ( 
    :gen-class 
    
     
    :methods  
    [ 
    ^ 
    { 
    :static  
    true 
    }  
    [ 
    launch  
    [ 
    backtype.storm.scheduler.ISupervisor 
    ]  
    void 
    ]])) 
    
 
    
        ( 
    bootstrap) 
    
         
    ;; ... ... 
    
     
    ;; 其他方法 
    
     
    ;; ... ... 
    
    ( 
    defn  
    -main  
    [] 
    
          ( 
    -launch ( 
    standalone-supervisor))) 
   

:gen-class指示Clojure生成Java类backtype.storm.daemon.supervisor，并且声明一个静态方法launch，launch方法接收一个实现backtype.storm.scheduler.ISupervisor接口的实例作为参数。launch函数的参数是由standalone-supervisor函数生成的。standalone-supervisor函数定义如下：返回一个实现ISupervisor接口的实例。

standalone-supervisor函数

 
    ;; 该函数主要返回一个实现了ISupervisor接口的实例。 
    
 ( 
    defn  
    standalone-supervisor  
    [] 
    
  ( 
    let  
    [ 
    conf-atom ( 
    atom  
    nil) 
    
         
    id-atom ( 
    atom  
    nil 
    )] 
    
    ( 
    reify  
    ISupervisor 
    
       
    ;; prepare方法主要功能是创建一个基于磁盘的存放K/V对的database——LocalState对象，LocalState类参见其定义部分 
    
      ( 
    prepare  
    [ 
    this  
    conf  
    local-dir 
    ] 
    
         
    ;; conf-atom原子类型，绑定storm集群配置信息 
    
        ( 
    reset!  
    conf-atom  
    conf) 
    
     
    ;; state绑定LocalState对象，local-dir标识database在磁盘上的根目录，database实际就是一个HashMap对象序列化后存放到磁盘local-dir目录下 
    
        ( 
    let  
    [ 
    state ( 
    LocalState.  
    local-dir) 
    
           
    ;; LS-ID值为字符串"supervisor-id"，定义在common.clj文件中。如果state中存放了该supervisor的id，那么curr-id绑定该id，否则curr-id绑定32为uuid 
    
               
    curr-id ( 
    if-let  
    [ 
    id ( 
    .get  
    state  
    LS-ID 
    )] 
    
                         
    id 
    
             
    ;; 调用uuid函数生成一个32的id 
    
                        ( 
    generate-supervisor-id 
    ))] 
    
           
    ;; 调用state的put函数，更新该supervisor的id 
    
          ( 
    .put  
    state  
    LS-ID  
    curr-id) 
    
       
    ;; id-atom原子类型，绑定该supervisor的id 
    
          ( 
    reset!  
    id-atom  
    curr-id)) 
    
        ) 
    
       
    ;; 返回true 
    
      ( 
    confirmAssigned  
    [ 
    this  
    port 
    ] 
    
         
    true) 
    
       
    ;; 从storm配置信息中获取supervisor的所有端口，因为clojure中的map函数返回的是"懒惰序列"，所以需要调用doall函数对"懒惰序列"进行完全实例化 
    
      ( 
    getMetadata  
    [ 
    this 
    ] 
    
        ( 
    doall ( 
    map int ( 
    get  
    @ 
    conf-atom  
    SUPERVISOR-SLOTS-PORTS)))) 
    
       
    ;; 获取supervisor的id 
    
      ( 
    getSupervisorId  
    [ 
    this 
    ] 
    
         
    @ 
    id-atom) 
    
       
    ;; 获取supervisor的分配id即其id 
    
      ( 
    getAssignmentId  
    [ 
    this 
    ] 
    
         
    @ 
    id-atom) 
    
       
    ;; killedWorker空实现 
    
      ( 
    killedWorker  
    [ 
    this  
    port 
    ] 
    
        ) 
    
       
    ;; assigned空实现 
    
      ( 
    assigned  
    [ 
    this  
    ports 
    ] 
    
        )))) 
   

LocalState类是个java类，定义见LocalState.java，这个类有一个VersionedStore类型对象，VersionedStore类见VersionedStore.java，由于这两个类是java实现，而且也比较简单，这样就在详细分析。

mk-supervisor函数定义如下：

mk-supervisor函数

 
    ;; conf绑定storm集群配置信息，isupervisor绑定standalone-supervisor函数返回的实现ISupervisor接口的实例 
    
 ( 
    defserverfn  
    mk-supervisor  
    [ 
    conf  
    shared-context  
    ^ 
    ISupervisor  
    isupervisor 
    ] 
    、 
    
   
    ;; 打印日志信息 
    
  ( 
    log-message  
    "Starting Supervisor with conf "  
    conf) 
    
   
    ;; supervisor-isupervisor-dir函数调用了supervisor-local-dir函数，supervisor-local-dir函数从storm配置中获取storm的安装路径，然后在supervisor上创建目录{storm.local.dir}/supervisor，并返回目录 
    
   
    ;; supervisor-isupervisor-dir函数返回字符串"{storm.local.dir}/supervisor/isupervisor"作为一个LocalState对象的根目录，该LocalState对象只用来存放supervisor的id 
    
   
    ;; 调用isupervisor的prepare方法，创建一个LocalState对象，并生成该supervisor的id，将其存入LocalState对象 
    
  ( 
    .prepare  
    isupervisor  
    conf ( 
    supervisor-isupervisor-dir  
    conf)) 
    
   
    ;; supervisor-tmp-dir函数在supervisor上创建{storm.local.dir}/supervisor/tmp目录；FileUtils类的cleanDirectory方法清空该目录 
    
  ( 
    FileUtils/cleanDirectory ( 
    File. ( 
    supervisor-tmp-dir  
    conf))) 
    
   
    ;; supervisor绑定supervisor元数据信息，supervisor-data参见其定义部分 
    
  ( 
    let  
    [ 
    supervisor ( 
    supervisor-data  
    conf  
    shared-context  
    isupervisor) 
    
     
    ;; event-manager和processes-event-manager分别绑定一个EventManager实例，managers绑定包含两个EventManager实例的集合。event-manager函数请参见文章"storm事件管理器EventManager源码分析-event.clj" 
    
         
    [ 
    event-manager  
    processes-event-manager  
    :as  
    managers 
    ]  
    [( 
    event/event-manager  
    false) ( 
    event/event-manager  
    false 
    )] 
    
     
    ;; partial用于定义"偏函数"，所谓偏函数就是给一个指定函数的某些参数预赋值，这样就得到了一个新函数。sync-processes就绑定这个新函数，sync-processes参见其定义部分 
    
         
    sync-processes ( 
    partial  
    sync-processes  
    supervisor) 
    
     
    ;; synchronize-supervisor绑定一个函数，该函数主要功能就是当assignment发生变化时, 从nimbus同步topology的代码到本地，当assignment发生变化时, check workers状态, 保证被分配的work的状态都是valid 
    
         
    synchronize-supervisor ( 
    mk-synchronize-supervisor  
    supervisor  
    sync-processes  
    event-manager  
    processes-event-manager) 
    
     
    ;; heartbeat-fn绑定一个匿名函数，该匿名函数主要功能是调用StormClusterState实例的supervisor-heartbeat!函数将该supervisor的心跳信息SupervisorInfo实例写入zookeeper的"/supervisors/supervisor-id"节点中 
    
         
    heartbeat-fn ( 
    fn  
    [] ( 
    .supervisor-heartbeat! 
    
                            
    ;; StormClusterState实例 
    
                               ( 
    :storm-cluster-state  
    supervisor) 
    
                    
    ;; supervisor-id 
    
                               ( 
    :supervisor-id  
    supervisor) 
    
                    
    ;; 创建SupervisorInfo实例，即该supervisor的心跳信息 
    
                               ( 
    SupervisorInfo. ( 
    current-time-secs) 
    
                                     
    ;; 主机名 
    
                                                ( 
    :my-hostname  
    supervisor) 
    
                         
    ;; assignment-id即supervisor-id 
    
                                                ( 
    :assignment-id  
    supervisor) 
    
                         
    ;; 当前集群已使用的所有port 
    
                                                ( 
    keys  
    @( 
    :curr-assignment  
    supervisor)) 
    
                                                 
    ;; used ports 
    
                         
    ;; 该supervisor上所有可用port，即在storm配置文件中配置的port 
    
                                                ( 
    .getMetadata  
    isupervisor) 
    
                                                ( 
    conf  
    SUPERVISOR-SCHEDULER-META) 
    
                         
    ;; supervisor启动时间 
    
                                                (( 
    :uptime  
    supervisor 
    )))))] 
    
     
    ;; 调用heartbeat-fn绑定的匿名函数，将supervisor心跳心跳写入zookeeper 
    
    ( 
    heartbeat-fn) 
    
     
    ;; should synchronize supervisor so it doesn't launch anything after being down (optimization) 
    
     
    ;; 调用timer.clj中的schedule-recurring函数向该supervisor的定时器中添加一个周期执行的定时任务heartbeat-fn--"向zookeeper汇报superior的心跳信息"，关于storm定时器的详细信息请参看"storm定时器timer源码分析-timer.clj" 
    
    ( 
    schedule-recurring ( 
    :timer  
    supervisor) 
    
                         
    0 
    
             
    ;; 指定每隔多长时间汇报一次心跳信息 
    
                        ( 
    conf  
    SUPERVISOR-HEARTBEAT-FREQUENCY-SECS) 
    
                         
    heartbeat-fn) 
    
     
    ;; 如果supervisor.enable值为true时(默认值就是true，而且不会改变，所以一定会执行)，那么将synchronize-supervisor绑定的函数（mk-synchronize-supervisor函数返回的函数）每隔10s加入event-manager事件管理器中， 
    
     
    ;; 这样即使zookeeper的"watcher机制"异常时，supervisor也可以主动的获取分配信息的变化。同时将sync-processes绑定的函数（sync-processes函数）每隔SUPERVISOR-MONITOR-FREQUENCY-SECS秒加入processes-event-manager事件管理器中， 
    
     
    ;; 这样即使zookeeper的"watcher机制"异常时，supervisor也可以正常管理worker 
    
    ( 
    when ( 
    conf  
    SUPERVISOR-ENABLE) 
    
       
    ;; This isn't strictly necessary, but it doesn't hurt and ensures that the machine stays up 
    
       
    ;; to date even if callbacks don't all work exactly right 
    
      ( 
    schedule-recurring ( 
    :timer  
    supervisor)  
    0  
    10 ( 
    fn  
    [] ( 
    .add  
    event-manager  
    synchronize-supervisor))) 
    
      ( 
    schedule-recurring ( 
    :timer  
    supervisor) 
    
                           
    0 
    
                          ( 
    conf  
    SUPERVISOR-MONITOR-FREQUENCY-SECS) 
    
                          ( 
    fn  
    [] ( 
    .add  
    processes-event-manager  
    sync-processes)))) 
    
    ( 
    log-message  
    "Starting supervisor with id " ( 
    :supervisor-id  
    supervisor)  
    " at host " ( 
    :my-hostname  
    supervisor)) 
    
     
    ;; 返回实现了Shutdownable接口、SupervisorDaemon协议和DaemonCommon协议的实例 
    
    ( 
    reify 
    
      
    Shutdownable 
    
      
    ;; 关闭supervisor，就是关闭该supervisor所拥护的资源 
    
     ( 
    shutdown  
    [ 
    this 
    ] 
    
               ( 
    log-message  
    "Shutting down supervisor " ( 
    :supervisor-id  
    supervisor)) 
    
               ( 
    reset! ( 
    :active  
    supervisor)  
    false) 
    
               ( 
    cancel-timer ( 
    :timer  
    supervisor)) 
    
               ( 
    .shutdown  
    event-manager) 
    
               ( 
    .shutdown  
    processes-event-manager) 
    
               ( 
    .disconnect ( 
    :storm-cluster-state  
    supervisor))) 
    
      
    SupervisorDaemon 
    
      
    ;; 返回集群配置信息 
    
     ( 
    get-conf  
    [ 
    this 
    ] 
    
        
    conf) 
    
      
    ;; 返回supervisor-id 
    
     ( 
    get-id  
    [ 
    this 
    ] 
    
       ( 
    :supervisor-id  
    supervisor)) 
    
      
    ;; 见名知意，关闭所有worker 
    
     ( 
    shutdown-all-workers  
    [ 
    this 
    ] 
    
       ( 
    let  
    [ 
    ids ( 
    my-worker-ids  
    conf 
    )] 
    
         ( 
    doseq  
    [ 
    id  
    ids 
    ] 
    
           ( 
    shutdown-worker  
    supervisor  
    id) 
    
           ))) 
    
      
    DaemonCommon 
    
     ( 
    waiting?  
    [ 
    this 
    ] 
    
       ( 
    or ( 
    not  
    @( 
    :active  
    supervisor)) 
    
           ( 
    and 
    
         
    ;; 定时器线程是否处于sleep状态 
    
            ( 
    timer-waiting? ( 
    :timer  
    supervisor)) 
    
         
    ;; 调用事件管理器的waiting?函数检查event-manager和processes-event-manager内事件执行线程是否处于sleep状态，memfn宏可以自动生成代码以使得java方法可以当成clojure里面的函数 
    
            ( 
    every? ( 
    memfn  
    waiting?)  
    managers))) 
    
           )))) 
   

supervisor-data函数定义如下：

supervisor-data函数返回一个包含了supervisor元数据的map对象。

supervisor-data函数

     ( 
    defn  
    supervisor-data  
    [ 
    conf  
    shared-context  
    ^ 
    ISupervisor  
    isupervisor 
    ] 
    
    ;; 保存集群配置信息 
    
    { 
    :conf  
    conf 
    
    ;; 启动supervisor时，shared-context为nil 
    
    :shared-context  
    shared-context 
    
    ;; 保存supervisor实例 
    
    :isupervisor  
    isupervisor 
    
    ;; 保存supervisor是否是活跃的（默认是活跃的） 
    
    :active ( 
    atom  
    true) 
    
    ;; 保存supervisor启动时间 
    
    :uptime ( 
    uptime-computer) 
    
    ;; 保存工作线程id 
    
    :worker-thread-pids-atom ( 
    atom  
    {}) 
    
    ;; 保存StormClusterState对象 
    
    :storm-cluster-state ( 
    cluster/mk-storm-cluster-state  
    conf) 
    
    ;; 保存supervisor的LocalState对象，该LocalState对象的根目录是"{storm.local.dir}/supervisor/localstate" 
    
    :local-state ( 
    supervisor-state  
    conf) 
    
    ;; 保存supervisor的id 
    
    :supervisor-id ( 
    .getSupervisorId  
    isupervisor) 
    
    ;; 保存supervisor的分配id，分配id与supervisor_id相同 
    
    :assignment-id ( 
    .getAssignmentId  
    isupervisor) 
    
    ;; 保存supervisor的主机名，如果配置conf（map对象）中包含"storm.local.hostname"，那么就使用配置的主机名，否则通过调用InetAddress.getLocalHost().getCanonicalHostName()获取主机名 
    
    :my-hostname ( 
    if ( 
    contains?  
    conf  
    STORM-LOCAL-HOSTNAME) 
    
                  ( 
    conf  
    STORM-LOCAL-HOSTNAME) 
    
                  ( 
    local-hostname)) 
    
    ;; 心跳时汇报当前集群的所有分配信息 
    
    :curr-assignment ( 
    atom  
    nil)  
    ;; used for reporting used ports when heartbeating 
    
    ;; 保存一个storm定时器timer，kill-fn函数会在timer-thread发生exception的时候被调用 
    
    :timer ( 
    mk-timer  
    :kill-fn ( 
    fn  
    [ 
    t 
    ] 
    
                               ( 
    log-error  
    t  
    "Error when processing event") 
    
                               ( 
    exit-process!  
    20  
    "Error when processing an event") 
    
                               )) 
    
    ;; 创建一个用于存放带有版本号的分配信息的map 
    
    :assignment-versions ( 
    atom  
    {}) 
    
    })

sync-processes函数定义如下：

sync-processes函数

 
    ;; sync-processes函数用于管理workers, 比如处理不正常的worker或dead worker, 并创建新的workers 
    
 
    ;; supervisor标识supervisor的元数据 
    
 ( 
    defn  
    sync-processes  
    [ 
    supervisor 
    ] 
    
   
    ;; conf绑定storm的配置信息map 
    
  ( 
    let  
    [ 
    conf ( 
    :conf  
    supervisor) 
    
         
    ;; local-state绑定supervisor的LocalState实例 
    
         
    ^ 
    LocalState  
    local-state ( 
    :local-state  
    supervisor) 
    
         
    ;; 从supervisor的LocalState实例中获取本地分配信息端口port->LocalAssignment实例的map，LocalAssignment实例封装了storm-id和分配给该storm-id的executors 
    
         
    assigned-executors ( 
    defaulted ( 
    .get  
    local-state  
    LS-LOCAL-ASSIGNMENTS)  
    {}) 
    
         
    ;; now绑定当前时间 
    
         
    now ( 
    current-time-secs) 
    
         
    ;; allocated绑定worker-id->worker状态和心跳的map，read-allocated-workers函数请参见其定义部分 
    
         
    allocated ( 
    read-allocated-workers  
    supervisor  
    assigned-executors  
    now) 
    
         
    ;; 过滤掉allocated中state不等于:valid的元素，并将过滤后的结果绑定到keepers 
    
         
    keepers ( 
    filter-val 
    
                 ( 
    fn  
    [[ 
    state  
    _ 
    ]] ( 
    =  
    state  
    :valid)) 
    
                  
    allocated) 
    
         
    ;; keep-ports绑定keepers中心跳信息所包含的端口 
    
         
    keep-ports ( 
    set ( 
    for  
    [[ 
    id  
    [ 
    _  
    hb 
    ]]  
    keepers 
    ] ( 
    :port  
    hb))) 
    
         
    ;; reassign-executors绑定assigned-executors中端口不在集合keep-ports的键值对构成的map，也就是说已分配的线程所对应的进程挂掉了，需要重新进行分配 
    
         
    reassign-executors ( 
    select-keys-pred ( 
    complement  
    keep-ports)  
    assigned-executors) 
    
         
    ;; new-worker-ids绑定port->worker-id的map，new-worker-ids保存了需要重新启动进程的worker-id 
    
         
    new-worker-ids ( 
    into 
    
                         
    {} 
    
                        ( 
    for  
    [ 
    port ( 
    keys  
    reassign-executors 
    )] 
    
                           
    [ 
    port ( 
    uuid 
    )])) 
    
         
    ] 
    
     
    ;; 1. to kill are those in allocated that are dead or disallowed 
    
     
    ;; 2. kill the ones that should be dead 
    
     
    ;;     - read pids, kill -9 and individually remove file 
    
     
    ;;     - rmr heartbeat dir, rmdir pid dir, rmdir id dir (catch exception and log) 
    
     
    ;; 3. of the rest, figure out what assignments aren't yet satisfied 
    
     
    ;; 4. generate new worker ids, write new "approved workers" to LS 
    
     
    ;; 5. create local dir for worker id 
    
     
    ;; 5. launch new workers (give worker-id, port, and supervisor-id) 
    
     
    ;; 6. wait for workers launch 
    
   
    
    ( 
    log-debug  
    "Syncing processes") 
    
    ( 
    log-debug  
    "Assigned executors: "  
    assigned-executors) 
    
    ( 
    log-debug  
    "Allocated: "  
    allocated) 
    
     
    ;; allocated绑定worker-id->worker状态和心跳的map，id绑定worker-id，state绑定worker状态，heartbeat绑定worker心跳时间 
    
    ( 
    doseq  
    [[ 
    id  
    [ 
    state  
    heartbeat 
    ]]  
    allocated 
    ] 
    
       
    ;; 如果worker的状态不是:valid，那么就关闭worker 
    
      ( 
    when ( 
    not=  
    :valid  
    state) 
    
        ( 
    log-message 
    
          
    "Shutting down and clearing state for id "  
    id 
    
          
    ". Current supervisor time: "  
    now 
    
          
    ". State: "  
    state 
    
          
    ", Heartbeat: " ( 
    pr-str  
    heartbeat)) 
    
         
    ;; shutdown-worker函数关闭进程，shutdown-worker函数请参见其定义部分 
    
        ( 
    shutdown-worker  
    supervisor  
    id) 
    
        )) 
    
     
    ;; new-worker-ids保存了需要重新启动进程的worker-id，遍历new-worker-ids，为每个worker-id创建本地目录"{storm.local.dir}/workers/{worker_id}" 
    
    ( 
    doseq  
    [ 
    id ( 
    vals  
    new-worker-ids 
    )] 
    
      ( 
    local-mkdirs ( 
    worker-pids-root  
    conf  
    id))) 
    
     
    ;; 将合并后的map重新保存到local-state的LS-APPROVED-WORKERS中 
    
    ( 
    .put  
    local-state  
    LS-APPROVED-WORKERS 
    
           
    ;; 将new-worker-ids的键值交换由原来的port->worker-id转换成worker-id->port，并与local-state的LS-APPROVED-WORKERS合并 
    
          ( 
    merge 
    
            
    ;; select-keys函数从local-state的LS-APPROVED-WORKERS中获取key包含在keepers中的键值对，返回结果是一个map 
    
           ( 
    select-keys ( 
    .get  
    local-state  
    LS-APPROVED-WORKERS) 
    
                        ( 
    keys  
    keepers)) 
    
            
    ;; zipmap函数返回new-worker-ids的worker-id->port的map 
    
           ( 
    zipmap ( 
    vals  
    new-worker-ids) ( 
    keys  
    new-worker-ids)) 
    
           )) 
    
     
    ;; wait-for-workers-launch函数等待所有worker启动完成，请参见wait-for-workers-launch函数定义部分 
    
    ( 
    wait-for-workers-launch 
    
      
    conf 
    
      
    ;; assignment绑定在该port运行的executor信息 
    
     ( 
    dofor  
    [[ 
    port  
    assignment 
    ]  
    reassign-executors 
    ] 
    
        
    ;; id为port所对应的worker-id 
    
       ( 
    let  
    [ 
    id ( 
    new-worker-ids  
    port 
    )] 
    
         ( 
    log-message  
    "Launching worker with assignment " 
    
                      ( 
    pr-str  
    assignment) 
    
                       
    " for this supervisor " 
    
                      ( 
    :supervisor-id  
    supervisor) 
    
                       
    " on port " 
    
                       
    port 
    
                       
    " with id " 
    
                       
    id 
    
                      ) 
    
          
    ;; launch-worker函数负责启动worker，关于worker启动的相关分析会在以后的文章中详细介绍，在此不再介绍 
    
         ( 
    launch-worker  
    supervisor 
    
                        ( 
    :storm-id  
    assignment) 
    
                         
    port 
    
                         
    id) 
    
          
    id))) 
    
    )) 
   

read-allocated-workers函数定义如下：

read-allocated-workers函数

 
    ;; 返回worker-id->worker状态和心跳的map，如果worker心跳为nil，那么worker是"dead" 
    
 ( 
    defn  
    read-allocated-workers 
    
   
    "Returns map from worker id to worker heartbeat. if the heartbeat is nil, then the worker is dead (timed out or never wrote heartbeat)" 
    
   
    ;; supervisor绑定supervisor元数据，assigned-executors绑定supervisor分配信息端口port->LocalAssignment实例的map，now绑定当前时间 
    
   
    [ 
    supervisor  
    assigned-executors  
    now 
    ] 
    
   
    ;; 获取集群配置信息 
    
  ( 
    let  
    [ 
    conf ( 
    :conf  
    supervisor) 
    
     
    ;; 获取supervisor的LocalState实例 
    
         
    ^ 
    LocalState  
    local-state ( 
    :local-state  
    supervisor) 
    
     
    ;; id->heartbeat绑定supervisor上运行进程的worker-id->心跳信息的map 
    
         
    id->heartbeat ( 
    read-worker-heartbeats  
    conf) 
    
     
    ;; approved-ids绑定supervisor的LocalState实例中保存的worker-id的集合 
    
         
    approved-ids ( 
    set ( 
    keys ( 
    .get  
    local-state  
    LS-APPROVED-WORKERS 
    )))] 
    
     
    ;; 生成worker-id->[state hb]的map 
    
    ( 
    into 
    
      
    {} 
    
     ( 
    dofor  
    [[ 
    id  
    hb 
    ]  
    id->heartbeat 
    ] 
    
             
    ;; cond相当于if...else嵌套 
    
            ( 
    let  
    [ 
    state ( 
    cond 
    
                  
    ;; 如果心跳信息为nil，那么state值为:not-started关键字 
    
                         ( 
    not  
    hb) 
    
                            
    :not-started 
    
              
    ;; 如果approved-ids不包含id或者matches-an-assignment?返回false，那么state值为:disallowed关键字 
    
                         ( 
    or ( 
    not ( 
    contains?  
    approved-ids  
    id)) 
    
                  
    ;; matches-an-assignment?函数通过比较心跳信息和分配信息中的storm-id和线程id集合是否相同，来判定该worker是否已分配 
    
                             ( 
    not ( 
    matches-an-assignment?  
    hb  
    assigned-executors))) 
    
                            
    :disallowed 
    
              
    ;; 如果当前时间-上次心跳时间>心跳超时时间，state值为:timed-out关键字 
    
                         ( 
    > ( 
    -  
    now ( 
    :time-secs  
    hb)) 
    
                            ( 
    conf  
    SUPERVISOR-WORKER-TIMEOUT-SECS)) 
    
                            
    :timed-out 
    
              
    ;; 以上条件均不满足时，state值为:valid关键字 
    
                          
    true 
    
                            
    :valid 
    )] 
    
              ( 
    log-debug  
    "Worker "  
    id  
    " is "  
    state  
    ": " ( 
    pr-str  
    hb)  
    " at supervisor time-secs "  
    now) 
    
               
    [ 
    id  
    [ 
    state  
    hb 
    ]] 
    
              )) 
    
     ))) 
   

read-worker-heartbeats函数定义如下：

read-worker-heartbeats函数

 
    ;; 获取supervisor上运行进程的worker-id->心跳信息的map 
    
 ( 
    defn  
    read-worker-heartbeats 
    
   
    "Returns map from worker id to heartbeat" 
    
   
    [ 
    conf 
    ] 
    
   
    ;; ids绑定supervisor上进程的worker-id集合 
    
  ( 
    let  
    [ 
    ids ( 
    my-worker-ids  
    conf 
    )] 
    
     
    ;; 生成worker-id->心跳信息的map 
    
    ( 
    into  
    {} 
    
      ( 
    dofor  
    [ 
    id  
    ids 
    ] 
    
         
    ;; read-worker-heartbeat函数获取指定worker-id的心跳信息，从supervisor上"{storm.local.dir}/workers/{worker-id}/heartbeats"中获取心跳信息 
    
         
    [ 
    id ( 
    read-worker-heartbeat  
    conf  
    id 
    )])) 
    
    )) 
   

my-worker-ids函数定义如下：

my-worker-ids函数

 
    ;; 获取supervisor上运行的进程的worker-id 
    
 ( 
    defn  
    my-worker-ids  
    [ 
    conf 
    ] 
    
   
    ;; worker-root函数返回supervisor本地目录"{storm.local.dir}/workers"，read-dir-contents函数获取目录"{storm.local.dir}/workers"下所有文件名的集合（即该supervisor上正在运行的所有进程的worker-id） 
    
  ( 
    read-dir-contents ( 
    worker-root  
    conf))) 
   

matches-an-assignment?函数定义如下：

matches-an-assignment?函数

 
    ;; worker-heartbeat标识心跳信息，assigned-executors标识supervisor分配信息port->LocalAssignment实例的map 
    
 ( 
    defn  
    matches-an-assignment?  
    [ 
    worker-heartbeat  
    assigned-executors 
    ] 
    
   
    ;; 从worker-heartbeat中获取进程占用的端口，进而从assigned-executors中获取LocalAssignment实例 
    
  ( 
    let  
    [ 
    local-assignment ( 
    assigned-executors ( 
    :port  
    worker-heartbeat 
    ))] 
    
     
    ;; 如果local-assignment不为nil，且心跳信息中的storm-id和分配信息中的storm-id相等，且心跳信息中的线程id集合和分配信息中的线程id集合相等，那么返回true；否则返回false 
    
    ( 
    and  
    local-assignment 
    
         ( 
    = ( 
    :storm-id  
    worker-heartbeat) ( 
    :storm-id  
    local-assignment)) 
    
      
    ;; Constants/SYSTEM_EXECUTOR_ID标识"系统bolt"的线程id，我定义的topology除了我们指定的spout和bolt外，还包含一些"系统bolt" 
    
         ( 
    = ( 
    disj ( 
    set ( 
    :executors  
    worker-heartbeat))  
    Constants/SYSTEM_EXECUTOR_ID) 
    
            ( 
    set ( 
    :executors  
    local-assignment)))))) 
   

shutdown-worker函数定义如下：

shutdown-worker函数

 
    ;; 关闭进程，supervisor标识supervisor元数据，id标识worker_id 
    
 ( 
    defn  
    shutdown-worker  
    [ 
    supervisor  
    id 
    ] 
    
  ( 
    log-message  
    "Shutting down " ( 
    :supervisor-id  
    supervisor)  
    ":"  
    id) 
    
   
    ;; conf绑定集群配置信 
    
  ( 
    let  
    [ 
    conf ( 
    :conf  
    supervisor) 
    
         
    ;; 注意当storm集群"分布式模式"运行时，supervisor的"{storm.local.dir}/workers/{worker_id}/pids"路径中存放了worker实际对应的jvm进程id 
    
         
    ;; 从supervisor的"{storm.local.dir}/workers/{worker_id}/pids"路径获取进程id，worker_id标识我们指定的进程id，pids目录存放了该worker实际对应的jvm进程的id 
    
         
    pids ( 
    read-dir-contents ( 
    worker-pids-root  
    conf  
    id)) 
    
         
    ;; 注意当storm集群"本地模式"运行时，supervisor元数据中关键字:worker-thread-pids-atom所对应的map用于存放worker_id->线程id集合的键值对 
    
         
    ;; 先从supervisor元数据中获取worker-id(我们人为分配给worker的id)->jvm进程id的map，thread-pid实际上绑定的是worker的jvm进程id 
    
         
    thread-pid ( 
    @( 
    :worker-thread-pids-atom  
    supervisor)  
    id 
    )] 
    
     
    ;; 当thread-pid不为空时，kill掉该进程 
    
    ( 
    when  
    thread-pid 
    
       
    ;; 调用backtype.storm.process-simulator中的kill-process函数kill掉进程 
    
      ( 
    psim/kill-process  
    thread-pid)) 
    
     
    ;; 遍历pids集合，kill掉每个进程 
    
    ( 
    doseq  
    [ 
    pid  
    pids 
    ] 
    
       
    ;; 调用backtype.storm.util中的kill-process-with-sig-term函数，kill-process-with-sig-term函数又调用了send-signal-to-process函数，send-signal-to-process函数实现比较简单就是执行系统命令"kill -15 pid"，kill掉进程 
    
       
    ;; 注意在创建worker进程时为worker进程指定了关闭回调函数，当调用"kill -15 pid"关闭worker进程时会触发回调函数执行，回调函数是在worker.clj的mk-worker函数中添加的 
    
      ( 
    kill-process-with-sig-term  
    pid)) 
    
     
    ;; 如果pids不为空，sleep 1秒，等着"清理函数"--关闭回调函数执行完毕 
    
    ( 
    if-not ( 
    empty?  
    pids) ( 
    sleep-secs  
    1))  
    ;; allow 1 second for execution of cleanup threads on worker. 
    
     
    ;; 通过调用"kill -15 pid"命令未能关闭的进程，将通过调用force-kill-process函数关闭，force-kill-process函数只是调用了"kill -9 pid"命令 
    
    ( 
    doseq  
    [ 
    pid  
    pids 
    ] 
    
      ( 
    force-kill-process  
    pid) 
    
      ( 
    try 
    
         
    ;; 删除"{storm.local.dir}/workers/{worker_id}/pids" 
    
        ( 
    rmpath ( 
    worker-pid-path  
    conf  
    id  
    pid)) 
    
        ( 
    catch  
    Exception  
    e)))  
    ;; on windows, the supervisor may still holds the lock on the worker directory 
    
     
    ;; try-cleanup-worker函数清理本地目录，try-cleanup-worker函数参见其定义部分 
    
    ( 
    try-cleanup-worker  
    conf  
    id)) 
    
  ( 
    log-message  
    "Shut down " ( 
    :supervisor-id  
    supervisor)  
    ":"  
    id)) 
   

try-cleanup-worker函数定义如下：

try-cleanup-worker函数

 
    ;; 清理本地目录 
    
 ( 
    defn  
    try-cleanup-worker  
    [ 
    conf  
    id 
    ] 
    
  ( 
    try 
    
     
    ;; 删除"{storm.local.dir}/workers/{worker_id}/heartbeats"目录 
    
    ( 
    rmr ( 
    worker-heartbeats-root  
    conf  
    id)) 
    
     
    ;; this avoids a race condition with worker or subprocess writing pid around same time 
    
     
    ;; 删除"{storm.local.dir}/workers/{worker_id}/pids"目录 
    
    ( 
    rmpath ( 
    worker-pids-root  
    conf  
    id)) 
    
     
    ;; 删除"{storm.local.dir}/workers/{worker_id}"目录 
    
    ( 
    rmpath ( 
    worker-root  
    conf  
    id)) 
    
  ( 
    catch  
    RuntimeException  
    e 
    
    ( 
    log-warn-error  
    e  
    "Failed to cleanup worker "  
    id  
    ". Will retry later") 
    
    ) 
    
  ( 
    catch  
    java.io.FileNotFoundException  
    e ( 
    log-message ( 
    .getMessage  
    e))) 
    
  ( 
    catch  
    java.io.IOException  
    e ( 
    log-message ( 
    .getMessage  
    e))) 
    
    )) 
   

wait-for-workers-launch函数定义如下：

wait-for-workers-launch函数

 
    ;; wait-for-workers-launch函数等待所有worker启动完成 
    
 ( 
    defn-  
    wait-for-workers-launch  
    [ 
    conf  
    ids 
    ] 
    
  ( 
    let  
    [ 
    start-time ( 
    current-time-secs 
    )] 
    
    ( 
    doseq  
    [ 
    id  
    ids 
    ] 
    
       
    ;; 调用wait-for-worker-launch函数 
    
      ( 
    wait-for-worker-launch  
    conf  
    id  
    start-time)) 
    
    )) 
   

wait-for-worker-launch函数定义如下：

wait-for-worker-launch函数

 
    ;; wait-for-worker-launch函数等待worker启动完成，worker启动完成的条件是：如果worker在规定的心跳超时时间内有一次心跳那么就说明worker成功启动 
    
 ( 
    defn-  
    wait-for-worker-launch  
    [ 
    conf  
    id  
    start-time 
    ] 
    
  ( 
    let  
    [ 
    state ( 
    worker-state  
    conf  
    id 
    )]     
    
    ( 
    loop  
    [] 
    
      ( 
    let  
    [ 
    hb ( 
    .get  
    state  
    LS-WORKER-HEARTBEAT 
    )] 
    
        ( 
    when ( 
    and 
    
               ( 
    not  
    hb) 
    
               ( 
    < 
    
                ( 
    - ( 
    current-time-secs)  
    start-time) 
    
                ( 
    conf  
    SUPERVISOR-WORKER-START-TIMEOUT-SECS) 
    
                )) 
    
          ( 
    log-message  
    id  
    " still hasn't started") 
    
          ( 
    Time/sleep  
    500) 
    
          ( 
    recur) 
    
          ))) 
    
    ( 
    when-not ( 
    .get  
    state  
    LS-WORKER-HEARTBEAT) 
    
      ( 
    log-message  
    "Worker "  
    id  
    " failed to start") 
    
      ))) 
   

mk-synchronize-supervisor函数定义如下：

mk-synchronize-supervisor函数

 
    ;; mk-synchronize-supervisor函数返回一个名字为"this"的函数， 
    
 ( 
    defn  
    mk-synchronize-supervisor  
    [ 
    supervisor  
    sync-processes  
    event-manager  
    processes-event-manager 
    ] 
    
  ( 
    fn  
    this  
    [] 
    
     
    ;; conf绑定集群配置信息 
    
    ( 
    let  
    [ 
    conf ( 
    :conf  
    supervisor) 
    
           
    ;; storm-cluster-state绑定StormClusterState对象 
    
           
    storm-cluster-state ( 
    :storm-cluster-state  
    supervisor) 
    
           
    ;; isupervisor绑定实现了ISupervisor接口的实例 
    
           
    ^ 
    ISupervisor  
    isupervisor ( 
    :isupervisor  
    supervisor) 
    
           
    ;; local-state绑定LocalState实例 
    
           
    ^ 
    LocalState  
    local-state ( 
    :local-state  
    supervisor) 
    
           
    ;; sync-callback绑定一个匿名函数，这个匿名函数的主要功能就是将上面定义的"this"函数添加到event-manager中，这样"this"函数将会在一个新的线程内执行 
    
           
    ;; 每次执行，都需要再一次把sync-callback注册到zookeeper中作为回调函数，以保证下次可以被继续触发，当zookeeper的子节点"/assignments"发生变化时执行回调函数sync-callback 
    
           
    sync-callback ( 
    fn  
    [ 
    &  
    ignored 
    ] ( 
    .add  
    event-manager  
    this)) 
    
           
    ;; assignment-versions绑定带有版本号的分配信息，topology-id->分配信息的map 
    
           
    assignment-versions  
    @( 
    :assignment-versions  
    supervisor) 
    
           
    ;; assignments-snapshot绑定topoloy-id->分配信息AssignmentInfo对象的map，versions绑定带有版本号的分配信息，assignments-snapshot函数从zookeeper的子节点"/assignments"获取分配信息（当前集群分配信息快照），并将回调函数添加到子节点"/assignments"上，assignments-snapshot函数参见其定义部分 
    
           
    { 
    assignments-snapshot  
    :assignments  
    versions  
    :versions 
    }  ( 
    assignments-snapshot  
    
                                                                    
    storm-cluster-state  
    sync-callback  
    
                                                                    
    assignment-versions) 
    
           
    ;; 调用read-storm-code-locations函数获取topology-id->nimbus上该topology代码目录的map                                                  
    
           
    storm-code-map ( 
    read-storm-code-locations  
    assignments-snapshot) 
    
           
    ;; read-downloaded-storm-ids函数从supervisor本地的"{storm.local.dir}/stormdist"目录读取已经下载了代码jar包的topology-id 
    
           
    downloaded-storm-ids ( 
    set ( 
    read-downloaded-storm-ids  
    conf)) 
    
           
    ;; all-assignment绑定该supervisor上的所有分配信息，即port->LocalAssignment对象的map 
    
           
    all-assignment ( 
    read-assignments 
    
                            
    assignments-snapshot 
    
                           ( 
    :assignment-id  
    supervisor)) 
    
           
    ;; 调用isupervisor对象的confirmAssigned函数验证all-assignment的key即port的有效性，将通过验证的保存到new-assignment中。isupervisor对象是在standalone-supervisor函数中创建的，查看standalone-supervisor函数，我们可以发现isupervisor对象的confirmAssigned函数只是返回true，所以new-assignment=all-assignment 
    
           
    new-assignment ( 
    ->>  
    all-assignment 
    
                              ( 
    filter-key  
    #( 
    .confirmAssigned  
    isupervisor  
    %))) 
    
           
    ;; assigned-storm-ids绑定分配给该supervisor的topology-id的集合 
    
           
    assigned-storm-ids ( 
    assigned-storm-ids-from-port-assignments  
    new-assignment) 
    
           
    ;; existing-assignment绑定该supervisor上已经存在的分配信息 
    
           
    existing-assignment ( 
    .get  
    local-state  
    LS-LOCAL-ASSIGNMENTS 
    )] 
    
      ( 
    log-debug  
    "Synchronizing supervisor") 
    
      ( 
    log-debug  
    "Storm code map: "  
    storm-code-map) 
    
      ( 
    log-debug  
    "Downloaded storm ids: "  
    downloaded-storm-ids) 
    
      ( 
    log-debug  
    "All assignment: "  
    all-assignment) 
    
      ( 
    log-debug  
    "New assignment: "  
    new-assignment) 
    
       
    
       
    ;; download code first 
    
       
    ;; This might take awhile 
    
       
    ;;   - should this be done separately from usual monitoring? 
    
       
    ;; should we only download when topology is assigned to this supervisor? 
    
       
    ;; storm-code-map绑定当前集群上已分配的所有topology-id->nimbus上代码jar包目录的键值对的map 
    
      ( 
    doseq  
    [[ 
    storm-id  
    master-code-dir 
    ]  
    storm-code-map 
    ] 
    
         
    ;; 如果downloaded-storm-ids集合不包含该storm-id，且assigned-storm-ids集合包含该storm-id（表明该storm-id需要在该superior上运行，但是该storm-id的代码jar包还没有从nimbus服务器下载到本地），则调用download-storm-code函数下载代码jar包 
    
        ( 
    when ( 
    and ( 
    not ( 
    downloaded-storm-ids  
    storm-id)) 
    
                   ( 
    assigned-storm-ids  
    storm-id)) 
    
          ( 
    log-message  
    "Downloading code for storm id " 
    
              
    storm-id 
    
              
    " from " 
    
              
    master-code-dir) 
    
           
    ;; 从nimbus服务器上下载该storm-id相关的代码jar包，序列化后的topology对象，运行时所需的配置信息，并将其保存到"{storm.local.dir}/nimbus/stormdist/{storm-id}/"目录 
    
          ( 
    download-storm-code  
    conf  
    storm-id  
    master-code-dir) 
    
          ( 
    log-message  
    "Finished downloading code for storm id " 
    
              
    storm-id 
    
              
    " from " 
    
              
    master-code-dir) 
    
          )) 
    
 
    
      ( 
    log-debug  
    "Writing new assignment " 
    
                 ( 
    pr-str  
    new-assignment)) 
    
       
    ;; existing-assignment与new-assignment的差集表示不需要在该supervisor上运行的分配的集合，所以要把这些分配对应的worker关闭 
    
      ( 
    doseq  
    [p ( 
    set/difference ( 
    set ( 
    keys  
    existing-assignment)) 
    
                                ( 
    set ( 
    keys  
    new-assignment 
    )))] 
    
         
    ;; 当前storm版本0.9.2中，killedWorker为空实现，所以什么都没做 
    
        ( 
    .killedWorker  
    isupervisor ( 
    int p))) 
    
       
    ;; assigned函数为空实现，什么也没有做 
    
      ( 
    .assigned  
    isupervisor ( 
    keys  
    new-assignment)) 
    
       
    ;; 将最新分配信息new-assignment保存到local-state数据库中 
    
      ( 
    .put  
    local-state 
    
             
    LS-LOCAL-ASSIGNMENTS 
    
             
    new-assignment) 
    
       
    ;; 将带有版本号的分配信息versions存入supervisor缓存:assignment-versions中 
    
      ( 
    swap! ( 
    :assignment-versions  
    supervisor)  
    versions) 
    
       
    ;; 重新设置supervisor缓存的:curr-assignment值为new-assignment，即保存当前storm集群上最新分配信息 
    
      ( 
    reset! ( 
    :curr-assignment  
    supervisor)  
    new-assignment) 
    
       
    ;; remove any downloaded code that's no longer assigned or active 
    
       
    ;; important that this happens after setting the local assignment so that 
    
       
    ;; synchronize-supervisor doesn't try to launch workers for which the 
    
       
    ;; resources don't exist 
    
       
    ;; 如果当前supervisor服务器的操作系统是"Windows_NT"系统，那么执行shutdown-disallowed-workers函数，关闭状态为:disallowed的worker 
    
      ( 
    if  
    on-windows? ( 
    shutdown-disallowed-workers  
    supervisor)) 
    
       
    ;; 遍历downloaded-storm-ids集合，该集合内存放了已经下载了jar包等信息的topology的id 
    
      ( 
    doseq  
    [ 
    storm-id  
    downloaded-storm-ids 
    ] 
    
         
    ;; 如果storm-id不在assigned-storm-ids集合内，则递归删除"{storm.local.dir}/supervisor/stormdist/{storm-id}"目录。assigned-storm-ids表示当前需要在该supervisor上运行的topology的id 
    
        ( 
    when-not ( 
    assigned-storm-ids  
    storm-id) 
    
          ( 
    log-message  
    "Removing code for storm id " 
    
                        
    storm-id) 
    
          ( 
    try 
    
            ( 
    rmr ( 
    supervisor-stormdist-root  
    conf  
    storm-id)) 
    
            ( 
    catch  
    Exception  
    e ( 
    log-message ( 
    .getMessage  
    e)))) 
    
          )) 
    
       
    ;; 将sync-processes函数添加到processes-event-manager事件管理器中，这样就可以在一个单独线程内执行sync-processes函数。因为sync-processes函数比较耗时，所以需要在一个新的线程内执行 
    
      ( 
    .add  
    processes-event-manager  
    sync-processes) 
    
      ))) 
   

assignments-snapshot函数定义如下：

assignments-snapshot函数

 
    ;; assignments-snapshot函数从zookeeper的子节点"/assignments"获取分配信息，并将回调函数添加到子节点"/assignments"上，assignment-versions绑定该supervisor本地缓存的带有版本号的分配信息 
    
 ( 
    defn-  
    assignments-snapshot  
    [ 
    storm-cluster-state  
    callback  
    assignment-versions 
    ] 
    
   
    ;; storm-ids绑定已分配的topology-id的集合，获取/assignments的子节点列表，如果callback不为空，将其赋值给assignments-callback，并对/assignments添加"节点观察"，这样supervisor就能感知集群是否有新的assignment或者有assignment被删除 
    
  ( 
    let  
    [ 
    storm-ids ( 
    .assignments  
    storm-cluster-state  
    callback 
    )] 
    
     
    ;; new-assignments绑定最新分配信息 
    
    ( 
    let  
    [ 
    new-assignments  
    
          ( 
    ->> 
    
            
    ;; sid绑定topology-id 
    
           ( 
    dofor  
    [ 
    sid  
    storm-ids 
    ]  
    
                   
    ;; recorded-version绑定该supervisor上缓存的该sid的分配信息版本号 
    
                  ( 
    let  
    [ 
    recorded-version ( 
    :version ( 
    get  
    assignment-versions  
    sid 
    ))] 
    
                     
    ;; assignment-version绑定zookeeper上"/assignments/{sid}"节点数据及其版本号，并注册回调函数 
    
                    ( 
    if-let  
    [ 
    assignment-version ( 
    .assignment-version  
    storm-cluster-state  
    sid  
    callback 
    )] 
    
                       
    ;; 如果缓存的分配版本号和zookeeper上获取的分配版本号相等，则返回sid->缓存的分配信息的map，否则从zookeeper的"/assignments/{sid}"节点重新获取带有版本号的分配信息，并注册回调函数，这样supervisor就能感知某个已存在的assignment是否被重新分配 
    
                      ( 
    if ( 
    =  
    assignment-version  
    recorded-version) 
    
                         
    { 
    sid ( 
    get  
    assignment-versions  
    sid 
    )} 
    
                         
    { 
    sid ( 
    .assignment-info-with-version  
    storm-cluster-state  
    sid  
    callback 
    )}) 
    
                       
    ;; 如果从zookeeper上获取分配信息失败，值为{sid nil} 
    
                       
    { 
    sid  
    nil 
    }))) 
    
            
    ;; 将dofor结果进行合并，形如：{sid_1 {:data data_1 :version version_1}, sid_2 {:data data_2 :version version_2},......sid_n {:data data_n :version version_n} } 
    
           ( 
    apply  
    merge) 
    
            
    ;; 保留值不空的键值对 
    
           ( 
    filter-val  
    not-nil? 
    ))] 
    
       
    ;; 返回的map形如：{:assignments {sid_1 data_1, sid_2 data_2, ...... , sid_n data_n}, :versions {sid_1 {:data data_1 :version version_1}, sid_2 {:data data_2 :version version_2},......sid_n {:data data_n :version version_n} } }     
    
       
    ;; data_x是一个AssignmentInfo对象，AssignmentInfo对象包含对应的nimbus上的代码目录,所有task的启动时间,每个task与机器、端口的映射 
    
       
    { 
    :assignments ( 
    into  
    {} ( 
    for  
    [[ 
    k  
    v 
    ]  
    new-assignments 
    ]  
    [ 
    k ( 
    :data  
    v 
    )])) 
    
        
    :versions  
    new-assignments 
    }))) 
   

read-assignments函数定义如下：

read-assignments函数

     ( 
    defn-  
    read-assignments 
    
   
    "Returns map from port to struct containing :storm-id and :executors" 
    
   
    ;; assignments-snapshot绑定topology-id->分配信息AssignmentInfo对象的map，assignment-id绑定supervisor-id 
    
   
    [ 
    assignments-snapshot  
    assignment-id 
    ] 
    
   
    ;; 遍历read-my-executors函数返回结果，检查是否存在多个topology分配到同一个端口，如果存在则抛出异常。检查的方式特别巧妙，通过对返回结果调用merge-with函数，如果返回结果中存在相同的port，那么就会调用 
    
   
    ;; 匿名函数(fn [& ignored] ......)，这样就会抛出异常 
    
  ( 
    ->> ( 
    dofor  
    [ 
    sid ( 
    keys  
    assignments-snapshot 
    )] ( 
    read-my-executors  
    assignments-snapshot  
    sid  
    assignment-id)) 
    
       ( 
    apply merge-with ( 
    fn  
    [ 
    &  
    ignored 
    ] ( 
    throw-runtime  
    "Should not have multiple topologies assigned to one port"))))) 
   

read-my-executor函数定义如下：

read-my-executor函数

 
    ;; assignments-snapshot绑定topology-id->分配信息AssignmentInfo对象的map，assignment-id绑定supervisor-id，storm-id为topoloy-id 
    
 ( 
    defn-  
    read-my-executors  
    [ 
    assignments-snapshot  
    storm-id  
    assignment-id 
    ] 
    
  ( 
    let  
    [ 
    assignment ( 
    get  
    assignments-snapshot  
    storm-id) 
    
         
    ;; my-executors绑定分配给该supervisor的executor信息，即executor->node+port的map 
    
         
    my-executors ( 
    filter ( 
    fn  
    [[ 
    _  
    [ 
    node  
    _ 
    ]]] ( 
    = node  
    assignment-id)) 
    
                           ( 
    :executor->node+port  
    assignment)) 
    
         
    ;; port-executors绑定port->executor-id集合的map，merge-with函数的作用就是对key相同的value调用concat函数 
    
         
    port-executors ( 
    apply  
    merge-with 
    
                           
    concat 
    
                          ( 
    for  
    [[ 
    executor  
    [ 
    _  
    port 
    ]]  
    my-executors 
    ] 
    
                             
    { 
    port  
    [ 
    executor 
    ]} 
    
                             
    ))] 
    
     
    ;; 返回port->LocalAssignment对象的map，LocalAssignment包含两个属性：topology-id和executor-id集合 
    
    ( 
    into  
    {} ( 
    for  
    [[ 
    port  
    executors 
    ]  
    port-executors 
    ] 
    
                
    ;; need to cast to int b/c it might be a long (due to how yaml parses things) 
    
                
    ;; doall is to avoid serialization/deserialization problems with lazy seqs 
    
                
    [( 
    Integer.  
    port) ( 
    LocalAssignment.  
    storm-id ( 
    doall  
    executors 
    ))] 
    
               )))) 
   

download-storm-code函数定义如下：

download-storm-code函数

     ( 
    defmulti  
    download-storm-code  
    cluster-mode) 
    
 
    download-storm-code 
    函数是一个 
    "多重函数" 
    ，根据 
    cluster-mode 
    函数的返回值决定调用哪个函数， 
    cluster-mode 
    函数可能返回关键字 
    :distributed 
    和 
    :local 
    ，如果返回 
    :distributed 
    ，那么会调用下面这个函数。 
    
 ( 
    defmethod  
    download-storm-code 
    
     
    ;; master-code-dir绑定storm-id的代码jar包在nimbus服务器上的路径 
    
     
    :distributed  
    [ 
    conf  
    storm-id  
    master-code-dir 
    ] 
    
     
    ;; Downloading to permanent location is atomic 
    
     
    ;; tmproot绑定supervisor本地路径"{storm.local.dir}/supervisor/tmp/{uuid}"，临时存放从nimbus上下载的代码jar包 
    
    ( 
    let  
    [ 
    tmproot ( 
    str ( 
    supervisor-tmp-dir  
    conf)  
    file-path-separator ( 
    uuid)) 
    
           
    ;; stormroot绑定该storm-id的代码jar包在supervisor上的路径"{storm.local.dir}/supervisor/stormdist/{storm-id}" 
    
           
    stormroot ( 
    supervisor-stormdist-root  
    conf  
    storm-id 
    )] 
    
       
    ;; 创建临时目录tmproot 
    
      ( 
    FileUtils/forceMkdir ( 
    File.  
    tmproot)) 
    
       
    ;; 将nimbus服务器上的"{storm.local.dir}/nimbus/stormdist/{storm-id}/stormjar.jar"文件下载到supervisor服务器的tmproot目录中，stormjar.jar包含这个topology所有代码 
    
      ( 
    Utils/downloadFromMaster  
    conf ( 
    master-stormjar-path  
    master-code-dir) ( 
    supervisor-stormjar-path  
    tmproot)) 
    
       
    ;; 将nimbus服务器上的"{storm.local.dir}/nimbus/stormdist/{storm-id}/stormcode.ser"文件下载到supervisor服务器的tmproot目录中，stormcode.ser是这个topology对象的序列化 
    
      ( 
    Utils/downloadFromMaster  
    conf ( 
    master-stormcode-path  
    master-code-dir) ( 
    supervisor-stormcode-path  
    tmproot)) 
    
       
    ;; 将nimbus服务器上的"{storm.local.dir}/nimbus/stormdist/{storm-id}/stormconf.ser"文件下载到supervisor服务器的tmproot目录中，stormconf.ser包含运行这个topology的配置 
    
      ( 
    Utils/downloadFromMaster  
    conf ( 
    master-stormconf-path  
    master-code-dir) ( 
    supervisor-stormconf-path  
    tmproot)) 
    
       
    ;; RESOURCES-SUBDIR值为字符串"resources"，extract-dir-from-jar函数主要作用就是将jar包解压，然后将jar包中路径以"resources"开头的文件解压到"{tmproot}/resources/......"目录 
    
      ( 
    extract-dir-from-jar ( 
    supervisor-stormjar-path  
    tmproot)  
    RESOURCES-SUBDIR  
    tmproot) 
    
       
    ;; 将临时目录tmproot中的文件剪切到stormroot目录中，这样"{storm.local.dir}/nimbus/stormdist/{storm-id}/"目录中将包括resources目录，stormjar.jar文件，stormcode.ser文件，stormconf.ser文件 
    
      ( 
    FileUtils/moveDirectory ( 
    File.  
    tmproot) ( 
    File.  
    stormroot)) 
    
      )) 
   

extract-dir-from-jar函数定义如下：

extract-dir-from-jar函数

 
    ;; jarpath标识jar路径，dir标识"resources"，destdir标识"{tmproot}"路径 
    
 ( 
    defn  
    extract-dir-from-jar  
    [ 
    jarpath  
    dir  
    destdir 
    ] 
    
  ( 
    try-cause 
    
     
    ;; 使用类ZipFile来解压jar包，jarpath绑定ZipFile对象 
    
    ( 
    with-open  
    [ 
    jarpath ( 
    ZipFile.  
    jarpath 
    )] 
    
       
    ;; 调用entries方法，返回一个枚举对象，然后调用enumeration-seq函数获取文件的ZIP条目对象 
    
      ( 
    let  
    [ 
    entries ( 
    enumeration-seq ( 
    .entries  
    jarpath 
    ))] 
    
         
    ;; 遍历entries中路径以"resources"开头的文件 
    
        ( 
    doseq  
    [ 
    file ( 
    filter ( 
    fn  
    [ 
    entry 
    ]( 
    and ( 
    not ( 
    .isDirectory  
    entry)) ( 
    .startsWith ( 
    .getName  
    entry)  
    dir)))  
    entries 
    )] 
    
           
    ;; 在"tmproot"目录中创建文件的完整父路径 
    
          ( 
    .mkdirs ( 
    .getParentFile ( 
    File.  
    destdir ( 
    .getName  
    file)))) 
    
           
    ;; 将文件复制到"{tmproot}/{在压缩文件中的路径}" 
    
          ( 
    with-open  
    [ 
    out ( 
    FileOutputStream. ( 
    File.  
    destdir ( 
    .getName  
    file 
    )))] 
    
            ( 
    io/copy ( 
    .getInputStream  
    jarpath  
    file)  
    out))))) 
    
    ( 
    catch  
    IOException  
    e 
    
      ( 
    log-message  
    "Could not extract "  
    dir  
    " from "  
    jarpath)))) 
   

以上就是storm启动supervisor的完整流程，启动supervisor的工作主要是在mk-supervisor函数中进行的，所以阅读该部分源码时，要首先从该函数入手，然后依次分析在该函数中所调用的其他函数，根据函数的控制流程分析每个函数。

你可能感兴趣的:(storm启动supervisor源码分析-supervisor.clj)

「豆包Marscode体验官」 | 云端 IDE 启动 & Rust 体验张风捷特烈 ide rust 开发语言后端
theme:cyanosis我正在参加「豆包MarsCode初体验」征文活动MarsCode可以看作一个运行在服务端的远程VSCode开发环境。对于我这种想要学习体验某些语言，但不想在电脑里装环境的人来说非常友好。本文就来介绍一下在MarsCode里，我的体验rust开发体验。一、MarsCode是什么它的本质是:提供代码助手和云端IDE服务的web网站，可通过下面的链接访问https://www
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
ubuntu安装wordpress lissettecarlr
1安装nginx网上安装方式很多，这就就直接用apt-get了apt-getinstallnginx不用启动啥，然后直接在浏览器里面输入IP:80就能看到nginx的主页了。如果修改了一些配置可以使用下列命令重启一下systemctlrestartnginx.service2安装mysql输入安装前也可以更新一下软件源，在安装过程中将会让你输入数据库的密码。sudoapt-getinstallmy
最简单将静态网页挂载到服务器上(不用nginx) 全能全知者服务器 nginx 运维前端 html 笔记
最简单将静态网页挂载到服务器上(不用nginx)如果随便弄个静态网页挂在服务器都要用nignx就太麻烦了，所以直接使用Apache来搭建一些简单前端静态网页会相对方便很多检查Web服务器服务状态：sudosystemctlstatushttpd#ApacheWeb服务器如果发现没有安装web服务器：安装Apache：sudoyuminstallhttpd启动Apache：sudosystemctl
Ubuntu18.04 Docker部署Kinship(Django)项目过程 Dante617
1Docker的安装https://blog.csdn.net/weixin_41735055/article/details/1003551792下载镜像dockerpullprogramize/python3.6.8-dlib下载的镜像里包含python3.6.8和dlib19.17.03启动镜像dockerrun-it--namekinship-p7777:80-p3307:3306-p55
TC27x启动过程（2）-TC277 赞哥哥s TC277学习笔记 gnu 单片机
接上文，继续学习TC277的启动过程。分析启动函数有关用的寄存器说明，参考文章TC27x寄存器学习目录TC27x寄存器学习start函数分析isync汇编指令（同步指令）dsync汇编指令（同步数据），1清除endinit2设置中断堆栈3启用对系统全局寄存器的写访问4初始化SDA基指针5关闭对系统全局寄存器的写访问6关闭看门狗，恢复Endinit位7初始化CSA8初始化ram,拷贝rom数据到ra
‌汽车一键式启动系统‌包含哪些功能 zsmydz888 汽车一键式启动系统‌汽车无钥匙启动系统汽车
‌汽车一键式启动系统‌是一种智能化的汽车启动系统，它通过一个按钮来启动和熄灭发动机，取代了传统的钥匙启动方式。这个系统不仅简化了启动和熄火的步骤，还提供了多种智能化的功能，如自动开锁、自动关锁、自动关窗、自动防盗等。此外，汽车一键式启动系统还支持远程启动和紧急熄火功能，以及个性化设置记忆功能，大大提升了驾驶的便利性和安全性。‌移动管家汽车无钥匙进入一键启动基本功能‌：‌一键启动与熄火‌：通过轻按按
JVM源码分析之堆外内存完全解读 HeapDump性能社区
概述广义的堆外内存说到堆外内存，那大家肯定想到堆内内存，这也是我们大家接触最多的，我们在jvm参数里通常设置-Xmx来指定我们的堆的最大值，不过这还不是我们理解的Java堆，-Xmx的值是新生代和老生代的和的最大值，我们在jvm参数里通常还会加一个参数-XX:MaxPermSize来指定持久代的最大值，那么我们认识的Java堆的最大值其实是-Xmx和-XX:MaxPermSize的总和，在分代算法
html+css网页设计旅游网站首页1个页面 html+css+js网页设计 html css 旅游
html+css网页设计旅游网站首页1个页面网页作品代码简单，可使用任意HTML辑软件（如：Dreamweaver、HBuilder、Vscode、Sublime、Webstorm、Text、Notepad++等任意html编辑软件进行运行及修改编辑等操作）。获取源码1，访问该网站https://download.csdn.net/download/qq_42431718/897527112，点击
Istio pilot-discovery服务发现源码解析（1.13版本） xidianjiapei001 #Istio istio 云原生服务发现
Istiopilot-discovery服务发现介绍工作机制初始化初始化Config控制器初始化Service控制器controller初始化NamespaceServiceNodePodPilotDiscovery各组件启动流程DiscoveryServer接收Envoy的gRPC连接请求流程Config变化后向Envoy推送更新的流程总结参考介绍IstioPilot的代码分为Pilot-Dis
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
管理员权限的软件不能开机自启动的解决方法 ss_ctrl
这是几种解决方法：1.将启动参数写入到32位注册表里面去在64位系统下我们64位的程序访问此HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\CurrentVersion\Run注册表路径，是可以正确访问的，32位程序访问此注册表路径时，默认会被系统自动映射到HKEY_LOCAL_MACHINE\SOFTWARE\WOW6432Node\Microsoft
Lua 与 C#交互 z2014z lua c#开发语言
Lua与C#交互前提Lua是一种嵌入式脚本语言，Lua的解释器是用C编写的，因此可以方便的与C/C++进行相互调用。轻量级Lua语言的官方版本只包括一个精简的核心和最基本的库，这使得Lua体积小、启动速度快，也适合嵌入在别的程序里。交互过程C#调用Lua:由C#文件调用Lua解析器底层dll库（由C语言编写），再由dll文件执行相应的Lua文件。Lua调用C#：1、Wrap方式：首先生成C#源文件
webstorm报错TypeError: this.cliEngine is not a constructor Blue_Color
点击Details在控制台会显示报错的位置TypeError:this.cliEngineisnotaconstructoratESLintPlugin.invokeESLint(/Applications/RubyMine.app/Contents/plugins/JavaScriptLanguage/languageService/eslint/bin/eslint-plugin.js:97:
sentinel 不显示项目_Sentinel相关问题记录 weixin_39840606 sentinel 不显示项目
SentinelFAQ整理Sentinel承接阿里巴巴近10年双十一大促流量的核心场景，以流量为切入点，从流量控制、熔断降级、系统负载保护等多个维度保护服务的稳定性。其提供丰富的应用场景支持、完备的监控能力、易用的拓展点。Note:中文文档请见此处。热点问题1、Q:dashboard不展示监控问题如何排查？dashboard是一个单独启动的控制台，引入sentinel的应用是一个客户端。它们各自有
Golang Channel PandaSkr golang
Channel解析1.Channel源码分析1.1Channel数据结构typehchanstruct{qcountuint//channel的元素数量dataqsizuint//channel循环队列长度bufunsafe.Pointer//指向循环队列的指针elemsizeuint16//元素大小closeduint32//channel是否关闭0-未关闭elemtype*_type//元素类
小米嵌入式面试题目RTOS面试题目嵌入式面试题目好家伙VCC 面试杂谈杂谈面试职场和发展
第一章-非RTOSbootloader工作流程MCU启动流程通信协议，SPIIICMCU怎么选型，STM32F1和F4有什么区别外部RAM和内部RAM区别，怎么分配外部总线和内部总线区别MCU上的固件，数据是怎么分配的MCU启动流程IAP是怎么升级的，突然断电怎么办挑了麦轮项目（因为大疆RM也是麦轮，面试官看样子比较感兴趣）为什么用的CAN总线你说一下spi和i2c和UART的各自的工作方式优缺点
若依后端正常启动但是uniapp移动端提示后端接口异常大可大可抖 uni-app
pc端能用模拟器也能正常连接接口，手机端真机调试连不上接口解决：1.先看config.js的填自己的ip地址module.exports={//baseUrl:'https://vue.ruoyi.vip/prod-api',baseUrl:"http://192.168.101.5:8080",}2.网络环境问题（防火墙）点击属性然后选择专用
PMP冲刺一 Cynric
记录考点一、计算类考题一般就1题，主要涉及在三大过程组：启动过程组、规划过程组、控制过程组。1.启动过程组项目选择方法涉及名词：NPV净现值、IRR内部收益率、BCR投资回报率、ROI投资利润率、回收期2.规划过程组三点估算PERT法（默认使用贝塔分布）三角分布：Te=(O+M+P)/3贝塔分布：Te=(O+4M+P)/6关键路径法CPM关键路径是相对的，也可以是变化的。路径汇聚固定资产折旧沟通渠
C# 禁止程序重复启动 wiseyao1219 c#
修改：Program.cs[STAThread]staticvoidMain(){Mutexmutex=newMutex(true,"NewGuid123456",outboolisCreatedNew);if(!isCreatedNew){MessageBox.Show(Application.ProductName+"isrunning...");return;}Application.Ena
linux挂载文件夹小码快撩 linux
1.使用NFS（NetworkFileSystem）NFS是一种分布式文件系统协议，允许一个系统将其文件系统的一部分共享给其他系统。检查是否安装NFSrpm-qa|grepnfs2.启动和启用NFS服务假设服务名称为nfs-server.service，你可以使用以下命令启动和启用它：sudosystemctlstartnfs-server.servicesudosystemctlenablenf
Java集合类框架源码分析之 RoleList源码解析【6】 yunzhonghefei Java集合类源码分析 RoleList源码解析
该类继承于ArrayList，针对Role进行了一些扩展。其他方法和ArrayList中基本相同，源码不做针对性分析：看一下类简介：/***代表了一个roles的列表，作为方法setRoles()的参数，去创建一个关联关系，并且尝试在同一个关系中设置多个角色。*ARoleListrepresentsalistofroles(Roleobjects).Itisusedas*parameterwhen
【鸿蒙OH-v5.0源码分析之 Linux Kernel 部分】004 - Kernel 启动引导代码head.S 源码逐行分析 "小夜猫&小懒虫&小财迷"的男人鸿蒙OH-v5.0源码分析之 Uboot+Kernel 部分 harmonyos linux 华为
【鸿蒙OH-v5.0源码分析之LinuxKernel部分】004-Kernel启动引导代码head.S源码逐行分析系列文章汇总：《鸿蒙OH-v5.0源码分析之Uboot+Kernel部分】000-文章链接汇总》本文链接：《【鸿蒙OH-v5.0源码分析之LinuxKernel部分】004-Kernel启动引导代码head.S源码逐行分析》head.S主要工作如下：保存内核启动参数,无效化处理器缓存(
安卓玩机搞机技巧综合资源----安卓机型使用ADB指令无需root 卸载禁用当前机型各种软件app 安卓机器安卓玩机搞机技巧综合资源 android
在前面的博文我有分享过如何使用adb来卸载禁用有些系统自带的软件。今天将详细的步骤来讲解。在操作前需要注意。不要禁用或者卸载有些系统应用如应用商店和系统更新等。否则系统严重会导致不开机。在做未有把握操作之前，最好先备份数据。如果遇到卡logo问题，极端情况下可能要在Recovery界面清除数据才能启动系统或者线刷来救砖。前期工作1----下载adb环境工具｛https://dl.google.co
docker项目切换（nginx）、重启shell 脚本懒惰的小蜗牛 docker docker nginx 容器
docker项目切换、重启脚本背景具体操作nginx配置配置文件1配置文件2编写nginx替换脚本(用来执行端口替换)编写启动脚本dockerfile文件正常编写给脚本授权执行./start脚本背景项目部署docker中，更新项目时，需要将原原来的容器停止，再启动新的容器，这样会有一个空窗期，导致不可用解决方案：映射不同的端口并启动新的容器，将nginx转发到新容器，停止旧容器具体操作说明ngin
【MySQL】Win10安装MySQL-5.7.24-winX64 启动服务器失败并且没有错误提示 Jinlong_Xu 数据库SQL实战 mysql-5.7.24 MySQL 服务无法启动 net start mysql
今天安装mysql-5.24-winX64后，在bin目录下运行netstartmysql,出现无法启动的情况：找了很多的教程，大部分的教程都是类似于下面的解决方案：但是我使用这些解决方法的时候，发现并不能很好的解决这个问题。我就核对我和他们的不一样，同时注意到cmd中打印的信息：我注意到很多的解决方案都是要初始化，所以我觉得我可能初始化的命令不对。步骤一：删除mysql目录下的data文件夹中的
2021-7-30晨间日记江湖微冷
离家倒计时启动起床：6.00就寝：22.30天气：晴好下午阵雨心情：抑郁纪念日：离家倒计时任务清单昨日完成的任务，最重要的三件事：1.与亲人聚餐2.与家人谈心3.取回资格证改进：少吃少说话习惯养成：继续坚持运动月目标·完成进度挑战月100公里完成
《黑神话：悟空》游戏AkExpander.dll文件缺失，使用工具修复更快捷李秋秋啊游戏
在Windows操作系统中，当遇到“黑神话：悟空”游戏中的AkExpander.dll文件丢失问题时，用户可能会经历游戏启动失败或运行中断的情况。这个DLL文件是游戏正常运行所必需的，缺失或损坏会导致关键功能无法执行，影响游戏体验。针对《黑神话：悟空》游戏中AkExpander.dll文件缺失的问题，您可以尝试以下几种解决方法：一、重新安装游戏首先，考虑卸载当前安装的游戏版本，并从官方渠道重新下载
gunicorn未重启，导致代码没拉到最新问题。给我起把狙 gunicorn linux 运维
问题描述：我的测试环境的django项目是用gunicorn启动的，然后我本地使用pythonmanagy.py启动的，新写了个接口，在本地测试没问题，在测试环境报404。我发现发了最新代码到远端，然后我在测试环境pull下来的时候出问题了，代码不是最新的，后来我的经理告诉我说要重启gunicorn的主进程给了我一条指令"kill-HUPgunicorn_pid(最小的)”，针对这个问题我大致做了
MySQL数据库全面学习之（上篇）一心只为学数据库 mysql 学习
Windows服务--启动MySQLnetstartmysql--创建Windows服务sccreatemysqlbinPath=mysqld_bin_path(注意：等号与值之间有空格)连接与断开服务器mysql-h地址-P端口-u用户名-p密码SHOWPROCESSLIST--显示哪些线程正在运行SHOWVARIABLES--显示系统变量信息数据库操作--查看当前数据库SELECTDATABA
C/C++Win32编程基础详解视频下载择善Zach 编程 C++Win32
课题视频：C/C++Win32编程基础详解视频知识：win32窗口的创建 windows事件机制主讲：择善Uncle老师学习交流群：386620625 验证码：625 --
Guava Cache使用笔记 bylijinnan java guava cache
1.Guava Cache的get/getIfPresent方法当参数为null时会抛空指针异常我刚开始使用时还以为Guava Cache跟HashMap一样，get(null)返回null。实际上Guava整体设计思想就是拒绝null的，很多地方都会执行com.google.common.base.Preconditions.checkNotNull的检查。 2.Guava
解决ora-01652无法通过128（在temp表空间中） 0624chenhong oracle
解决ora-01652无法通过128（在temp表空间中）扩展temp段的过程一个sql语句后，大约花了10分钟，好不容易有一个结果，但是报了一个ora-01652错误，查阅了oracle的错误代码说明：意思是指temp表空间无法自动扩展temp段。这种问题一般有两种原因：一是临时表空间空间太小，二是不能自动扩展。分析过程：既然是temp表空间有问题，那当
Struct在jsp标签不懂事的小屁孩 struct
非UI标签介绍：控制类标签： 1：程序流程控制标签 if elseif else <s:if test="isUsed"> <span class="label label-success">True</span> </
按对象属性排序换个号韩国红果果 JavaScript 对象排序
利用JavaScript进行对象排序，根据用户的年龄排序展示 <script> var bob={ name;bob, age:30 } var peter={ name;peter, age:30 } var amy={ name;amy, age:24 } var mike={ name;mike, age:29 } var john={
大数据分析让个性化的客户体验不再遥远蓝儿唯美数据分析
顾客通过多种渠道制造大量数据，企业则热衷于利用这些信息来实现更为个性化的体验。分析公司Gartner表示，高级分析会成为客户服务的关键，但是大数据分析的采用目前仅局限于不到一成的企业。挑战在于企业还在努力适应结构化数据，疲于根据自身的客户关系管理（CRM）系统部署有效的分析框架，以及集成不同的内外部信息源。然而，面对顾客通过数字技术参与而产生的快速变化的信息，企业需要及时作出反应。要想实
java笔记4 a-john java
操作符 1，使用java操作符操作符接受一个或多个参数，并生成一个新值。参数的形式与普通的方法调用不用，但是效果是相同的。加号和一元的正号（+）、减号和一元的负号（-）、乘号（*）、除号（/）以及赋值号（=）的用法与其他编程语言类似。操作符作用于操作数，生成一个新值。另外，有些操作符可能会改变操作数自身的
从裸机编程到嵌入式Linux编程思想的转变------分而治之：驱动和应用程序 aijuans 嵌入式学习
笔者学习嵌入式Linux也有一段时间了，很奇怪的是很多书讲驱动编程方面的知识，也有很多书将ARM9方面的知识，但是从以前51形式的（对寄存器直接操作，初始化芯片的功能模块）编程方法，和思维模式，变换为基于Linux操作系统编程，讲这个思想转变的书几乎没有，让初学者走了很多弯路，撞了很多难墙。笔者因此写上自己的学习心得，希望能给和我一样转变
在springmvc中解决FastJson循环引用的问题 asialee 循环引用 fastjson
我们先来看一个例子： package com.elong.bms; import java.io.OutputStream; import java.util.HashMap; import java.util.Map; import co
ArrayAdapter和SimpleAdapter技术总结百合不是茶 android SimpleAdapter ArrayAdapter 高级组件基础
ArrayAdapter比较简单，但它只能用于显示文字。而SimpleAdapter则有很强的扩展性，可以自定义出各种效果 ArrayAdapter;的数据可以是数组或者是队列 // 获得下拉框对象 AutoCompleteTextView textview = (AutoCompleteTextView) this
九封信 bijian1013 人生励志
有时候，莫名的心情不好，不想和任何人说话，只想一个人静静的发呆。有时候，想一个人躲起来脆弱，不愿别人看到自己的伤口。有时候，走过熟悉的街角，看到熟悉的背影，突然想起一个人的脸。有时候，发现自己一夜之间就长大了。 2014，写给人
Linux下安装MySQL Web 管理工具phpMyAdmin sunjing PHP Install phpMyAdmin
PHP http://php.net/ phpMyAdmin http://www.phpmyadmin.net Error compiling PHP on CentOS x64 一、安装Apache 请参阅http://billben.iteye.com/admin/blogs/1985244 二、安装依赖包 sudo yum install gd
分布式系统理论 bit1129 分布式
FLP One famous theory in distributed computing, known as FLP after the authors Fischer, Lynch, and Patterson, proved that in a distributed system with asynchronous communication and process crashes,
ssh2整合(spring+struts2+hibernate)-附源码白糖_ eclipse spring Hibernate mysql 项目管理
最近抽空又整理了一套ssh2框架，主要使用的技术如下： spring做容器，管理了三层(dao,service,actioin)的对象 struts2实现与页面交互(MVC)，自己做了一个异常拦截器，能拦截Action层抛出的异常 hibernate与数据库交互 BoneCp数据库连接池，据说比其它数据库连接池快20倍，仅仅是据说 MySql数据库项目用eclipse
treetable bug记录 braveCS table
// 插入子节点删除再插入时不能正常显示。修改： //不知改后有没有错，先做个备忘 Tree.prototype.removeNode = function(node) { // Recursively remove all descendants of +node+ this.unloadBranch(node); // Remove
编程之美-电话号码对应英语单词 bylijinnan java 算法编程之美
import java.util.Arrays; public class NumberToWord { /** * 编程之美电话号码对应英语单词 * 题目： * 手机上的拨号盘，每个数字都对应一些字母，比如2对应ABC，3对应DEF.........，8对应TUV，9对应WXYZ， * 要求对一段数字，输出其代表的所有可能的字母组合
jquery ajax读书笔记 chengxuyuancsdn jQuery ajax
1、jsp页面 <%@ page language="java" import="java.util.*" pageEncoding="GBK"%> <% String path = request.getContextPath(); String basePath = request.getScheme()
JWFD工作流拓扑结构解析伪码描述算法 comsci 数据结构算法工作活动 J#
对工作流拓扑结构解析感兴趣的朋友可以下载附件，或者下载JWFD的全部代码进行分析 /* 流程图拓扑结构解析伪码描述算法 public java.util.ArrayList DFS(String graphid, String stepid, int j)
oracle I/O 从属进程 daizj oracle
I/O 从属进程　　I/O从属进程用于为不支持异步I/O的系统或设备模拟异步I/O.例如，磁带设备(相当慢)就不支持异步I/O.通过使用I/O 从属进程，可以让磁带机模仿通常只为磁盘驱动器提供的功能。就好像支持真正的异步I/O 一样，写设备的进程(调用者)会收集大量数据，并交由写入器写出。数据成功地写出时，写入器(此时写入器是I/O 从属进程，而不是操作系统)会通知原来的调用者，调用者则会
高级排序:希尔排序 dieslrae 希尔排序
public void shellSort(int[] array){ int limit = 1; int temp; int index; while(limit <= array.length/3){ limit = limit * 3 + 1;
初二下学期难记忆单词 dcj3sjt126com english word
kitchen 厨房 cupboard 厨柜 salt 盐 sugar 糖 oil 油 fork 叉；餐叉 spoon 匙；调羹 chopsticks 筷子 cabbage 卷心菜；洋白菜 soup 汤 Italian 意大利的 Indian 印度的 workplace 工作场所 even 甚至；更 Italy 意大利 laugh 笑 m
Go语言使用MySQL数据库进行增删改查 dcj3sjt126com mysql
目前Internet上流行的网站构架方式是LAMP，其中的M即MySQL, 作为数据库，MySQL以免费、开源、使用方便为优势成为了很多Web开发的后端数据库存储引擎。MySQL驱动Go中支持MySQL的驱动目前比较多，有如下几种，有些是支持database/sql标准，而有些是采用了自己的实现接口,常用的有如下几种: http://code.google.c...o-mysql-dri
git命令 shuizhaosi888 git
---------------设置全局用户名： git config --global user.name "HanShuliang" //设置用户名 git config --global user.email "[email protected]" //设置邮箱 ---------------查看环境配置 git config --li
qemu-kvm 网络 nat模式 (四) haoningabc kvm qemu
qemu-ifup-NAT #!/bin/bash BRIDGE=virbr0 NETWORK=192.168.122.0 GATEWAY=192.168.122.1 NETMASK=255.255.255.0 DHCPRANGE=192.168.122.2,192.168.122.254 TFTPROOT= BOOTP= function check_bridge()
不要让未来的你，讨厌现在的自己 jingjing0907 生活奋斗工作梦想
故事one 　23岁，他大学毕业，放弃了父母安排的稳定工作，独闯京城，在家小公司混个小职位，工作还算顺手，月薪三千，混了混，混走了一年的光阴。　　　　24岁，有了女朋友，从二环12人的集体宿舍搬到香山民居，一间平房，二人世界，爱爱爱。偶然约三朋四友，打扑克搓麻将，日子快乐似神仙；　　　　25岁，出了几次差，调了两次岗，薪水涨了不过百，生猛狂飙的物价让现实血淋淋，无力为心爱银儿购件大牌
枚举类型详解一路欢笑一路走 enum 枚举详解 enumset enumMap
枚举类型详解一.Enum详解 1.1枚举类型的介绍 JDK1.5加入了一个全新的类型的”类”—枚举类型，为此JDK1.5引入了一个新的关键字enum,我们可以这样定义一个枚举类型。 Demo:一个最简单的枚举类 public enum ColorType { RED
第11章动画效果（上） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Eclipse中jsp、js文件编辑时，卡死现象解决汇总 ljf_home eclipse jsp卡死 js卡死
使用Eclipse编辑jsp、js文件时，经常出现卡死现象，在网上百度了N次，经过N次优化调整后，卡死现象逐步好转，具体那个方法起到作用，不太好讲。将所有用过的方法罗列如下： 1、取消验证 windows–>perferences–>validation 把除了manual 下面的全部点掉，build下只留 classpath dependency Valida
MySQL编程中的6个重要的实用技巧 tomcat_oracle mysql
每一行命令都是用分号(;)作为结束对于MySQL，第一件你必须牢记的是它的每一行命令都是用分号(;)作为结束的，但当一行MySQL被插入在PHP代码中时，最好把后面的分号省略掉，例如： mysql_query("INSERT INTO tablename(first_name,last_name)VALUES('$first_name',$last_name')");
zoj 3820 Building Fire Stations(二分+bfs) 阿尔萨斯 Build
题目链接：zoj 3820 Building Fire Stations 题目大意：给定一棵树，选取两个建立加油站，问说所有点距离加油站距离的最大值的最小值是多少，并且任意输出一种建立加油站的方式。解题思路：二分距离判断，判断函数的复杂度是o(n)，这样的复杂度应该是o(nlogn)，即使常数系数偏大，但是居然跑了4.5s，也是醉了。判断函数里面做了3次bfs，但是每次bfs节点最多