秒速五CM

Twitter Storm源代码分析之Topology的执行过程

如何提交一个topology?

要提交一个topology给storm的话，我们在命令行里面是这么做的:

 
     帮助 
    
          storm jar allmycode.jar org.me.MyTopology arg1 arg2 arg3

那么在这个命令的背后，storm集群里面发生了什么呢？

storm里的幕后英雄:nimbus,supervisor

看似简单的topology提交，其实背后充满着血雨腥风(好吧，我夸张了), 我们来看看我们的幕后英雄nimbus, supervisor都做了什么。

上传topology的代码

首先由Nimbus$Iface的beginFileUpload, uploadChunk以及finishFileUpload方法来把jar包上传到nimbus服务器上的/inbox目录

 
     帮助 
    
          /{storm-local-dir} 
         
          | 
         
          |-/nimbus 
         
          | 
         
          |-/inbox                   -- 从nimbus客户端上传的jar包 
         
          |                            会在这个目录里面 
         
          | 
         
          |-/stormjar-{uuid}.jar  -- 上传的jar包其中{uuid}表示 
         
          生成的一个uuid

运行topology之前的一些校验

topology的代码上传之后Nimbus$Iface的submitTopology方法会负责对这个topology进行处理，它首先要对storm本身，以及topology进行一些校验:

它要检查storm的状态是否是active的
它要检查是否已经有同名的topology已经在storm里面运行了
因为我们会在代码里面给spout, bolt指定id, storm会检查是否有两个spout和bolt使用了相同的id。
任何一个id都不能以”__”开头，这种命名方式是系统保留的。

 
     帮助 
    
          (check-storm-active! nimbus storm-name false) 
         
          ( 
          defn 
           validate-topology!  
          [ 
          topology 
          ] 
         
          ( 
          let 
           [ 
          bolt-ids ( 
          keys 
           (.get_bolts topology)) 
         
          spout-ids ( 
          keys 
           (.get_spouts topology)) 
         
          state-spout-ids ( 
          keys 
           (.get_state_spouts topology)) 
         
          ; 三种id之间有没有交集？ 
         
          common (any-intersection bolt-ids spout-ids state-spout-ids) 
          ] 
         
          ; 这些id之间是不能有交集的: spout的id和bolt的id是不能一样的 
         
          ( 
          when 
          -not (empty? common) 
         
          ( 
          throw 
         
          (InvalidTopologyException. 
         
          ( 
          str 
           "Cannot use same component id for both spout and bolt: " 
         
          ( 
          vec 
           common)) 
         
          ))) 
         
          ; 用户定义的id不能以__开头, 这些是系统保留的 
         
          ( 
          when 
          -not (every? 
         
          (complement system-component?) 
         
          (concat bolt-ids spout-ids state-spout-ids)) 
         
          ( 
          throw 
         
          (InvalidTopologyException. 
         
          "Component ids cannot start with '__'" 
          ))) 
         
          ;; TODO: validate that every declared stream is not a system stream 
         
          ))

如果以上检查都通过了，那么就进入下一步了。

建立topology的本地目录

然后为这个topology建立它的本地目录:

 
     帮助 
    
          /{storm-local-dir} 
         
          | 
         
          |-/nimbus 
         
          | 
         
          |-/inbox                  -- 从nimbus客户端上传的jar包 
         
          |  |                            会在这个目录里面 
         
          |  | 
         
          |  |-/stormjar-{uuid}.jar -- 上传的jar包其中{uuid}表示 
         
          |                               生成的一个uuid 
         
          | 
         
          |-/stormdist 
         
          | 
         
          |-/{topology-id} 
         
          | 
         
          |-/stormjar.jar     -- 包含这个topology所有代码 
         
          |                       的jar包(从nimbus/inbox 
         
          |                       里面挪过来的) 
         
          | 
         
          |-/stormcode.ser    -- 这个topology对象的序列化 
         
          | 
         
          |-/stormconf.ser    -- 运行这个topology的配置

对应的代码：

 
     帮助 
    
          ( 
          defn 
          - setup-storm-code 
         
          [ 
          conf storm-id tmp-jar-location storm-conf topology 
          ] 
         
          ( 
          let 
           [ 
          stormroot (master-stormdist-root conf storm-id) 
          ] 
         
          (FileUtils/forceMkdir (File. stormroot)) 
         
          (FileUtils/cleanDirectory (File. stormroot)) 
         
          (setup-jar conf tmp-jar-location stormroot) 
         
          (FileUtils/writeByteArrayToFile 
         
          (File. (master-stormcode-path stormroot)) 
         
          (Utils/serialize topology)) 
         
          (FileUtils/writeByteArrayToFile 
         
          (File. (master-stormconf-path stormroot)) 
         
          (Utils/serialize storm-conf)) 
         
          ))

建立topology在zookeeper上的心跳目录

nimbus老兄是个有责任心的人，它虽然最终会把任务分成一个个task让supervisor去做，但是他时刻都在关注着大家的情况，所以它要求每个task每隔一定时间就要给它打个招呼(心跳信息), 以让它知道事情还在正常发展，如果有task超时不打招呼， nimbus会认为这个task不行了，然后进行重新分配。zookeeper上面的心跳目录:

 
     帮助 
    
          |-/taskbeats              -- 所有task的心跳 
         
          | 
         
          |-/{topology-id}      -- 这个目录保存这个topology的所 
         
          |                    有的task的心跳信息 
         
          | 
         
          |-/{task-id}      -- task的心跳信息，包括心跳的时 
         
          间，task运行时间以及一些统计 
         
          信息

计算topology的工作量

nimbus是个精明人，它对每个topology都会做出详细的预算：需要多少工作量(多少个task)。它是根据topology定义中给的parallelism hint参数，来给spout/bolt来设定task数目了，并且分配对应的task-id。并且把分配好task的信息写入zookeeper上的/task目录下:

 
     帮助 
    
          |-/tasks                  -- 所有的task 
         
          | 
         
          |-/{topology-id}      -- 这个目录下面id为 
         
          |                    {topology-id}的topology 
         
          |                    所对应的所有的task-id 
         
          | 
         
          |-/{task-id}      -- 这个文件里面保存的是这个 
         
          task对应的component-id： 
         
          可能是spout-id或者bolt-id

从上图中注释中看到{task-id}这个文件里面存储的是它所代表的spout/bolt的id，这其实就是一个细化工作量的过程。
打比方说我们的topology里面一共有一个spout, 一个bolt。其中spout的parallelism是2, bolt的parallelism是4, 那么我们可以把这个topology的总工作量看成是6，那么一共有6个task，那么/tasks/{topology-id}下面一共会有6个以task-id命名的文件，其中两个文件的内容是spout的id, 其它四个文件的内容是bolt的id。

看代码：

 
     帮助 
    
          (.setup-heartbeats! storm-cluster-state storm-id) 
         
          (setup-storm-static conf storm-id storm-cluster-state) 
         
          ( 
          defn 
          - setup-storm-static  
          [ 
          conf storm-id storm-cluster-state 
          ] 
         
          ( 
          doseq 
           [ 
          [ 
          task-id component-id 
          ] 
           (mk-task-component-assignments conf storm-id) 
          ] 
         
          (. 
          set 
          -task! storm-cluster-state storm-id task-id (TaskInfo. component-id)) 
         
          )) 
         
          ( 
          defn 
           mk-task-maker  
          [ 
          max-parallelism parallelism-func id-counter 
          ] 
         
          ( 
          fn 
           [ 
          [ 
          component-id spec 
          ] 
          ] 
         
          ( 
          let 
           [ 
          parallelism (parallelism-func spec) 
         
          parallelism ( 
          if 
           max-parallelism (min parallelism max-parallelism) parallelism) 
         
          num-tasks (max 1 parallelism) 
          ] 
         
          (for-times num-tasks 
         
          [ 
          (id-counter) component-id 
          ] 
          ) 
         
          )))

把计算好的工作分配给supervisor去做

然后nimbus就要给supervisor分配工作了。工作分配的单位是task(上面已经计算好了的，并且已经给每个task编号了), 那么分配工作意思就是把上面定义好的一堆task分配给supervisor来做，在nimbus里面，Assignment表示一个topology的任务分配信息：

 
     帮助 
    
          (defrecord Assignment  
          [ 
          master-code-dir 
         
          node->host task->node+port task->start-time-secs 
          ] 
          )

其中核心数据就是task->node+port, 它其实就是从task-id到supervisor-id+port的映射，也就是把这个task分配给某台机器的某个端口来做。工作分配信息会被写入zookeeper的如下目录:

 
     帮助 
    
          /-{storm-zk-root}           -- storm在zookeeper上的根 
         
          |                            目录 
         
          | 
         
          |-/assignments            -- topology的任务分配信息 
         
          | 
         
          |-/{topology-id}      -- 这个下面保存的是每个 
         
          topology的assignments 
         
          信息包括： 对应的 
         
          nimbus上的代码目录,所有 
         
          task的启动时间, 
         
          每个task与机器、端口的映射

TODO: 补充工作分配的细节

正式运行topology

到现在为止，任务都分配好了，那么我们可以正式启动这个topology了，在源代码里面，启动topology其实就是向zookeeper上面该topology所对应的目录写入这个topology的信息:

 
     帮助 
    
          |-/storms                 -- 这个目录保存所有正在运行 
         
          |                        的topology的id 
         
          | 
         
          |-/{topology-id}      -- 这个文件保存这个topology 
         
          的一些信息，包括topology的 
         
          名字，topology开始运行的时 
         
          间以及这个topology的状态 
         
          (具体看StormBase类)

看代码:

 
     帮助 
    
          ( 
          defn 
          - start-storm 
         
          [ 
          storm-name storm-cluster-state storm-id 
          ] 
         
          (log-message  
          "Activating " 
           storm-name  
          ": " 
           storm-id) 
         
          (.activate-storm! storm-cluster-state 
         
          storm-id 
         
          (StormBase. storm-name 
         
          (current-time-secs) 
         
          { 
          :type 
           :active 
          }))) 
         
          (activate-storm!  
          [ 
          this storm-id storm-base 
          ] 
         
          ; 把这个topology的信息(StormBase) 
         
          ; 写入/storms/{topology-id}这个文件 
         
          ( 
          set 
          -data cluster-state (storm-path storm-id) 
         
          (Utils/serialize storm-base)) 
         
          )

好！nimbus干的不错，到这里为止nimbus的工作算是差不多完成了，它对topology进行了一些检查，发现没什么问题，然后又评估了一下工作量，然后再看看它的小弟们(supervisor)哪些有空，它进行了合理的分配，所有的事情都安排妥当了，nimbus终于可以松一口气了。下面就看supervisor的了。

Supervisor领任务

我们的supervisor同志无时无刻不想着为大哥nimbus分忧，它每隔几秒钟就去看看大哥有没有给它分配新的任务，这些逻辑主要在supervisor.clj里面的synchronize-supervisor和sync-processes两个方法里面它：

首先它看看storm里面有没有新提交的它没有下载的topology的代码，如果有的话，它就把这个新topology的代码下载下来。它可不管这个topology由不由它负责哦(这一点是可以优化的)

 
       帮助 
      
            ( 
            doseq 
             [ 
            [ 
            storm-id master-code-dir 
            ] 
             storm-code- 
            map 
            ] 
           
            ( 
            when 
            -not (downloaded-storm-ids storm-id) 
           
            (log-message 
           
            "Downloading code for storm id " 
           
            storm-id 
           
            " from " 
           
            master-code-dir) 
           
            ; 从nimbus上下载这个topology的代码 
           
            (download-storm-code conf storm-id 
           
            master-code-dir) 
           
            (log-message 
           
            "Finished downloading code for storm id " 
           
            storm-id 
           
            " from " 
           
            master-code-dir) 
           
            ))

然后它会删除那些已经不再运行的topology的代码

 
       帮助 
      
            ( 
            doseq 
             [ 
            storm-id downloaded-storm-ids 
            ] 
           
            ( 
            when 
            -not (assigned-storm-ids storm-id) 
           
            (log-message  
            "Removing code for storm id " 
           
            storm-id) 
           
            (rmr (supervisor-stormdist-root conf storm-id)) 
           
            ))

然后他根据老大哥nimbus给它指派的任务信息(task-id对应到的topology的spout或者bolt), 来让它自己的小弟：worker来做这个事情

 
       帮助 
      
            (dofor  
            [ 
            [ 
            port assignment 
            ] 
             reassign-tasks 
            ] 
           
            ( 
            let 
             [ 
            id ( 
            new 
            -worker-ids port) 
            ] 
           
            (log-message  
            "Launching worker with assignment " 
           
            (pr- 
            str 
             assignment) 
           
            " for this supervisor " 
           
            supervisor-id 
           
            " on port " 
           
            port 
           
            " with id " 
           
            id 
           
            ) 
           
            ; 启动一个worker(supervisor+port) 
           
            ; 来处理assignments 
           
            (launch-worker conf 
           
            shared-context 
           
            ( 
            :storm-id 
             assignment) 
           
            supervisor-id 
           
            port 
           
            id 
           
            worker-thread-pids-atom) 
           
            id))

Worker执行

worker是个苦命的人，上面的nimbus, supervisor只会指手画脚，它要来做所有的脏活累活。

1. 它首先去zookeeper上去看看老大哥们都给他分配了哪些task(task-ids)

 
       帮助 
      
            ( 
            defn 
             read-worker-task-ids 
           
            [ 
            storm-cluster-state storm-id supervisor-id port 
            ] 
           
            ( 
            let 
             [ 
            assignment 
           
            ( 
            :task- 
            >node+port 
           
            (.assignment-info 
           
            storm-cluster-state storm-id nil)) 
            ] 
           
            ( 
            doall 
           
            (mapcat ( 
            fn 
             [ 
            [ 
            task-id loc 
            ] 
            ] 
           
            ; 找出这个worker(supervisor+port)的tasks 
           
            ( 
            if 
             (= loc  
            [ 
            supervisor-id port 
            ] 
            ) 
           
            [ 
            task-id 
            ] 
           
            )) 
           
            assignment)) 
           
            ))

2. 然后根据这些task-id来找出所对应的topology的spout/bolt

 
       帮助 
      
            task->component (storm-task-info 
           
            storm-cluster-state storm-id)

3. 计算出它所代表的这些spout/bolt会给哪些task发送消息

 
       帮助 
      
            ; task-ids是这个worker所负责的那些task， 那么 
           
            ; worker-outbound-tasks函数的结果就是这些task 
           
            ; 的消息要发送的task(supervisor+port) 
           
            outbound-tasks (worker-outbound-tasks 
           
            task->component mk-topology-context task-ids)

4. 建立到3里面所提到的那些task的连接(socket), 然后在需要发送消息的时候就通过这些socket来发送

 
       帮助 
      
            (swap! node+port->socket 
           
            merge 
           
            (into {} 
           
            (dofor  
            [ 
            [ 
            node port  
            :as 
             endpoint 
            ] 
             new 
            -connections 
            ] 
           
            [ 
            endpoint 
           
            ; msg/connect函数返回的就是从这个worker的端口 
           
            ; 到目的地主机、端口的socket 
           
            (msg/connect 
           
            mq-context 
           
            (( 
            :node- 
            >host assignment) node) 
           
            port) 
           
            ] 
           
            )))

到这里为止，topology里面的组件(spout/bolt)都根据parallelism被分成多个task, 而这些task被分配给supervisor的多个worker来执行。大家各司其职，整个topology已经运行起来了。

Topology的终止

除非你显式地终止一个topology, 否则它会一直运行的，可以用下面的命令去终止一个topology：

 
     帮助 
    
          storm  
          kill 
           {stormname}

在这个命令的背后, storm-cluster-state的remove-storm!命令会被调用:

 
     帮助 
    
          (remove-storm!  
          [ 
          this storm-id 
          ] 
         
          (delete-node cluster-state (storm-task-root storm-id)) 
         
          (delete-node cluster-state (assignment-path storm-id)) 
         
          (remove-storm-base! this storm-id))

上面的代码会把zookeeper上面/tasks, /assignments, /storms下面有关这个topology的数据都删除了。这些数据(或者目录）之前都是nimbus创建的。还剩下/taskbeats以及/taskerrors下的数据没有清除，这块数据会在supervisor下次从zookeeper上同步数据的时候删除的（supervisor会删除那些已经不存在的topology相关的数据)。这样这个topology的数据就从storm集群上彻底删除了。

作者: xumingming | 可以转载, 但必须以超链接形式标明文章原始出处和作者信息及版权声明
原文网址: http://xumingming.sinaapp.com/647/twitter-storm-code-analysis-topology-execution/

你可能感兴趣的:(storm,storm,源代码,集群)

Apache Kafka 在生产环境中的管理与优化：从理论到实践 Echo_Wish 运维探秘让你快速入坑运维 apache kafka 分布式
ApacheKafka在生产环境中的管理与优化：从理论到实践在当今这个数据驱动的时代，ApacheKafka已经成为企业流处理和实时数据管道的核心工具。作为一名运维工程师，确保Kafka在生产环境中的高效运行不仅是挑战，更是体现专业能力的绝佳舞台。那么，如何管理并优化Kafka集群，提升其在复杂生产环境下的表现呢？接下来，我将通过经验总结和代码示例，带你逐步了解生产环境下Kafka的管理与优化。一
Hadoop：全面深入解析 CloudJourney hadoop 大数据分布式
Hadoop是一个用于大规模数据处理的开源框架，其设计旨在通过集群的方式进行分布式存储和计算。本篇博文将从Hadoop的定义、架构、原理、应用场景以及常见命令等多个方面进行详细探讨，帮助读者全面深入地了解Hadoop。1.Hadoop的定义1.1什么是HadoopHadoop是由Apache软件基金会开发的开源软件框架，用于存储和处理大规模数据。其核心组件包括Hadoop分布式文件系统（HDFS）
网络安全工具汇总 Hacker_Fuchen web安全安全
网络安全工具汇总漏洞及渗透练习平台WebGoat漏洞练习环境https://github.com/WebGoat/WebGoathttps://github.com/WebGoat/WebGoat-LegacyDamnVulnerableWebApplication（漏洞练习平台）https://github.com/RandomStorm/DVWA数据库注入练习平台https://github.
网络安全 api 网络安全 ast技术 Hacker_LaoYi web安全 github git
随着应用或者API被攻击利用已经越来越多，虽然来自开源组件的漏洞加剧了这一现象的发生，但是，其实主要还是在于应用程序或者API本身没有做好防范，根源在于源代码本身的质量没有严格把控。AST是指ApplicationSecurityTesting，主要包括静态应用测试（SAST）、交互式应用测试（IAST）、动态应用测试（DAST）以及软件成分分析（SCA）等工具。应用测试工具AST是专门用于检测源
MySQL集群：高可用架构的利与弊异常驯兽师 mysql 架构数据库
在互联网应用快速发展的今天，数据库的高可用性和扩展性成为许多团队关注的焦点。MySQL集群作为一种常见的解决方案，被广泛用于解决单点故障和性能瓶颈的问题。但它是否适合所有场景？本文将从实际应用的角度，分析MySQL集群的核心特点、优势与不足。1.什么是MySQL集群？MySQL集群（MySQLCluster）并不是指简单的“多个MySQL服务器”，而是一种基于分布式架构的数据库解决方案。它通过将数
hbase 默认目录_[HBase] HBase数据存储目录解析 weixin_39577422 hbase 默认目录
Hbase在hdfs上的存储位置，根目录是由配置项hbase.rootdir决定，默认就是"/hbase"/hbase/WALs在该目录下，对于每个RegionServer，都会对应1~n个子目录/hbase/oldWALs当/hbase/WALs中的HLog文件被持久化到存储文件时，它们就会被移动到/hbase/oldWALs/hbase/hbase.id集群的唯一ID/hbase/hbase.
hbase集群archive目录过大问题处理 spring208208 大数据组件线上问题分析 hbase 数据库大数据
1.问题现象现场反馈hbase集群/hbase/archive目录过大，大小约为1.52PB现场集群已经清理掉2个月以前的snapshot文件，当前archive目录文件仍不能释放现场发现1T以上的archive子目录有211个查看集群hbase配置，hmaster堆栈大小20GB，hmaster清理周期5分钟查看hmaster进程分配内存占用6G上下问题分析HMaster内存估算，假如/hbas
K8s 1.27.1 实战系列（二）安装集群并初始化白昼ron K8s kubernetes 容器 K8s 部署 containerd kubeadm kubelet
一、安装kubeadm、kubelet和kubectl（所有节点）1、配置k8s的yum源地址cat<
DeepSeek告诉你，2025年Android开发和鸿蒙开发，哪个更有前途？工程师老罗 android harmonyos 华为
本书定位于原生Android开发的入门书籍，力求做到看得懂、能练习、能学会，提供**视频、源代码、课件、**习题、试卷、教案等，免费在线答疑，教学两用以下问题答案来自腾讯元宝里的DeepSeekR1，仅供参考先说Deepseek得出的结论：最终建议：若聚焦国内高增长赛道（如车联网、政务数字化），选择鸿蒙更易把握职业红利；若追求技术通用性或出海机会，Android仍是更稳妥的选择。两者并非完全互斥，
[neo4j报错]py2neo.errors.ClientError: [Request.Invalid] Not Found解决方案阿梦Anmory neo4j
报错源代码g=Graph('http://localhost:7687',auth=("neo4j","password"))或许这是从网上复制下来的代码，看上去没什么问题，但实际上要结合具体的浏览器上的地址来看，具体如下：看到了吗，这里才是要写的地址因此解决方案也很明显了解决方案g=Graph('neo4j://localhost:7687',auth=("neo4j","password"))
搭建测试用的redis集群访问失败小记 yinhezhanshen redis golang
redis运行在virtualbox虚拟机的ubuntu中。golang编写的redis客户端代码运行在windows下。首先在ubuntu下启动redis集群下载redis源码，编译成功后，进入utils/create-cluster目录，运行./create-clusterstart./create-clustercreate在windows下编写访问redis代码packagemainimp
OpenStack（一）——OpenStack的相关概念假面生 OpenStack linux
(1).OpenStack概述OpenStack是一个由NASA（美国国家航空航天局）和Rackspace合作研发并发起的，以Apache许可证授权的自由软件和开放源代码项目。OpenStack是一个旨在为公共及私有云的建设与管理提供软件的开源项目，支持几乎所有类型的云环境，项目目标是提供实施简单、可大规模扩展、丰富、标准统一的云计算管理平台。OpenStack能够将诸如计算能力、存储、网络和软件
linux下启动svn服务器,Debian/Ubuntu Linux搭建SVN服务器，并设置开机默认启动 weixin_39895481 linux下启动svn服务器
SVN是一个开放源代码的版本控制系统，可以记录保存文档的每一次改变，并方便做对比(diff)，或者取消改动，回撤到某个历史版本等(Revert)。因此十分适合存放代码、设计、图纸等需要历史记录的文档。安装subversionapt-getinstallsubversion创建仓库，首先建立svn文档的根目录svn,然后创建一个项目icalcmkdir/svnmkdir/svn/icalc创建新的i
【LAMMPS学习】八、基础知识(3.4)温度计算北行黄金橘 LAMMPS学习学习科学研究 lammps 多尺度模拟科技
8.基础知识此部分描述了如何使用LAMMPS为用户和开发人员执行各种任务。术语表页面还列出了MD术语，以及相应LAMMPS手册页的链接。LAMMPS源代码分发的examples目录中包含的示例输入脚本以及示例脚本页面上突出显示的示例输入脚本还展示了如何设置和运行各种模拟。8.1.通用基础知识8.2.设置入门8.3.分析入门8.3.1.LAMMPS的输出（thermo,dumps,computes,
HDFS的设计架构 F_0125 Hadoop hdfs hbase hadoop
HDFS是Hadoop生态系统中的分布式文件系统，设计用于存储和处理超大规模数据集。它具有高可靠性、高扩展性和高吞吐量的特点，适合运行在廉价硬件上。1.HDFS的设计思想HDFS的设计目标是解决大规模数据存储和处理的问题，其核心设计思想包括：（1）分布式存储-数据被分割成多个块（Block），并分布存储在集群中的多个节点上。-每个数据块默认大小为128MB或256MB，可以根据需求配置。（2）高容
LAMMPS体系轨迹分析系列：MATLAB计算温度独行侠影 matlab 开发语言
LAMMPS体系轨迹分析系列：MATLAB计算温度在分子动力学模拟中，LAMMPS是一个常用的开源软件包，可以用于模拟原子、分子以及其他粒子的动力学行为。对于通过LAMMPS模拟得到的轨迹数据，我们经常需要进行一些分析来了解体系的性质。本文将介绍如何使用MATLAB计算LAMMPS体系的温度，并提供相应的源代码。LAMMPS轨迹数据的读取首先，我们需要将LAMMPS生成的轨迹数据导入到MATLAB
Python目前建议最好安装什么版本的？_python哪个版本最好用又稳定 2401_89791028 python 开发语言
已经被淘汰了图片来源：Python1.1~1.6下载地址-https://www.python.org/download/releases/在Python1.5.2版本之前，Python官网只提供源代码的下载，没有对外发布的可用安装包。熟悉Python的同学，可能最早接触的Python版本是Python2.7。·Python2.7下载地址：https://www.python.org/downlo
使用Modelsim手动仿真寒听雪落 FPGA专栏_verilog fpga开发
FPGA设计流程在设计输入之后，设计综合前进行RTL级仿真，称为综合前仿真，也称为前仿真或功能仿真。前仿真也就是纯粹的功能仿真，主旨在于验证电路的功能是否符合设计要求，其特点是不考虑电路门延迟与线延迟。在完成一个设计的代码编写工作之后，可以直接对代码进行仿真，检测源代码是否符合功能要求。这时，仿真的对象为HDL代码，可以比较直观的观察波形的变化，在设计的最初阶段发现问题，节省大量的精力。在布局布线
【从零开始学习计算机科学】数字逻辑（五） Verilog HDL语言贫苦游商学习 fpga开发数字逻辑 verilog HDL 硬件开发逻辑电路
【从零开始学习计算机科学】数字逻辑（五）VerilogHDL语言VerilogHDL语言8位全加器8位计数器2位比较器三态驱动器VerilogHDL模块的结构模块声明。端口定义。信号类型。功能描述verilog描述级别verilog关键字verilog标识符编写VerilogHDL源代码的标准数据类型常量变量nets型变量register型变量reg型变量运算符及表达式算术运算符逻辑运算符位运算符
无人机+自组网：中继通信增强技术详解无人机技术圈无人机技术无人机
无人机与自组网技术的结合，特别是通过中继通信增强技术，为无人机在复杂环境中的通信提供了稳定、高效、可靠的解决方案。以下是对该技术的详细解析：一、无人机自组网技术概述无人机自组网技术是一种利用无人机作为节点，通过无线通信技术实现节点间自主组网、动态路由和数据传输的技术。它具有自组织、自配置、自愈合等特点，能够适应复杂多变的通信环境。在无人机集群中，每个无人机都可以作为终端节点、中继节点或中心节点，实
一致性哈希HashRing 留白1108 哈希算法算法一致性哈希
一致性哈希HashRing一致性哈希算法是一种高效的分布式存储和负载均衡技术，广泛应用于分布式系统中，如缓存集群、分布式数据库等。它通过将数据和节点映射到一个环形的哈希空间，实现了数据的均匀分布和节点的动态扩展。本文将详细介绍一致性哈希算法的原理，并通过一个完整的Java实现来展示其应用。一、一致性哈希算法原理一致性哈希算法的核心思想是将数据和节点映射到一个环形的哈希空间中。具体步骤如下：1.哈希
大数据Flink（六十四）：Flink运行时架构介绍_flink中涉及到的大数据组件 2401_84181942 程序员大数据 flink 架构
于是人们提出了“不共享任何东西”（share-nothing）的分布式架构。从以Greenplum为代表的MPP（MassivelyParallelProcessing，大规模并行处理）架构，到Hadoop、Spark为代表的批处理架构，再到Storm、Flink为代表的流处理架构，都是以分布式作为系统架构的基本形态的。我们已经知道，Flink就是一个分布式的并行流处理系统。简单来说，它会由多个进
PythonGUI编程从入门到精通，24个实用案例解析东眠的鱼数据库 android 性能优化 python 数据分析开发语言 Python学习
包含编程资料、学习路线图、源代码、软件安装包等！【[点击这里]】！分享一Python做GUI的一些小技巧，结合24个实用案例，让你也能轻松做出好看又好用的界面。1.GUI库的选择：Tkinter,PyQt,wxPythonPython做GUI的库很多，我比较常用的是Tkinter、PyQt和wxPython。Tkinter是Python自带的，比较简单；PyQt功能强大，但是比较复杂；wxPyth
ElasticSearch学习笔记 --- 调研笔记知识点杨鑫newlfe 大数据挖掘与大数据应用案例搜索引擎
笔记总结知识点：1.安装ElasticSearch。2.ELasticSearch是使用Java开发并使用Lucene作为核心来实现所有索引和搜索的功能3.使用是通过简单的restfulAPI来使用。4.安装Marvel(ES的管理和监控)5.特点：分布式的实时文件存储，每个字段都被索引并可被搜索分布式的实时分析搜引擎可以扩展到上百台服务器，处理PB级机构化或非结构化数据6.集群是一组具有相同cl
ES03 - ES其他知识点是小崔啊 #elasticSearch elasticsearch 大数据搜索引擎
ES其他知识点文章目录ES其他知识点一：分布式集群和路由计算1：单节点集群2：故障转移3：水平扩容4：宕机故障5：路由计算二：分片控制流程1：协调节点2：写流程3：读流程4：更新流程5：多文档操作流程5.1：mget操作流程5.2：bulk操作流程6：ES数据一致性的保证6.1：乐观并发控制-版本号6.2：乐观并发控制-外部系统三：分片原理(重要)1：文档搜索-segment的引入1.1：不可变的
K8S 集群节点扩容小小大胖子3 kubernetes java 容器
环境说明：主机名IP地址CPU/内存角色K8S版本Docker版本k8s231192.168.99.2312C4Gmaster1.23.1720.10.24k8s232192.168.99.2322C4Gwoker1.23.1720.10.24k8s233（需上线）192.168.99.2332C4Gwoker1.23.1720.10.24当现有集群中的节点资源不够用，此时就需要给集群扩容添加机器
当Citus添加工作节点时报错---citus_add_node(‘database-2‘, 5433) 学软件的小铃铛数据库
不得不说，毕业设计push我学习了很多新鲜的知识具体报错由于硬件条件不允许，我在两台虚拟机上部署了三个postgresql以组成一个协调节点和两个工作节点的集群，其中database-1节点上部署了一个工作节点，另外一个称为database-2.在将database-2上的工作节点添加到协调节点时，遇到以下报错：alfresco=#SELECT*FROMcitus_add_node('databa
大数据运维实战指南：零基础入门与核心技术解析（第一篇） emmm形成中大数据运维
大数据运维实战指南：零基础入门与核心技术解析（第一篇）系列文章目录第一篇：大数据运维概述与核心技能体系第二篇：Hadoop生态体系与集群部署实战第三篇：分布式存储系统运维与优化第四篇：资源调度框架YARN/K8s深度解析第五篇：实时计算框架Flink/Spark运维指南第六篇：大数据监控体系与自动化运维第七篇：云原生时代的大数据运维实践第八篇：数据安全与合规性管理第九篇：性能调优与故障排查案例集第
【K8S问题系列 | 10】在K8S集群怎么查看各个pod占用的资源大小？【已解决】颜淡慕潇 kubernetes 容器云原生后端问题解决
要查看Kubernetes集群中各个Pod占用的资源大小（包括CPU和内存），可以使用以下几种方法：1.使用kubectltop命令kubectltop命令可以快速查看当前Pod的CPU和内存使用情况。需要确保已安装并配置了MetricsServer。查看所有Pod的资源使用情况kubectltoppods--all-namespaces示例输出NAMESPACENAMECPU(cores)MEM
K8s（八）：如何进行 Kubernetes 集群健康检查？ Seal^_^ #Kubernetes 【云原生】容器化与编排技术持续集成 kubernetes 容器云原生 K8s 集群健康检查
K8s（八）：如何进行Kubernetes集群健康检查？1、节点健康检查1.1、使用kubectl查看节点状态1.2、查看节点详细信息1.3、检查节点资源使用情况2、Pod健康检查2.1、使用kubectl查看Pod状态2.2、查看特定Pod的详细信息，包括事件和条件3、服务健康检查3.1、使用kubectl查看服务状态3.2、查看特定服务的详细信息，包括端口和端点4、使用kubectl查看存储状
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &