Apache Spark源码走读之19 -- standalone cluster模式下资源的申请与释放

欢迎转载，转载请注明出处，徽沪一郎。

概要

本文主要讲述在standalone cluster部署模式下，Spark Application在整个运行期间，资源(主要是cpu core和内存)的申请与释放。

构成Standalone cluster部署模式的四大组成部件如下图所示，分别为Master, worker, executor和driver，它们各自运行于独立的JVM进程。

从资源管理的角度来说

Master 掌管整个cluster的资源，主要是指cpu core和memory，但Master自身并不拥有这些资源
Worker 计算资源的实际贡献者，须向Master汇报自身拥有多少cpu core和memory, 在master的指示下负责启动executor
Executor 执行真正计算的苦力，由master来决定该进程拥有的core和memory数值
Driver 资源的实际占用者，Driver会提交一到多个job，每个job在拆分成多个task之后，会分发到各个executor真正的执行

这些内容在standalone cluster模式下的容错性分析中也有所涉及，今天主要讲一下资源在分配之后不同场景下是如何被顺利回收的。

资源上报汇聚过程

standalone cluster下最主要的当然是master，master必须先于worker和driver程序正常启动。

当master顺利启动完毕，可以开始worker的启动工作，worker在启动的时候需要向master发起注册，在注册消息中带有本worker节点的cpu core和内存。

调用顺序如下preStart->registerWithMaster->tryRegisterAllMasters

看一看tryRegisterAllMasters的代码

 def tryRegisterAllMasters() {

    for (masterUrl <- masterUrls) {

      logInfo("Connecting to master " + masterUrl + "...")

      val actor = context.actorSelection(Master.toAkkaUrl(masterUrl))

      actor ! RegisterWorker(workerId, host, port, cores, memory, webUi.boundPort, publicAddress)

    }

  }

我们的疑问是RegisterWorker构造函数所需的参数memory和cores是从哪里获取的呢？

注意一下Worker中的main函数会创建WorkerArguments，

  def main(argStrings: Array[String]) {

    SignalLogger.register(log)

    val args = new WorkerArguments(argStrings)

    val (actorSystem, _) = startSystemAndActor(args.host, args.port, args.webUiPort, args.cores,

      args.memory, args.masters, args.workDir)

    actorSystem.awaitTermination()

  }

memory通过函数inferDefaultMemory获取，而cores通过inferDefaultCores获取。

def inferDefaultCores(): Int = {

    Runtime.getRuntime.availableProcessors()

  }



  def inferDefaultMemory(): Int = {

    val ibmVendor = System.getProperty("java.vendor").contains("IBM")

    var totalMb = 0

    try {

      val bean = ManagementFactory.getOperatingSystemMXBean()

      if (ibmVendor) {

        val beanClass = Class.forName("com.ibm.lang.management.OperatingSystemMXBean")

        val method = beanClass.getDeclaredMethod("getTotalPhysicalMemory")

        totalMb = (method.invoke(bean).asInstanceOf[Long] / 1024 / 1024).toInt

      } else {

        val beanClass = Class.forName("com.sun.management.OperatingSystemMXBean")

        val method = beanClass.getDeclaredMethod("getTotalPhysicalMemorySize")

        totalMb = (method.invoke(bean).asInstanceOf[Long] / 1024 / 1024).toInt

      }

    } catch {

      case e: Exception => {

        totalMb = 2*1024

        System.out.println("Failed to get total physical memory. Using " + totalMb + " MB")

      }

    }

    // Leave out 1 GB for the operating system, but don't return a negative memory size

    math.max(totalMb - 1024, 512)

  }

如果已经在配置文件中为显示指定了每个worker的core和memory，则使用配置文件中的值，具体配置参数为SPARK_WORKER_CORES和SPARK_WORKER_MEMORY

Master在收到RegisterWork消息之后，根据上报的信息为每一个worker创建相应的WorkerInfo.

    case RegisterWorker(id, workerHost, workerPort, cores, memory, workerUiPort, publicAddress) =>

    {

      logInfo("Registering worker %s:%d with %d cores, %s RAM".format(

        workerHost, workerPort, cores, Utils.megabytesToString(memory)))

      if (state == RecoveryState.STANDBY) {

        // ignore, don't send response

      } else if (idToWorker.contains(id)) {

        sender ! RegisterWorkerFailed("Duplicate worker ID")

      } else {

        val worker = new WorkerInfo(id, workerHost, workerPort, cores, memory,

          sender, workerUiPort, publicAddress)

        if (registerWorker(worker)) {

          persistenceEngine.addWorker(worker)

          sender ! RegisteredWorker(masterUrl, masterWebUiUrl)

          schedule()

        } else {

          val workerAddress = worker.actor.path.address

          logWarning("Worker registration failed. Attempted to re-register worker at same " +

            "address: " + workerAddress)

          sender ! RegisterWorkerFailed("Attempted to re-register worker at same address: "

            + workerAddress)

        }

      }

资源分配过程

如果在worker注册上来的时候，已经有Driver Application注册上来，那么就需要将原先处于未分配资源状态的driver application启动相应的executor。

WorkerInfo在schedule函数中会被使用到，schedule函数处理逻辑概述如下

查看目前存活的worker中剩余的内存是否能够满足application每个task的最低需求，如果是则将该worker加入到可分配资源的队列
根据分发策略，如果是决定将工作平摊到每个worker，则每次在一个worker上占用一个core，直到所有可分配资源耗尽或已经满足driver的需求
如果分发策略是分发到尽可能少的worker，则一次占用尽worker上的可分配core，直到driver的core需求得到满足
根据步骤2或3的结果在每个worker上添加相应的executor，处理函数是addExecutor

为了叙述简单，现仅列出平摊到各个worker的分配处理过程

      for (worker > workers if worker.coresFree > 0 && worker.state == WorkerState.ALIVE) {

        for (app <- waitingApps if app.coresLeft > 0) {

          if (canUse(app, worker)) {

            val coresToUse = math.min(worker.coresFree, app.coresLeft)

            if (coresToUse > 0) {

              val exec = app.addExecutor(worker, coresToUse)

              launchExecutor(worker, exec)

              app.state = ApplicationState.RUNNING

            }

          }

        }

      }

launchExecutor主要负责两件事情

记录下新添加的executor使用掉的cpu core和内存数目，记录过程发生在worker.addExecutor
向worker发送LaunchExecutor指令

  def launchExecutor(worker: WorkerInfo, exec: ExecutorInfo) {

    logInfo("Launching executor " + exec.fullId + " on worker " + worker.id)

    worker.addExecutor(exec)

    worker.actor ! LaunchExecutor(masterUrl,

      exec.application.id, exec.id, exec.application.desc, exec.cores, exec.memory)

    exec.application.driver ! ExecutorAdded(

      exec.id, worker.id, worker.hostPort, exec.cores, exec.memory)

  }

worker在收到LaunchExecutor指令后，也会记一笔账，将要使用掉的cpu core和memory从可用资源中减去，然后使用ExecutorRunner来负责生成Executor进程，注意Executor运行于独立的进程。代码如下

case LaunchExecutor(masterUrl, appId, execId, appDesc, cores_, memory_) =>

      if (masterUrl != activeMasterUrl) {

        logWarning("Invalid Master (" + masterUrl + ") attempted to launch executor.")

      } else {

        try {

          logInfo("Asked to launch executor %s/%d for %s".format(appId, execId, appDesc.name))

          val manager = new ExecutorRunner(appId, execId, appDesc, cores_, memory_,

            self, workerId, host,

            appDesc.sparkHome.map(userSparkHome => new File(userSparkHome)).getOrElse(sparkHome),

            workDir, akkaUrl, conf, ExecutorState.RUNNING)

          executors(appId + "/" + execId) = manager

          manager.start()

          coresUsed += cores_

          memoryUsed += memory_

          masterLock.synchronized {

            master ! ExecutorStateChanged(appId, execId, manager.state, None, None)

          }

        } catch {

          case e: Exception => {

            logError("Failed to launch executor %s/%d for %s".format(appId, execId, appDesc.name))

            if (executors.contains(appId + "/" + execId)) {

              executors(appId + "/" + execId).kill()

              executors -= appId + "/" + execId

            }

            masterLock.synchronized {

              master ! ExecutorStateChanged(appId, execId, ExecutorState.FAILED, None, None)

            }

          }

        }

      }

在资源分配过程中需要注意到的是如果有多个Driver Application处于等待状态，资源分配的原则是FIFO，先到先得。

资源回收过程

worker中上报的资源最终被driver application中提交的job task所占用，如果application结束(包括正常和异常退出)，application所占用的资源就应该被顺利回收，即将占用的资源重新归入可分配资源行列。

现在的问题转换成Master和Executor如何知道Driver Application已经退出了呢？

有两种不同的处理方式，一种是先道别后离开，一种是不告而别。现分别阐述。

何为先道别后离开，即driver application显式的通知master和executor，任务已经完成了，我要bye了。应用程序显式的调用SparkContext.stop

  def stop() {

    postApplicationEnd()

    ui.stop()

    // Do this only if not stopped already - best case effort.

    // prevent NPE if stopped more than once.

    val dagSchedulerCopy = dagScheduler

    dagScheduler = null

    if (dagSchedulerCopy != null) {

      metadataCleaner.cancel()

      cleaner.foreach(_.stop())

      dagSchedulerCopy.stop()

      taskScheduler = null

      // TODO: Cache.stop()?

      env.stop()

      SparkEnv.set(null)

      ShuffleMapTask.clearCache()

      ResultTask.clearCache()

      listenerBus.stop()

      eventLogger.foreach(_.stop())

      logInfo("Successfully stopped SparkContext")

    } else {

      logInfo("SparkContext already stopped")

    }

  }

显式调用SparkContext.stop的一个主要功能是会去显式的停止Executor，具体下达StopExecutor指令的代码见于CoarseGrainedSchedulerBackend中的stop函数

  override def stop() {

    stopExecutors()

    try {

      if (driverActor != null) {

        val future = driverActor.ask(StopDriver)(timeout)

        Await.ready(future, timeout)

      }

    } catch {

      case e: Exception =>

        throw new SparkException("Error stopping standalone scheduler's driver actor", e)

    }

  }

那么Master又是如何知道Driver Application退出的呢？这要归功于Akka的通讯机制了，当相互通讯的任意一方异常退出，另一方都会收到DisassociatedEvent, Master也就是在这个消息处理中移除已经停止的Driver Application。

    case DisassociatedEvent(_, address, _) => {

      // The disconnected client could've been either a worker or an app; remove whichever it was

      logInfo(s"$address got disassociated, removing it.")

      addressToWorker.get(address).foreach(removeWorker)

      addressToApp.get(address).foreach(finishApplication)

      if (state == RecoveryState.RECOVERING && canCompleteRecovery) { completeRecovery() }

    }

不告而别的方式下Executor是如何知道自己所服务的application已经顺利完成使命了呢？道理和master的一样，还是通过DisassociatedEvent来感知。详见CoarseGrainedExecutorBackend中的receive函数

  case x: DisassociatedEvent =>

      logError(s"Driver $x disassociated! Shutting down.")

      System.exit(1)

异常情况下的资源回收

由于Master和Worker之间的心跳机制，如果worker异常退出， Master会由心跳机制感知到其消亡，进而将其上报的资源移除。

Executor异常退出时，Worker中的监控线程ExecutorRunner会立即感知，进而上报给Master，Master会回收资源，并重新要求worker启动executor。

C++ 实现 ROS 2 点云欧几里得聚类 c++
C++实现ROS2点云欧几里得聚类在LivoxMid-360采集的sensor_msgs::msg::PointCloud2点云数据上进行欧几里得聚类（EuclideanClusterExtraction），具体流程如下：✅1.订阅PointCloud2并转换为pcl::PointCloud解释：sensor_msgs::msg::PointCloud2是ROS2点云消息格式，PCL不能直接处理。
Yashan DB 实例管理不三不四୭ YashanDB 后端开发 oracle 数据库
一、实例启停机制1.启动阶段•NOMOUNT：启动实例，但不加载数据库。此状态下可以重建控制文件，例如控制文件损坏。启动到NOMOUNT状态的命令为`yasbootclusterstart-cyashandb-mnomount`，此时查询`V$INSTANCE`视图的`STATUS`状态值为`STARTED`。•MOUNT：实例已启动，数据库完成加载，但数据库仍处于关闭状态。此状态下可以恢复数据库
深入解析 Kubernetes Service（SVC）网络 XMYX-0 K8S kubernetes 网络容器
文章目录深入解析KubernetesService（SVC）网络为什么需要Service？KubernetesService主要组成部分KubernetesService类型类型的对比表格ClusterIP（默认类型）NodePortLoadBalancerExternalNameService的解析与访问机制ServiceDNS解析Service负载均衡原理Service与Ingress的区别小
Dubbo知识点整理 eeeeeeeeethan dubbo java
Dubbo模块划分Service：服务代码的实现。Config：RPC调用的配置，如超时时间、重试、缓存。Proxy：远程调用的服务代理。Registry：注册中心，给出调用方IP。Cluster：路由层，选择调用的服务提供者，实现路由过滤和均衡负载。Monitor：监控层。Protocol：远程调用层，封装调用过程。Exchange：信息交换层，用于封装请求并模式同步、异步获取响应结果。Tran
机器学习之KMeans算法 Mr终游机器学习机器学习算法 kmeans
目录一、KMeans的核心思想二、KMeans算法流程三、KMeans的关键点1.优点：2.缺点：四、如何确定最佳k值1.肘部法则2.轮廓系数五、Kmeans的典型应用场景六、代码示例KMeans是一种广泛使用的无监督学习算法，主要用于聚类分析（Clustering）。它的目标是将数据集划分为K个互不重叠的子集（簇，Cluster），使得同一簇内的数据点尽可能相似，不同簇之间的数据点尽可能差异显著
curl不通 k8s_【K8S排错】在集群的POD内不能访问clusterIP和service weixin_39950057 curl不通 k8s
排错背景：在一次生产环境的部署过程中，配置文件中配置的访问地址为集群的Service，配置好后发现服务不能正常访问，遂启动了一个busybox进行测试，测试发现在busybox中，能通过coredns正常的解析到IP，然后去ping了一下service，发现不能ping通，pingclusterIP也不能ping通。排错经历：首先排查了kube-proxy是否正常，发现启动都是正常的，然后也重启了
第八课：性能优化与高并发处理方案 deming_su Nodejs 性能优化 node.js nginx
Node.js作为一种基于事件驱动、非阻塞I/O模型的JavaScript运行环境，广泛应用于高并发、实时性强的应用开发。然而，随着业务需求的不断增长，如何在Node.js中高效地处理大量并发请求、优化性能，成为了开发者必须面对的重要课题。本文将详细介绍Node.js性能优化与高并发处理的几种关键方案，包括使用Cluster模块多进程优化、Redis缓存加速数据查询、负载均衡与Nginx反向代理，
MySQL集群：高可用架构的利与弊异常驯兽师 mysql 架构数据库
在互联网应用快速发展的今天，数据库的高可用性和扩展性成为许多团队关注的焦点。MySQL集群作为一种常见的解决方案，被广泛用于解决单点故障和性能瓶颈的问题。但它是否适合所有场景？本文将从实际应用的角度，分析MySQL集群的核心特点、优势与不足。1.什么是MySQL集群？MySQL集群（MySQLCluster）并不是指简单的“多个MySQL服务器”，而是一种基于分布式架构的数据库解决方案。它通过将数
搭建测试用的redis集群访问失败小记 yinhezhanshen redis golang
redis运行在virtualbox虚拟机的ubuntu中。golang编写的redis客户端代码运行在windows下。首先在ubuntu下启动redis集群下载redis源码，编译成功后，进入utils/create-cluster目录，运行./create-clusterstart./create-clustercreate在windows下编写访问redis代码packagemainimp
Triplet Loss原理及 Python实现 AIGC_ZY Diffusion Models python 深度学习机器学习
Tripletloss最初是谷歌在FaceNet:AUnifiedEmbeddingforFaceRecognitionandClustering论文中提出的，可以学到较好的人脸的embeddingTripletLoss是一种用于训练特征嵌入（featureembedding）的损失函数，广泛应用于人脸识别、图像检索等需要度量相似性的任务。其核心思想是通过学习将同类样本的嵌入距离拉近，不同类样本的
rabbitmq 学习之 mirror queue cluster 搭建（26） xiaoliuliu2050 rabbitmq
官网:https://www.rabbitmq.com/ha.html高可用（镜像）队列默认情况下，queues存放在RabbitMQ集群的单个节点之上。exchanges和bindings恰恰相反，在集群中的所有节点中都有存档。queues可以配置镜像以此可以在多个节点中有备份。每个镜像队列包含一个master节点和一个或者多个slave节点。如果master节点由于某种原因失效，那么“资历最老
认识 TapFlow，以编程方式运行 TapData 开源软件开发者物化视图
什么是TapFlow？TapFlow是TapDataLiveDataPlatform最新推出的一个面向编程的API框架。TapFlow可以让开发者和数据工程师用一个简单易用而又强大的编程语言来进行数据管道和数据模型的开发工作。这次的发布包括一个Python的SDK。TapFlow需要连接一个TapDataCluster(可以是企业版，云版或社区版）才能运行。为何需要编程式的方式？TapData目前
K8s 端口转发实战指南(Practical Guide to k8s Port Forwarding) Linux运维老纪天涯海角 k8s伴你同行 kubernetes 容器云原生运维开发分布式
K8s端口转发实战指南1.背景1.1Kubernetes网络隔离性挑战在Kubernetes集群中，所有资源都运行在私有网络空间（通常使用CNI插件构建overlay网络），这带来了以下调试难题：Pod使用动态IP地址（生命周期短暂）Service的ClusterIP仅在集群内部可达生产环境通常禁用NodePort等暴露方式1.2典型使用场景场景类型具体案例传统方案痛点本地开发调试访问未暴露的We
OceanBase数据库常用巡检SQL 数据库sqloceanbase
本文为墨天轮数据库管理服务团队原创内容，如需转载请联系小墨（VX：modb666）并注明来源。一、版本信息select*frominformation_schema.GLOBAL_VARIABLESWHEREVARIABLE_NAMElike'version%';二、集群状态select*fromoceanbase.v$ob_cluster;三、服务器状态检查所有服务器的状态，包括这个Server
十二、Redis Cluster（集群）详解：原理、搭建、数据分片与读写分离伯牙碎琴 #Redis redis 数据库缓存
RedisCluster（集群）详解：原理、搭建、数据分片与读写分离RedisCluster是Redis官方提供的分布式存储方案，通过数据分片（Sharding）实现水平扩展（scalability），并提供高可用性（HA）和故障自动转移（failover）能力，解决了单机Redis内存受限、主从复制故障恢复较慢等问题。本教程将全面讲解RedisCluster的核心原理、搭建步骤、数据分片策略、读
Kubernetes（K8S）部署 Redis Cluster 集群 Sirius Wu kubernetes redis 容器
以下将详细介绍如何使用Kubernetes（K8S）部署RedisCluster集群，并给出相应的YAML代码。1.准备工作在开始部署之前，需要确保已经安装并配置好Kubernetes集群，并且kubectl可以正常与集群通信。2.部署RedisCluster2.1创建Namespace(可选)创建一个名为redis-cluster-namespace.yaml的文件，内容如下：apiVersio
[Machine Learning] K-means算法进阶的小蜉蝣 machine learning 算法 kmeans 机器学习
HuBERT预训练过程中会用到K-means算法，本文简单介绍一下K-means算法的基本流程。简单地讲，K-means就是给特征向量集进行聚类。给定一个特征向量集{X}和目标聚类数N，K-means会不断迭代，直到X被分成N类，且每一类的中心点不再明显变化。先看一个简单例子：fromsklearn.clusterimportKMeansimportnumpyasnpimportmatplotli
Delta Lake的Liquid Clustering 不确定性确定你我大数据
DeltaLake的LiquidClustering（液态聚类）是一种高效的数据布局优化技术，旨在解决传统分区和Z-Order排序的局限性。它通过自动化和增量式的数据布局优化，提升查询性能并减少存储和计算成本。以下是其原理、实现方式以及实际场景中的应用解析。LiquidClustering的核心原理动态数据布局：LiquidClustering基于树形算法，优化数据文件的大小和数量，使其均匀分布。
Redis集群部署深度解析：主从、哨兵、分片与Cluster模式实战指南格子先生Lab redis 数据库缓存
1.引言Redis作为高性能的键值存储系统，广泛应用于缓存、实时分析、消息队列等场景。然而，单机Redis存在以下局限性：容量瓶颈：受限于单机内存容量。性能瓶颈：单线程模型下，写操作吞吐量受限。高可用性不足：单节点故障导致服务中断。为解决这些问题，Redis提供多种集群部署方案，包括主从复制（Replication）、哨兵模式（Sentinel）、分片模式（Sharding）以及RedisClus
Redis集群故障恢复实践：主从、哨兵、分片与Cluster模式详解格子先生Lab redis 数据库缓存
Redis作为一种高性能的内存数据库，广泛应用于缓存、消息队列等场景。然而，在生产环境中，Redis集群可能会因为硬件故障、网络问题或配置错误等原因发生故障。本文将详细介绍Redis集群在不同模式（主从、哨兵、分片与Cluster）下的故障恢复实践，帮助开发者更好地应对Redis集群的故障场景。一、Redis集群模式概述在讨论故障恢复之前，我们先简要回顾一下Redis集群的几种常见模式：主从模式（
Kubernetes服务暴露的4种方法——ClusterIp、NodePort、LoadBalancer 和 Ingress 未来AI编程 k8s探险记 Rancher入门到精通 kubernetes 容器云原生
今天，我们将从我在beta早期遇到的最常见问题之一开始：如何将外部流量路由到我的Kubernetes服务中？当我们的客户开始探索Kubernetes时，这个问题出现了很多，当我试图回答它时，我意识到问题的一部分在于可能的答案的数量，以及理解它们所需的概念。与该问题相关的是一个功能请求：大多数用户想要一个负载平衡工具。由于Beta阶段是关于确认产品的稳定性和验证功能集的优先级，因此我们能够快速确认L
Spark架构都有那些组件冰火同学 Spark spark 架构大数据
Spark组件架构主要采用主从结构，分别是driver驱动器，Excutor执行器,和clusterManager集群管理器这个三个架构组件其中driver驱动器主要负责spark执行Excutor的任务分配。Excutor执行器猪獒就是负责将被分配到的task任务进行处理clastermanager管理有多钟：第一种的spark自带的的集群管理，叫做standalone。第二种是sparkony
Redis的Lettuce客户端SCAN异常怎么才能努力学习啊 redis java 数据库
使用Redis的Lettuce客户端在集群模式下的SCAN用游标查询遇到的问题Lettuce客户端在使用集群模式时候使用SCAN进行游标查询，发现自定义传参不起作用。下面代码例子importio.lettuce.core.ScanCursorimportio.lettuce.core.cluster.api.StatefulRedisClusterConnectionimportscala.jdk
2小时学懂【多元统计分析】——聚类分析（R语言）木小鹿多元统计 R语言代码机器学习算法人工智能开发语言数据挖掘数据分析
聚类分析是一种无监督学习方法，用于将相似的观测值（或对象）分组到集群中。下面我将展示如何使用几种常见的聚类方法：K-均值（K-means）、层次聚类（HierarchicalClustering）和DBSCAN。1.K-均值聚类（K-meansClustering）K-均值是一种迭代的聚类算法，它将数据划分为K个预定义的集群。#加载需要的包library(cluster)#假设我们有一些二维数据s
rabbit@node2‘ thinks it‘s clustered with node ‘rabbit@node1‘, but ‘rabbit@node1‘ disagrees yangguosheng rabbitmq rabbitmq cluster forget 节点集群
两个rabbitmq节点rabbit@node1,rabbit@node2。集群搭建完成后，下线rabbit@node2,node2上执行rabbitmqctlstop停止该节点上的服务。node1上执行rabbitmqctlforget_cluster_noderabbit@node2。之后尝试启动rabbit@node2时，报错rabbit@node2'thinksit'sclusteredw
python读取redis大数据_大数据系列——Redis学习笔记 weixin_39661345
1.Redis的简介Redis是一个开源(BSD许可)，内存存储的数据结构服务器,可用作数据库，高速缓存和消息队列代理它支持字符串、哈希表、列表、集合、有序集合，位图，hyperloglogs等数据类型内置复制、Lua脚本、LRU收回、事务以及不同级别磁盘持久化功能，同时通过RedisSentinel提供高可用，通过RedisCluster提供自动分区。简言之，Redis是一种面向“键/值”对数据
windows环境下，使用docker搭建redis集群一醉千秋 shell docker WebGIS web docker redis 容器
参考：https://blog.csdn.net/weixin_46594796/article/details/137864842https://www.cnblogs.com/niceyoo/p/14118146.html史上最详细Docker搭建RedisCluster集群环境值得收藏每步都有图，不用担心学不会-腾讯云开发者社区-腾讯云一、基础环境描述宿主机：192.168.8.209red
k8s面试题总结（七） a_j58 kubernetes 容器云原生
1.K8s中镜像下载策略有哪几种？Always,Never,IfNotPresent2.K8s中pod故障重启策略有哪几种？Always,Never,OnFailure3.什么是HeadlessService？HeadlessService是通过在Service的定义中设置clusterIP:None来实现的。它的核心特性是：没有ClusterIP：普通Service会分配一个虚拟的Cluster
机器学习之经典算法（十六） Birch算法 AI专家机器之心修炼之路
（一）Birch算法简介：BIRCH（BalancedIterativeReducingandClusteringUsingHierarchies）全称是：利用层次方法的平衡迭代规约和聚类。BIRCH算法是1996年由TianZhang提出来的。Birch算法就是通过聚类特征(CF)形成一个聚类特征树，root层的CF个数就是聚类个数。整个算法实现共分为4个阶段：1.扫描所有数据，建立初始化的CF
SkyWalking Server配置文件五百年前FHYA 数据监测 skywalking
application.yml/config/application.yml1、cluster集群相关配置#集群配置cluster:#选择哪一种集群模式selector:${SW_CLUSTER:standalone}#单机版standalone:#zk注册集群配置，zk版本保证在3.5以上，oap-libs中也对3.4进行了支持zookeeper:nameSpace:${SW_NAMESPACE
java杨辉三角 3213213333332132 java基础
package com.algorithm; /** * @Description 杨辉三角 * @author FuJianyong * 2015-1-22上午10:10:59 */ public class YangHui { public static void main(String[] args) { //初始化二维数组长度 int[][] y
《大话重构》之大布局的辛酸历史白糖_ 重构
《大话重构》中提到“大布局你伤不起”，如果企图重构一个陈旧的大型系统是有非常大的风险，重构不是想象中那么简单。我目前所在公司正好对产品做了一次“大布局重构”，下面我就分享这个“大布局”项目经验给大家。背景公司专注于企业级管理产品软件，企业有大中小之分，在2000年初公司用JSP/Servlet开发了一套针对中
电驴链接在线视频播放源码 dubinwei 源码电驴播放器视频 ed2k
本项目是个搜索电驴（ed2k）链接的应用,借助于磁力视频播放器（官网： http://loveandroid.duapp.com/ 开放平台），可以实现在线播放视频，也可以用迅雷或者其他下载工具下载。项目源码： http://git.oschina.net/svo/Emule,动态更新。也可从附件中下载。项目源码依赖于两个库项目，库项目一链接： http://git.oschina.
Javascript中函数的toString()方法周凡杨 JavaScript js toString function object
简述 The toString() method returns a string representing the source code of the function. 简译之，Javascript的toString()方法返回一个代表函数源代码的字符串。句法 function.
struts处理自定义异常 g21121 struts
很多时候我们会用到自定义异常来表示特定的错误情况，自定义异常比较简单，只要分清是运行时异常还是非运行时异常即可，运行时异常不需要捕获，继承自RuntimeException，是由容器自己抛出，例如空指针异常。非运行时异常继承自Exception，在抛出后需要捕获，例如文件未找到异常。此处我们用的是非运行时异常，首先定义一个异常LoginException: /** * 类描述：登录相
Linux中find常见用法示例 510888780 linux
Linux中find常见用法示例 ·find path -option [ -print ] [ -exec -ok command ] {} \; find命令的参数；
SpringMVC的各种参数绑定方式 Harry642 springMVC 绑定表单
1. 基本数据类型(以int为例，其他类似)： Controller代码： @RequestMapping("saysth.do") public void test(int count) { } 表单代码： <form action="saysth.do" method="post&q
Java 获取Oracle ROWID aijuans java oracle
A ROWID is an identification tag unique for each row of an Oracle Database table. The ROWID can be thought of as a virtual column, containing the ID for each row. The oracle.sql.ROWID class i
java获取方法的参数名 antlove java jdk parameter method reflect
reflect.ClassInformationUtil.java package reflect; import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; import javassist.Modifier; import javassist.bytecode.CodeAtt
JAVA正则表达式匹配查找替换提取操作百合不是茶 java 正则表达式替换提取查找
正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组常见的截取规则: str.split("\\.")按照.来截取 str.
Java中equals()与hashCode()方法详解 bijian1013 java set equals()hashCode()
一.equals()方法详解 equals()方法在object类中定义如下： public boolean equals(Object obj) { return (this == obj); } 很明显是对两个对象的地址值进行的比较（即比较引用是否相同）。但是我们知道，String 、Math、I
精通Oracle10编程SQL(4)使用SQL语句 bijian1013 oracle 数据库 plsql
--工资级别表 create table SALGRADE ( GRADE NUMBER(10), LOSAL NUMBER(10,2), HISAL NUMBER(10,2) ) insert into SALGRADE values(1,0,100); insert into SALGRADE values(2,100,200); inser
【Nginx二】Nginx作为静态文件HTTP服务器 bit1129 HTTP服务器
Nginx作为静态文件HTTP服务器在本地系统中创建/data/www目录，存放html文件(包括index.html) 创建/data/images目录，存放imags图片在主配置文件中添加http指令 http { server { listen 80; server_name
kafka获得最新partition offset blackproof kafka partition offset 最新
kafka获得partition下标，需要用到kafka的simpleconsumer import java.util.ArrayList; import java.util.Collections; import java.util.Date; import java.util.HashMap; import java.util.List; import java.
centos 7安装docker两种方式 ronin47
第一种是采用yum 方式 yum install -y docker
java-60-在O(1)时间删除链表结点 bylijinnan java
public class DeleteNode_O1_Time { /** * Q 60 在O(1)时间删除链表结点 * 给定链表的头指针和一个结点指针(!!)，在O(1)时间删除该结点 * * Assume the list is: * head->...->nodeToDelete->mNode->nNode->..
nginx利用proxy_cache来缓存文件 cfyme cache
user zhangy users; worker_processes 10; error_log /var/vlogs/nginx_error.log crit; pid /var/vlogs/nginx.pid; #Specifies the value for ma
[JWFD开源工作流]JWFD嵌入式语法分析器负号的使用问题 comsci 嵌入式
假如我们需要用JWFD的语法分析模块定义一个带负号的方程式，直接在方程式之前添加负号是不正确的，而必须这样做： string str01 = "a=3.14;b=2.71;c=0;c-((a*a)+(b*b))" 定义一个0整数c,然后用这个整数c去
如何集成支付宝官方文档 dai_lm android
官方文档下载地址 https://b.alipay.com/order/productDetail.htm?productId=2012120700377310&tabId=4#ps-tabinfo-hash 集成的必要条件 1. 需要有自己的Server接收支付宝的消息 2. 需要先制作app，然后提交支付宝审核，通过后才能集成调试的时候估计会真的扣款，请注意
应该在什么时候使用Hadoop datamachine hadoop
原帖地址：http://blog.chinaunix.net/uid-301743-id-3925358.html 存档，某些观点与我不谋而合，过度技术化不可取，且hadoop并非万能。 --------------------------------------------万能的分割线-------------------------------- 有人问我，“你在大数据和Hado
在GridView中对于有外键的字段使用关联模型进行搜索和排序 dcj3sjt126com yii
在GridView中使用关联模型进行搜索和排序首先我们有两个模型它们直接有关联: class Author extends CActiveRecord { ... } class Post extends CActiveRecord { ... function relations() { return array( '
使用NSString 的格式化大全 dcj3sjt126com Objective-C
格式定义The format specifiers supported by the NSString formatting methods and CFString formatting functions follow the IEEE printf specification; the specifiers are summarized in Table 1. Note that you c
使用activeX插件对象object滚动有重影蕃薯耀 activeX插件滚动有重影
使用activeX插件对象object滚动有重影 <object style="width:0;" id="abc" classid="CLSID:D3E3970F-2927-9680-BBB4-5D0889909DF6" codebase="activex/OAX339.CAB#
SpringMVC4零配置 hanqunfeng springmvc4
基于Servlet3.0规范和SpringMVC4注解式配置方式，实现零xml配置，弄了个小demo，供交流讨论。项目说明如下： 1.db.sql是项目中用到的表，数据库使用的是oracle11g 2.该项目使用mvn进行管理，私服为自搭建nexus,项目只用到一个第三方 jar，就是oracle的驱动； 3.默认项目为零配置启动，如果需要更改启动方式，请
《开源框架那点事儿16》：缓存相关代码的演变 j2eetop 开源框架
问题引入上次我参与某个大型项目的优化工作，由于系统要求有比较高的TPS，因此就免不了要使用缓冲。该项目中用的缓冲比较多，有MemCache，有Redis，有的还需要提供二级缓冲，也就是说应用服务器这层也可以设置一些缓冲。当然去看相关实现代代码的时候，大致是下面的样子。 [java] view plain copy print ? public vo
AngularJS浅析 kvhur JavaScript
概念 AngularJS is a structural framework for dynamic web apps. 了解更多详情请见原文链接：http://www.gbtags.com/gb/share/5726.htm Directive 扩展html，给html添加声明语句，以便实现自己的需求。对于页面中html元素以ng为前缀的属性名称，ng是angular的命名空间
架构师之jdk的bug排查(一)---------------split的点号陷阱 nannan408 split
1.前言. jdk1.6的lang包的split方法是有bug的,它不能有效识别A.b.c这种类型,导致截取长度始终是0.而对于其他字符,则无此问题.不知道官方有没有修复这个bug. 2.代码 String[] paths = "object.object2.prop11".split("'"); System.ou
如何对10亿数据量级的mongoDB作高效的全表扫描 quentinXXZ mongodb
本文链接: http://quentinXXZ.iteye.com/blog/2149440 一、正常情况下，不应该有这种需求首先，大家应该有个概念，标题中的这个问题，在大多情况下是一个伪命题，不应该被提出来。要知道，对于一般较大数据量的数据库，全表查询，这种操作一般情况下是不应该出现的，在做正常查询的时候，如果是范围查询，你至少应该要加上limit。说一下，
C语言算法之水仙花数 qiufeihu c 算法
/** * 水仙花数 */ #include <stdio.h> #define N 10 int main() { int x,y,z; for(x=1;x<=N;x++) for(y=0;y<=N;y++) for(z=0;z<=N;z++) if(x*100+y*10+z == x*x*x
JSP指令 wyzuomumu jsp
jsp指令的一般语法格式： <%@ 指令名属性 =”值 ” %> 常用的三种指令： page,include,taglib page指令语法形式： <%@ page 属性 1=”值 1” 属性 2=”值 2”%> include指令语法形式： <%@include file=”relative url”%> (jsp可以通过 include

Apache Spark源码走读之19 -- standalone cluster模式下资源的申请与释放

概要

资源上报汇聚过程

资源分配过程

资源回收过程

异常情况下的资源回收

你可能感兴趣的:(cluster)