ChouYarn

Spark源码阅读之存储体系--存储体系概述与shuffle服务

一、概述

根据《深入理解Spark：核心思想与源码分析》一书，结合最新的spark源代码master分支进行源码阅读，对新版本的代码加上自己的一些理解，如有错误，希望指出。

1.块管理器BlockManager的实现

块管理器是Spark存储体系的核心组件，Driver Application和Executor都会创建BlockManager，源代码位置在core/org.apache.spark.storage,部分代码如下。

private[spark] val externalShuffleServiceEnabled =
    conf.getBoolean("spark.shuffle.service.enabled", false)

  val diskBlockManager = {
    // Only perform cleanup if an external service is not serving our shuffle files.
    val deleteFilesOnStop =
      !externalShuffleServiceEnabled || executorId == SparkContext.DRIVER_IDENTIFIER
    new DiskBlockManager(conf, deleteFilesOnStop)
  }

  // Visible for testing
  private[storage] val blockInfoManager = new BlockInfoManager

  private val futureExecutionContext = ExecutionContext.fromExecutorService(
    ThreadUtils.newDaemonCachedThreadPool("block-manager-future", 128))

  // Actual storage of where blocks are kept
  private[spark] val memoryStore =
    new MemoryStore(conf, blockInfoManager, serializerManager, memoryManager, this)
  private[spark] val diskStore = new DiskStore(conf, diskBlockManager, securityManager)
  memoryManager.setMemoryStore(memoryStore)

  // Note: depending on the memory manager, `maxMemory` may actually vary over time.
  // However, since we use this only for reporting and logging, what we actually want here is
  // the absolute maximum value that `maxMemory` can ever possibly reach. We may need
  // to revisit whether reporting this value as the "max" is intuitive to the user.
  private val maxOnHeapMemory = memoryManager.maxOnHeapStorageMemory
  private val maxOffHeapMemory = memoryManager.maxOffHeapStorageMemory

  // Port used by the external shuffle service. In Yarn mode, this may be already be
  // set through the Hadoop configuration as the server is launched in the Yarn NM.
  private val externalShuffleServicePort = {
    val tmpPort = Utils.getSparkOrYarnConfig(conf, "spark.shuffle.service.port", "7337").toInt
    if (tmpPort == 0) {
      // for testing, we set "spark.shuffle.service.port" to 0 in the yarn config, so yarn finds
      // an open port.  But we still need to tell our spark apps the right port to use.  So
      // only if the yarn config has the port set to 0, we prefer the value in the spark config
      conf.get("spark.shuffle.service.port").toInt
    } else {
      tmpPort
    }
  }

  var blockManagerId: BlockManagerId = _

  // Address of the server that serves this executor's shuffle files. This is either an external
  // service, or just our own Executor's BlockManager.
  private[spark] var shuffleServerId: BlockManagerId = _

  // Client to read other executors' shuffle files. This is either an external service, or just the
  // standard BlockTransferService to directly connect to other Executors.
  private[spark] val shuffleClient = if (externalShuffleServiceEnabled) {
    val transConf = SparkTransportConf.fromSparkConf(conf, "shuffle", numUsableCores)
    new ExternalShuffleClient(transConf, securityManager,
      securityManager.isAuthenticationEnabled(), conf.get(config.SHUFFLE_REGISTRATION_TIMEOUT))
  } else {
    blockTransferService
  }

  // Max number of failures before this block manager refreshes the block locations from the driver
  private val maxFailuresBeforeLocationRefresh =
    conf.getInt("spark.block.failures.beforeLocationRefresh", 5)

  private val slaveEndpoint = rpcEnv.setupEndpoint(
    "BlockManagerEndpoint" + BlockManager.ID_GENERATOR.next,
    new BlockManagerSlaveEndpoint(rpcEnv, this, mapOutputTracker))

  // Pending re-registration action being executed asynchronously or null if none is pending.
  // Accesses should synchronize on asyncReregisterLock.
  private var asyncReregisterTask: Future[Unit] = null
  private val asyncReregisterLock = new Object

  // Field related to peer block managers that are necessary for block replication
  @volatile private var cachedPeers: Seq[BlockManagerId] = _
  private val peerFetchLock = new Object
  private var lastPeerFetchTime = 0L

  private var blockReplicationPolicy: BlockReplicationPolicy = _

View Code

上面代码中声明的BlockInfoManager用于管理BlockManager缓存BlockId及对应的BlockInfo，BlockInfoManager提供一些列的同步读写策略。BlockManager由以下部分组成。

1）shuffle客户端shuffleClient；

2）BlockManagerMaster，对存在于所有Executor上的BlockManager进行统一管理；

3）磁盘块管理器DiskBlockManager；

4）内存存储MemoryStore；

5）磁盘存储DiskStore；

BlockManager要生效必须要初始化，初始化代码如下，

def initialize(appId: String): Unit = {
    blockTransferService.init(this)
    shuffleClient.init(appId)

    blockReplicationPolicy = {
      val priorityClass = conf.get(
        "spark.storage.replication.policy", classOf[RandomBlockReplicationPolicy].getName)
      val clazz = Utils.classForName(priorityClass)
      val ret = clazz.newInstance.asInstanceOf[BlockReplicationPolicy]
      logInfo(s"Using $priorityClass for block replication policy")
      ret
    }

    val id =
      BlockManagerId(executorId, blockTransferService.hostName, blockTransferService.port, None)

    val idFromMaster = master.registerBlockManager(
      id,
      maxOnHeapMemory,
      maxOffHeapMemory,
      slaveEndpoint)

    blockManagerId = if (idFromMaster != null) idFromMaster else id

    shuffleServerId = if (externalShuffleServiceEnabled) {
      logInfo(s"external shuffle service port = $externalShuffleServicePort")
      BlockManagerId(executorId, blockTransferService.hostName, externalShuffleServicePort)
    } else {
      blockManagerId
    }

    // Register Executors' configuration with the local shuffle service, if one should exist.
    if (externalShuffleServiceEnabled && !blockManagerId.isDriver) {
      registerWithExternalShuffleServer()
    }

    logInfo(s"Initialized BlockManager: $blockManagerId")
  }

View Code

1）BlockTransferService和shuffle客户端shuffleClient的初始化，ShuffleClien默认是BlockTransferService，当有外部的ShuffleService时，则调用外部的ExternalShuffleClient。

2）创建id为本地BlockManagerId，向BlockManagerMaster注册此id，获取从BlockManagerMaster的idFromMaster，如果idFromMaster为空则BlockManagerId为刚才创建的id，否则使用BlockManagerMaster注册到的idFromMaster。

3）ShuffleServerId的创建，当有外部的ShuffleService时，创建新的BlockManagerId作为ShuffleServerId。

4）当有外部的ShuffleService并且当前BlockMaId不是Driver端，则需要向ShuffleClient注册ShuffleServerId

2.Spark存储体系架构

1）1表示Executor的BlockManager与Driver的BlockManager进行消息通信，例如注册BlockManager、更新Block信息、获取Block所在的BlockManager、删除Executor等

2）2表示对BlockManager的读操作如get、doGetLocal等和写操作doPut、puSingle等

3）3表示当MemoryStore的内存不足时，写入DiskStore，而DiskStore实际依赖于DiskBlockManager

4）4表示通过访问远端节点的Executor的BlockManager中的TransportServer提供RPC服务下载或者上传Block

5）5表示远端节点的Executor的BlockManager访问本地Executor的BlockManager中的TransportServer提供的RPC服务下载或者上传Block。

二、shuffle服务与客户端

1.Block的RPC服务

当map任务与reduce任务处于不同的节点时，reduce任务需要从远端节点下载map任务的中间件输出，因此NettyBlockRpcServer提供打开，即下载Block文件的功能；一些情况下，为了容错，需要将Block的数据备份到其他节点上，所以NettyBlockRpcServer还提供了上传Block文件的RPC服务，实现见代码，代码位置：core/org.apache.spark.network.netty。

class NettyBlockRpcServer(
    appId: String,
    serializer: Serializer,
    blockManager: BlockDataManager)
  extends RpcHandler with Logging {

  private val streamManager = new OneForOneStreamManager()

  override def receive(
      client: TransportClient,
      rpcMessage: ByteBuffer,
      responseContext: RpcResponseCallback): Unit = {
    val message = BlockTransferMessage.Decoder.fromByteBuffer(rpcMessage)
    logTrace(s"Received request: $message")

    message match {
      case openBlocks: OpenBlocks =>
        val blocksNum = openBlocks.blockIds.length
        val blocks = for (i <- (0 until blocksNum).view)
          yield blockManager.getBlockData(BlockId.apply(openBlocks.blockIds(i)))
        val streamId = streamManager.registerStream(appId, blocks.iterator.asJava)
        logTrace(s"Registered streamId $streamId with $blocksNum buffers")
        responseContext.onSuccess(new StreamHandle(streamId, blocksNum).toByteBuffer)

      case uploadBlock: UploadBlock =>
        // StorageLevel and ClassTag are serialized as bytes using our JavaSerializer.
        val (level: StorageLevel, classTag: ClassTag[_]) = {
          serializer
            .newInstance()
            .deserialize(ByteBuffer.wrap(uploadBlock.metadata))
            .asInstanceOf[(StorageLevel, ClassTag[_])]
        }
        val data = new NioManagedBuffer(ByteBuffer.wrap(uploadBlock.blockData))
        val blockId = BlockId(uploadBlock.blockId)
        blockManager.putBlockData(blockId, data, level, classTag)
        responseContext.onSuccess(ByteBuffer.allocate(0))
    }
  }

  override def getStreamManager(): StreamManager = streamManager
}

View Code

2.构造传输上下文TransportContext

代码位置，common/network-common/org.apache.spark.network

  public TransportContext(
      TransportConf conf,
      RpcHandler rpcHandler,
      boolean closeIdleConnections) {
    this.conf = conf;
    this.rpcHandler = rpcHandler;
    this.closeIdleConnections = closeIdleConnections;
  }

View Code

TransportContext既可以创建Netty服务，也可以创建Netty访问客户端，组成部分如下。

1）TransportConf：主要控制Netty框架提供的shuffle的I/O交互的客户端和服务端线程数量等

2）RpcHandler：负责shuffle的I/O服务端在接收到客户端的RPC请求后，提供打开Block或者上传Block的RPC处理，此处实现为NettyBlockRpcServer

3）是否关闭闲置连接

3.RPC客户端工厂TransportClientFactory

 public TransportClientFactory createClientFactory(List bootstraps) {
    return new TransportClientFactory(this, bootstraps);
  }

View Code

以下分析TransportClientFactory代码。

public TransportClientFactory(
      TransportContext context,
      List clientBootstraps) {
    this.context = Preconditions.checkNotNull(context);
    this.conf = context.getConf();
    this.clientBootstraps = Lists.newArrayList(Preconditions.checkNotNull(clientBootstraps));
    this.connectionPool = new ConcurrentHashMap<>();
    this.numConnectionsPerPeer = conf.numConnectionsPerPeer();
    this.rand = new Random();

    IOMode ioMode = IOMode.valueOf(conf.ioMode());
    this.socketChannelClass = NettyUtils.getClientChannelClass(ioMode);
    this.workerGroup = NettyUtils.createEventLoop(
        ioMode,
        conf.clientThreads(),
        conf.getModuleName() + "-client");
    this.pooledAllocator = NettyUtils.createPooledByteBufAllocator(
      conf.preferDirectBufs(), false /* allowCache */, conf.clientThreads());
  }

View Code

1）clientBootstraps：用于缓存客户端列表

2）connectionPool：用户缓存客户端连接

3）numConnectionsPerPeer：节点之间取数据的连接数，可以使用属性spark.shuffle.io.numConnectionsPerPeer来配置，默认为1

4）SocketChannelClass：客户端channel被创建时使用的类，可以使用属性spark.shuffle.io.mode来配置

5）workerGroup：根据Netty的规范，客户端只有worker组，所以此处创建workerGroup，实际是NioEventLoopGroup

6）pooledAllocator：汇集ByteBuf但对本地线程缓存禁用的分配器。

4.Netty服务器TransportServer

TransportServer提供了Netty实现的服务器端，用于提供RPC服务，如上传、下载等，代码如下。

 public TransportServer createServer(
      String host, int port, List bootstraps) {
    return new TransportServer(this, host, port, rpcHandler, bootstraps);
  }

View Code

TransportServer构造器如下

public TransportServer(
      TransportContext context,
      String hostToBind,
      int portToBind,
      RpcHandler appRpcHandler,
      List bootstraps) {
    this.context = context;
    this.conf = context.getConf();
    this.appRpcHandler = appRpcHandler;
    this.bootstraps = Lists.newArrayList(Preconditions.checkNotNull(bootstraps));

    try {
      init(hostToBind, portToBind);
    } catch (RuntimeException e) {
      JavaUtils.closeQuietly(this);
      throw e;
    }
  }

View Code

init方法对TransportServer进行初始化，通过使用Netty框架的EventLoopGroup、ServerBootstrap等API创建shuffle的I/O交互的服务端，主要代码见清单。

  private void init(String hostToBind, int portToBind) {

    IOMode ioMode = IOMode.valueOf(conf.ioMode());
    EventLoopGroup bossGroup =
      NettyUtils.createEventLoop(ioMode, conf.serverThreads(), conf.getModuleName() + "-server");
    EventLoopGroup workerGroup = bossGroup;

    PooledByteBufAllocator allocator = NettyUtils.createPooledByteBufAllocator(
      conf.preferDirectBufs(), true /* allowCache */, conf.serverThreads());

    bootstrap = new ServerBootstrap()
      .group(bossGroup, workerGroup)
      .channel(NettyUtils.getServerChannelClass(ioMode))
      .option(ChannelOption.ALLOCATOR, allocator)
      .childOption(ChannelOption.ALLOCATOR, allocator);

    if (conf.backLog() > 0) {
      bootstrap.option(ChannelOption.SO_BACKLOG, conf.backLog());
    }

    if (conf.receiveBuf() > 0) {
      bootstrap.childOption(ChannelOption.SO_RCVBUF, conf.receiveBuf());
    }

    if (conf.sendBuf() > 0) {
      bootstrap.childOption(ChannelOption.SO_SNDBUF, conf.sendBuf());
    }

    bootstrap.childHandler(new ChannelInitializer() {
      @Override
      protected void initChannel(SocketChannel ch) throws Exception {
        RpcHandler rpcHandler = appRpcHandler;
        for (TransportServerBootstrap bootstrap : bootstraps) {
          rpcHandler = bootstrap.doBootstrap(ch, rpcHandler);
        }
        context.initializePipeline(ch, rpcHandler);
      }
    });

    InetSocketAddress address = hostToBind == null ?
        new InetSocketAddress(portToBind): new InetSocketAddress(hostToBind, portToBind);
    channelFuture = bootstrap.bind(address);
    channelFuture.syncUninterruptibly();

    port = ((InetSocketAddress) channelFuture.channel().localAddress()).getPort();
    logger.debug("Shuffle server started on port: {}", port);
  }

View Code

1）ioMode：NIO或者EPOLL

2） ChannelOption.ALLOCATOR：在Netty 4中实现了一个新的ByteBuf内存池，它是一个纯Java版本的 jemalloc （Facebook也在用）。现在，Netty不会再因为用零填充缓冲区而浪费内存带宽了。不过，由于它不依赖于GC，开发人员需要小心内存泄漏。如果忘记在处理程序中释放缓冲区，那么内存使用率会无限地增长。Netty默认不使用内存池，需要在创建客户端或者服务端的时候进行指定，使用内存池之后，内存的申请和释放必须成对出现，即retain()和release()要成对出现，否则会导致内存泄露。

3）RpcHandler处理接收到的数据逻辑

5.获取远程shuffle文件

NettyBlockTransferService的fetchBlocks方法用于获取远程的shuffle文件，实际是使用NettyBlockTransferService中创建的Netty服务。

override def fetchBlocks(
      host: String,
      port: Int,
      execId: String,
      blockIds: Array[String],
      listener: BlockFetchingListener,
      tempShuffleFileManager: TempShuffleFileManager): Unit = {
    logTrace(s"Fetch blocks from $host:$port (executor id $execId)")
    try {
      val blockFetchStarter = new RetryingBlockFetcher.BlockFetchStarter {
        override def createAndStart(blockIds: Array[String], listener: BlockFetchingListener) {
          val client = clientFactory.createClient(host, port)
          new OneForOneBlockFetcher(client, appId, execId, blockIds, listener,
            transportConf, tempShuffleFileManager).start()
        }
      }

      val maxRetries = transportConf.maxIORetries()
      if (maxRetries > 0) {
        // Note this Fetcher will correctly handle maxRetries == 0; we avoid it just in case there's
        // a bug in this code. We should remove the if statement once we're sure of the stability.
        new RetryingBlockFetcher(transportConf, blockFetchStarter, blockIds, listener).start()
      } else {
        blockFetchStarter.createAndStart(blockIds, listener)
      }
    } catch {
      case e: Exception =>
        logError("Exception while beginning fetchBlocks", e)
        blockIds.foreach(listener.onBlockFetchFailure(_, e))
    }
  }

View Code

6.上传shuffle文件

NettyBlockTransferService的uploadBlock方法用于上传shuffle文件到远程的Executor，实际也是用NettyBlockTransferService中创建的Netty服务，步骤如下。

override def uploadBlock(
      hostname: String,
      port: Int,
      execId: String,
      blockId: BlockId,
      blockData: ManagedBuffer,
      level: StorageLevel,
      classTag: ClassTag[_]): Future[Unit] = {
    val result = Promise[Unit]()
    val client = clientFactory.createClient(hostname, port)

    // StorageLevel and ClassTag are serialized as bytes using our JavaSerializer.
    // Everything else is encoded using our binary protocol.
    val metadata = JavaUtils.bufferToArray(serializer.newInstance().serialize((level, classTag)))

    // Convert or copy nio buffer into array in order to serialize it.
    val array = JavaUtils.bufferToArray(blockData.nioByteBuffer())

    client.sendRpc(new UploadBlock(appId, execId, blockId.toString, metadata, array).toByteBuffer,
      new RpcResponseCallback {
        override def onSuccess(response: ByteBuffer): Unit = {
          logTrace(s"Successfully uploaded block $blockId")
          result.success((): Unit)
        }
        override def onFailure(e: Throwable): Unit = {
          logError(s"Error while uploading block $blockId", e)
          result.failure(e)
        }
      })

    result.future
  }

View Code

1）创建Netty服务的客户端，客户端连接的hostname和port正是BlockManager的hostname和port

2）将Block的存储级别StorageLevel和类标签序列化

3）将Block的ByteBuffer转化为数据，便于序列化

4）将appId、execId、blockId、metadata、转化为数组的Block封装为UploadBlock，并将其序列化为字节数组

5）最终调用Netty客户端的sendRpc方法将字节数组上传，回掉函数RpcResponseCallback根据RPC的结果更改上传状态。

借助零信任网格重塑分布式MCP与LLM访问：安全、灵活的下一代架构实践码力金矿机器学习深度学习人工智能人工智能自动化运维数据库 mysql python java
在数字化转型的浪潮中，AI应用与分布式系统正在加速融合。传统架构中，MCP（模型上下文协议）服务与LLM（大语言模型）工具的部署常面临安全暴露、网络复杂性、跨防火墙通信等挑战。本文将结合零信任网格（ZTM,ZeroTrustMesh）与Flomesh技术，探索一种更安全、灵活的分布式架构方案，让MCP服务无需VPN或静态IP即可实现全球可访问，同时为LLM应用提供统一的安全层。一、传统分布式架构的
【晨间日记】 2020年8月9日语瞳SAMA
2020年8月9日天气：小雨转多云【90天践行目标】（63/90）①5：30早起②22：30早睡③写晨间日记【昨日践行】①6：02起床②22：58入睡③晨间日记已达成【今日青蛙】①完成暑期实践总结报告②开始校友邦打卡③英语百词斩*昨日三只青蛙已达成【反思日志】昨天母亲带着欣远和欣栩来老房子这边吃晚饭，带来了许多欢乐与活力。其中让我印象最为深刻的是欣远的学习能力。自己在六级英语百词斩时，欣远与欣栩也
《深入浅出Spring》控制反转（IoC）与依赖注入（DI）
举例说明引出spring有2个类，A和B，如下：publicclassA{publicvoidsayHello(){}}publicclassB{publicvoidsayHello();}上面2个类都有同样的sayHello方法。现在我们调用B的sayHello方法完成一些事情，而B中的sayHello方法需要调用A中的sayHello方法才可以完成这个事情，所以B的代码变成了下面这样：publ
k8s:手动创建PV，解决postgis数据库本地永久存储云游 k8s kubernetes 容器云原生
1.离线环境CPU:HygonC86728532-coreProcessor操作系统：麒麟操作系统containerd：1.7.27Kubernetes:1.26.12KubeSphere:4.1.2kubekey：3.1.10Harbor:2.13.1Postgis:17-3.52创建StorageClass2.1创建apiVersion:storage.k8s.io/v1kind:Storag
中秋节送什么给老师？中秋节送老师的礼物推荐直返APP抖音优惠券
中秋节送老师礼物，既是对老师辛勤付出的感谢，也是对节日的美好祝福。以下是一些建议，希望能为您的选择提供帮助：一、传统与节日特色礼物月饼礼盒理由：月饼作为中秋节的传统食品，象征着团圆和美满。送老师月饼礼盒，不仅符合节日氛围，还能表达对老师的节日问候和感激之情。选择建议：可以选择口味丰富、包装精美的月饼礼盒，如五芳斋、稻香村等知名品牌的月饼礼盒，既体现了心意，又不失档次。茶叶礼盒理由：茶叶是一种高雅的
约练收获《坚持就是最好的教练》 78679e553f55
中原焦点团队朱继萍第六期第25组第22-23次约练总34次角色：2次咨询师1.熟悉的套路设置，在现实咨询中原来不以为然，没有或许精确到分钟上，通过几次在设置中的坚持能带给我一种规则感与紧迫的感觉；甚至还没有把问题聊透，时间流到点位啦，新手小白，自我把控还需要修炼哟！2.认真聆听来访者的不自主的叹气、内耗、纠结、无奈，不时回应，能及时共情到她的无力与无奈；同频共振3.当来访者很急于寻找问题答案时，你
USB串口通信、握手协议、深度学习等技术要点深度学习教程, 深度学习人工智能网络协议
基于OpenMV的智能车牌识别系统：从硬件到算法的完整实现前言本文将详细介绍一个基于OpenMV微控制器的智能车牌识别系统的设计与实现。该系统集成了嵌入式视觉处理、串口通信协议、深度学习OCR识别等多种技术，实现了从图像采集到车牌识别的完整流程。系统架构概述整体设计思路该车牌识别系统采用分布式架构设计，将计算密集型任务与嵌入式控制分离：┌─────────────┐USB串口通信┌────────
Shell 脚本加密操作：让用户可执行，不可查看脚本源码 —— shc 实战避坑指南
在日常运维和开发中，Shell脚本常包含敏感信息（如数据库密码、API密钥、服务器IP等）。若直接分发脚本，源码暴露风险极高。此时，加密脚本（可执行但不可读）成为刚需。常见的shc工具可将脚本编译为二进制文件，实现“能执行但不可看”的效果。一、shc加密脚本的使用方法安装shc包管理器安装（推荐）：#Ubuntu/Debiansudoaptinstallshc#CentOS/RHELsudoyum
Unity与VS2015协同调试C#脚本实战指南带你玩遍北海道
本文还有配套的精品资源，点击获取简介：Unity是广受青睐的跨平台游戏引擎，C#是其主要编程语言。VisualStudio2015作为一个强大的IDE，支持对Unity项目中的C#代码进行深入调试。本文将指导你如何设置VisualStudio2015作为Unity项目的官方外部脚本编辑器，并详细说明如何在VS2015中进行代码调试，包括断点设置、启动调试、调试操作和性能优化等步骤。了解这些调试技巧
深入浅出理解 IOC（控制反转）与 DI（依赖注入） snowfoootball 前后端 java 开发语言 spring
深入浅出理解IOC（控制反转）与DI（依赖注入）深入理解Spring框架中的IoC与DI在学习Spring框架时，控制反转（IoC）和依赖注入（DI）是不可回避的核心概念。它们不仅是设计模式的体现，更是实现高内聚、低耦合架构的关键。本文将从“为何需要”与“如何实现”两个维度，深入剖析这两个概念。一、为何需要IoC与DI：面向对象设计的挑战考虑以下传统的Java代码示例：publicclassOrd
感知数学：差距在哪里政坤奶奶
昨天下午，这孩子回来说，“什么是和倍？我似懂非懂。”这孩子说话有个特点，成语随口而出。有些词用的还很恰当。比如这个似懂非懂。定心一想，我也说不清楚什么是和倍。如果说他是似懂非懂，我则是一点也不摸头绪。今天上午，他上学后，我打开他昨天带回来的书。关于和倍问题是这样解释的：已知两个数的和与两个数之间的倍数关系，求这两个数分别是多少，像这样的应用题，通常叫作“和倍问题。”解决和倍问题，一般是要找出两个数
Kubernetes 配置管理全解析：ConfigMap 与 Secret 核心机制
在Kubernetes中管理应用配置和敏感信息是核心需求。ConfigMap用于存储非敏感配置数据（如环境变量、配置文件），而Secret专用于存储敏感信息（如密码、密钥），两者都通过键值对形式存储数据，并支持挂载为环境变量或文件供Pod使用。一、核心概念对比特性ConfigMapSecret数据类型非敏感配置（如环境变量、配置文件）敏感数据（密码、密钥、Token）存储格式明文存储（YAML/J
数据结构与算法-09贪心算法&动态规划阿诚学java 数据结构与算法学习记录贪心算法动态规划 ios
贪心算法&动态规划1贪心算法介绍贪心算法（GreedyAlgorithm）是一种在每一步选择中都采取在当前状态下最好或最优（即最有利）的选择，从而希望导致结果是全局最好或最优的算法。贪心算法通常用于解决优化问题，如最小化成本、最大化收益等。然而，贪心算法并不总是能够得到全局最优解，但它具有直观、高效、易于实现等优点，因此在许多实际问题中得到了广泛应用。基本思想贪心算法总是从问题的某一个初始解出发。
内卷的劳动节喵喵小世界
最初创业的时候，因为生意刚起步，一年三百六十五天，全年无休，没有节假日，更没有时间和机会带孩子东游西逛，增广见闻。五一劳动节，就感觉与自己无关，别人休息的时候，却是我们最忙的时候。如果说非要和这个节日扯上点关系的话，那就是每天都在不停劳动，劳动最光荣，劳动强身健体，相当于运动了。最近几年因为转了行业，终于能和孩子们一同休息，也能奢侈的体验一把各种节假日休息的幸福。没事带孩子去找景拍照，我最喜欢的就
基于Docker搭建Harbor私有镜像仓库
Harbor是VMware开源的企业级Docker容器镜像仓库，支持镜像存储、访问控制、镜像复制、安全扫描、审计日志等功能，适合企业级私有化部署。1.前置环境说明Harbor的部署依赖于Docker和DockerCompose环境。鉴于Docker已在系统中完成安装，以下将重点介绍DockerCompose的配置及Harbor的安装步骤。下面示例是在线安装，离线安装可以去github下载安装包[r
Kubernetes 核心命令速查手册：运维与开发必备 liux3528 k8s kubernetes 运维容器
本文整理了Kubernetes集群运维的实用命令集锦，涵盖8大核心场景：1）集群基础信息查看；2）Pod生命周期管理；3）服务与网络配置；4）存储与配置管理；5）故障排查方法；6）性能监控优化；7）高级运维技巧；8）命令行效率工具。重点包括节点状态查询、Pod调试、日志分析、网络连通性测试、资源监控等高频操作，并提供了批量处理、安全审计、集群维护等进阶技巧。每个命令均标注适用场景，可作为K8s运维
Eureka 和 Nacos 简单程序猿 eureka 云原生
一、基本介绍EurekaEureka是Netflix公司开发的一款基于REST风格的服务注册与发现组件，专为分布式系统设计。它遵循AP原则（可用性、分区容错性优先），强调在网络分区等异常情况下的服务可用性，是SpringCloudNetflix生态中的核心组件之一。NacosNacos（DynamicNamingandConfigurationService）是阿里巴巴开源的一站式服务发现、配置管
抖音购物秘籍：利用高省APP，轻松返利又赚钱！测评君高省
一、通过高省获得返利下载并注册高省APP在手机应用商店搜索“高省”并下载安装。打开APP，按照提示注册并填写真实有效的个人信息。注册时填写高省官方邀请码555553，可享额外福利或提升会员等级。绑定抖音账号在高省APP中找到“绑定抖音”选项，按照提示完成绑定。这样你就能在高省APP中直接搜索和浏览抖音上的商品，并享受返利服务。搜索和浏览商品在抖音平台上浏览感兴趣的商品，点击商品详情页后复制商品链接
荆门10家亲子鉴定机构地址查询（附2024年鉴定办理攻略）国医基因陈主任
荆门亲子鉴定中心地址在哪里？荆门亲子鉴定中心在荆门市象山大道67号（国医基因）。服务范围包含整个荆门及周边地区。正规的亲子鉴定中心实验室必须通过相关部门的认证，具备完整的实验室检验流程系统来确保测验结果的准确性，只有经过实验室认可，出具的鉴定报告才算是有效的。本文小编整理了2024年最新荆门亲子鉴定地址一览供大家参考。荆门国医基因亲子鉴定中心地址：荆门市象山大道67号荆门亲子鉴定中心大全1、国医基
7、开启C与Unity 3D的编程之旅珊珊333333 Unity C#Unity 3D 编程基础
开启C#与Unity3D的编程之旅1.前期准备在进行每一个教程之前，都有一个名为Scene的场景文件。在整个学习过程中，教程通常从下载项目中的Scene文件开始。打开场景的方法有两种：-直接在项目面板的Assets目录下双击场景图标。-选择File→OpenScene来打开项目中的任何场景。2.学习回顾与要点创建并将新的C#文件分配给对象并不复杂，在Unity3D编辑器中有多种方法可以实现。添加代
Life Chapter 1 罗慕清
从悲伤到幸福，或许只是一瞬间的事呢。最近忙忙碌碌的，身不由己，莫名总是觉得压抑委屈，看起来过得十分充实，自己心里却没有底，仿佛一直被什么东西追赶着，我必须跑，必须跑，必须跑，身后是恐惧，身前是黑暗。做出的事情也不尽如人意，自己一度成为了自己最讨厌的那种人，说真的，如果不是朋友的信任与陪伴，如果不是觉得不应该让世界上那么多和我息息相关的人为我感到些许难过，如果不是觉得我还有很多事情没有经历过，很多地
快手极速版能赚钱吗？解析快手极速版赚钱的3个方法！ U客直谈APP
快手极速版相信大家都有一定的了解吧，它作为快手打造的轻量化app，在应用市场上占据着一席之位。而对于其能赚钱的说法，更是引得大家的热烈追捧。那么快手极速版能赚钱吧？其赚钱是真的吗？快手极速版怎么赚钱？快手极速版一天赚50元的技巧有哪些呢？本篇文章就将解大家所疑，解析快手极速版赚钱的3个方法，帮助大家成功在该平台赚取收入，达到快手极速版一天赚50元的目标。一、快手极速版能赚钱吗答案显然是肯定的！快手
Day1学习心得||Leetcode704,27,977
Part1数组的一些注意点第一天学习的内容是数组，基础的内容就按下不表，浅记一下补上的漏洞1.数组的元素不能删除，只能覆盖乍一看可能比较奇怪，但是仔细思考一下很简单。关注一下数组的本质其实是内存上开辟的一串连续的内存空间。在程序中，只能将内存空间中存储的内容改写，而不能完全去除（即使动态数组也只是释放）。2.二维数组的空间地址依然是连续的（顺序比较像阅读的顺序）tip:虽然还没学过Java，但是先
数据结构与算法----贪心王嘉俊925 算法算法数据结构 C++贪心算法
##贪心算法1.核心思想贪心算法通过每一步的局部最优选择，逐步推导出全局最优解。它的特点是不回溯，即一旦做出选择，就不再修改。2.适用条件贪心算法适用于满足以下两个条件的问题：贪心选择性质：每一步的局部最优选择能够导致全局最优解。最优子结构：问题的最优解包含子问题的最优解。3.贪心算法的证明方法贪心算法的正确性通常需要通过以下方法证明：归纳法：证明每一步的贪心选择都能导致全局最优。交换论证：假设存
Jenkins 不同节点间文件传递：跨 Job 与同 Job 的实现方法
在日常的DevOps运维实践中，Jenkins通常被用于串联多个自动化流程，而这些流程往往需要在不同的构建节点（agent）上执行。例如，在以下场景中：场景需求描述（实际问题）最近在一次部署任务中，我遇到这样一个需求：Jenkins的a节点执行某些命令或脚本，生成一个临时文件或构建产物；然后需要b节点获取这个文件，并继续执行后续处理（如压缩、上传、部署等）；a节点与b节点不直接通信，它们都只能与J
零基础数据结构与算法——第五章：高级算法-贪心算法-基础&示例
5.2贪心算法（GreedyAlgorithm）5.2.1贪心算法的基本概念什么是贪心算法？贪心算法是一种在每一步选择中都采取当前状态下最好或最优的选择，从而希望导致结果是最好或最优的算法。生活例子：想象你在超市购物，手里有100元钱，想买尽可能多的零食。如果你采用贪心策略，你会怎么做？你可能会先选择最便宜的零食，然后是第二便宜的，以此类推，直到钱用完。这就是一种贪心策略——每次都选择当前看起来最
夜夜施肥盼果来，颗颗甜香不负君「芭芭农场喜提鲜果」小石头JS
前几日见友友Athena的《我有一个“种菜梦”，如今它终于成真了》文章，刚好也是我家芭芭农场收获之时，一直想写篇文章记录一下，但因忙碌一直推到现在，实在不该。与A君合种芭芭农场已有半年有余，如今收获12枚黄心猕猴桃，真是不负众望啊。收获当天过于忙碌，黄心猕猴桃带回家就摞在一堆快递上了，今日忽然想起，立马拆开查看，并试吃一颗。摸起来不太软的黄心猕猴桃，削了皮是金灿灿的黄心，细小的黑色籽粒均匀分布在两
官途之红颜多娇(陈阳丁若烟)免费小说全集_阅读免费小说官途之红颜多娇陈阳丁若烟六小升
《官途之红颜多娇》主角：陈阳丁若烟，简介：领导葬礼上，美艳的夫人遭受欺凌，小车司机陈阳挺身而出，俘获夫人芳心，从此平步青云，潇洒花丛。陈阳走进卧室，把丁若烟丢在床上。“呆子，过来！”丁若烟羞涩地靠在床头，对他勾了勾手指。陈阳喉咙动了，目光落在床上那件性感的蚕丝吊带睡裙上。“怎么，想看我穿上呀？”丁若烟似笑非笑。“想！”陈阳用力点头。“这可是我新买的，他都还没体验过呢，让你尝个鲜。”丁若烟红着俏脸。
天天玩游戏却能赚钱？说的就是这五种职业，一个比一个轻松！氧惠好物
一、游戏陪玩赚钱游戏陪玩是现下玩游戏比较热门的赚钱方式。指的是陪客户玩指定的网络游戏，在玩游戏的全程需要提供语音、文字等聊天服务，结束后收取对应的陪玩费用。做陪玩赚钱对游戏等级有一定的要求，通常在入驻平台时会被要求上传游戏账号截图(包含游戏ID、段位、积分等信息)，在审核通过后才能开始接单，一般接单分为两种模式，即抢单和派单。在陪玩的过程中，不仅仅是需要有一定的游戏技术，还需要会聊天，声音好听会说
今日计划与复盘2019.7.6 河北凤凰高飞
今日计划与复盘2019.7.61.早起：6点前达标2.写字一篇3.跑步五公里复盘：今天是妈妈生日，给妈妈买了生日蛋糕。说来惭愧，不是爸爸提醒，我差点忘了妈妈生日，还不如我儿子晚上从衡水一中打来电话，祝他奶奶生日快乐。今天以休息为主，很放松。打卡也很随意，晚上快11点才打了部分卡。
ztree设置禁用节点 3213213333332132 JavaScript ztree json setDisabledNode Ajax
ztree设置禁用节点的时候注意，当使用ajax后台请求数据,必须要设置为同步获取数据，否者会获取不到节点对象，导致设置禁用没有效果。 $(function(){ showTree(); setDisabledNode(); });
JVM patch by Taobao bookjovi java HotSpot
在网上无意中看到淘宝提交的hotspot patch，共四个，有意思，记录一下。 7050685：jsdbproc64.sh has a typo in the package name 7058036：FieldsAllocationStyle=2 does not work in 32-bit VM 7060619：C1 should respect inline and
将session存储到数据库中 dcj3sjt126com sql PHP session
CREATE TABLE sessions ( id CHAR(32) NOT NULL, data TEXT, last_accessed TIMESTAMP NOT NULL, PRIMARY KEY (id) ); <?php /** * Created by PhpStorm. * User: michaeldu * Date
Vector 171815164 vector
public Vector<CartProduct> delCart(Vector<CartProduct> cart, String id) { for (int i = 0; i < cart.size(); i++) { if (cart.get(i).getId().equals(id)) { cart.remove(i);
各连接池配置参数比较 g21121 连接池
排版真心费劲，大家凑合看下吧，见谅~ Druid DBCP C3P0 Proxool 数据库用户名称 Username Username User 数据库密码 Password Password Password 驱动名
[简单]mybatis insert语句添加动态字段 53873039oycg mybatis
mysql数据库,id自增,配置如下： <insert id="saveTestTb" useGeneratedKeys="true" keyProperty="id" parameterType=&
struts2拦截器配置云端月影 struts2拦截器
struts2拦截器interceptor的三种配置方法方法1. 普通配置法 <struts> <package name="struts2" extends="struts-default"> &
IE中页面不居中，火狐谷歌等正常 aijuans IE中页面不居中
问题是首页在火狐、谷歌、所有IE中正常显示，列表页的页面在火狐谷歌中正常，在IE6、7、8中都不中，觉得可能那个地方设置的让IE系列都不认识，仔细查看后发现，列表页中没写HTML模板部分没有添加DTD定义，就是<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3
String,int,Integer,char 几个类型常见转换 antonyup_2006 html sql .net
如何将字串 String 转换成整数 int? int i = Integer.valueOf(my_str).intValue(); int i=Integer.parseInt(str); 如何将字串 String 转换成Integer ? Integer integer=Integer.valueOf(str); 如何将整数 int 转换成字串 String ? 1.
PL/SQL的游标类型百合不是茶显示游标(静态游标)隐式游标游标的更新和删除 %rowtype ref游标(动态游标)
游标是oracle中的一个结果集,用于存放查询的结果; PL/SQL中游标的声明; 1,声明游标 2,打开游标(默认是关闭的); 3,提取数据 4,关闭游标注意的要点:游标必须声明在declare中,使用open打开游标,fetch取游标中的数据,close关闭游标隐式游标:主要是对DML数据的操作隐
JUnit4中@AfterClass @BeforeClass @after @before的区别对比 bijian1013 JUnit4 单元测试
一.基础知识 JUnit4使用Java5中的注解（annotation），以下是JUnit4常用的几个annotation： @Before：初始化方法对于每一个测试方法都要执行一次（注意与BeforeClass区别，后者是对于所有方法执行一次）@After：释放资源对于每一个测试方法都要执行一次（注意与AfterClass区别，后者是对于所有方法执行一次
精通Oracle10编程SQL(12)开发包 bijian1013 oracle 数据库 plsql
/* *开发包 *包用于逻辑组合相关的PL/SQL类型（例如TABLE类型和RECORD类型）、PL/SQL项（例如游标和游标变量）和PL/SQL子程序（例如过程和函数） */ --包用于逻辑组合相关的PL/SQL类型、项和子程序，它由包规范和包体两部分组成 --建立包规范：包规范实际是包与应用程序之间的接口，它用于定义包的公用组件，包括常量、变量、游标、过程和函数等 --在包规
【EhCache二】ehcache.xml配置详解 bit1129 ehcache.xml
在ehcache官网上找了多次，终于找到ehcache.xml配置元素和属性的含义说明文档了，这个文档包含在ehcache.xml的注释中！ ehcache.xml ： http://ehcache.org/ehcache.xml ehcache.xsd ： http://ehcache.org/ehcache.xsd ehcache配置文件的根元素是ehcahe ehcac
java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderL 白糖_ java eclipse spring tomcat Web
今天学习spring+cxf的时候遇到一个问题：在web.xml中配置了spring的上下文监听器： <listener> <listener-class>org.springframework.web.context.ContextLoaderListener</listener-class> </listener> 随后启动
angular.element boyitech AngularJS AngularJS API angular.element
angular.element 描述: 包裹着一部分DOM element或者是HTML字符串，把它作为一个jQuery元素来处理。（类似于jQuery的选择器啦）如果jQuery被引入了，则angular.element就可以看作是jQuery选择器，选择的对象可以使用jQuery的函数；如果jQuery不可用，angular.e
java-给定两个已排序序列，找出共同的元素。 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class CommonItemInTwoSortedArray { /** * 题目：给定两个已排序序列，找出共同的元素。 * 1.定义两个指针分别指向序列的开始。 * 如果指向的两个元素
sftp 异常，有遇到的吗？求解 Chen.H java jcraft auth jsch jschexception
com.jcraft.jsch.JSchException: Auth cancel at com.jcraft.jsch.Session.connect(Session.java:460) at com.jcraft.jsch.Session.connect(Session.java:154) at cn.vivame.util.ftp.SftpServerAccess.connec
[生物智能与人工智能]神经元中的电化学结构代表什么? comsci 人工智能
我这里做一个大胆的猜想,生物神经网络中的神经元中包含着一些化学和类似电路的结构,这些结构通常用来扮演类似我们在拓扑分析系统中的节点嵌入方程一样,使得我们的神经网络产生智能判断的能力,而这些嵌入到节点中的方程同时也扮演着"经验"的角色.... 我们可以尝试一下...在某些神经
通过LAC和CID获取经纬度信息 dai_lm lac cid
方法1：用浏览器打开http://www.minigps.net/cellsearch.html，然后输入lac和cid信息(mcc和mnc可以填0)，如果数据正确就可以获得相应的经纬度方法2：发送HTTP请求到http://www.open-electronics.org/celltrack/cell.php?hex=0&lac=<lac>&cid=&
JAVA的困难分析 datamachine java
前段时间转了一篇SQL的文章（http://datamachine.iteye.com/blog/1971896），文章不复杂，但思想深刻，就顺便思考了一下java的不足，当砖头丢出来，希望引点和田玉。 -----------------------------------------------------------------------------------------
小学5年级英语单词背诵第二课 dcj3sjt126com english word
money 钱 paper 纸 speak 讲，说 tell 告诉 remember 记得，想起 knock 敲，击，打 question 问题 number 数字，号码 learn 学会，学习 street 街道 carry 搬运，携带 send 发送，邮寄，发射 must 必须 light 灯，光线，轻的 front
linux下面没有tree命令 dcj3sjt126com linux
centos p安装 yum -y install tree mac os安装 brew install tree 首先来看tree的用法 tree 中文解释：tree 功能说明：以树状图列出目录的内容。语　　法：tree [-aACdDfFgilnNpqstux][-I <范本样式>][-P <范本样式
Map迭代方式，Map迭代，Map循环蕃薯耀 Map循环 Map迭代 Map迭代方式
Map迭代方式，Map迭代，Map循环 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年
Spring Cache注解+Redis hanqunfeng spring
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redis</artifactId>
Guava中针对集合的 filter和过滤功能 jackyrong filter
在guava库中，自带了过滤器(filter)的功能，可以用来对collection 进行过滤，先看例子： @Test public void whenFilterWithIterables_thenFiltered() { List<String> names = Lists.newArrayList("John"
学习编程那点事 lampcy 编程 android PHP html5
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
架构师之流处理---------bytebuffer的mark,limit和flip nannan408 ByteBuffer
1.前言。如题，limit其实就是可以读取的字节长度的意思，flip是清空的意思，mark是标记的意思。 2.例子. 例子代码: String str = "helloWorld"; ByteBuffer buff = ByteBuffer.wrap(str.getBytes()); Sy
org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1, column 1 Everyday都不同 $转义 el表达式
最近在做Highcharts的过程中，在写js时，出现了以下异常：严重: Servlet.service() for servlet jsp threw exception org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1,
用Java实现发送邮件到163 tntxia java实现
/* 在java版经常看到有人问如何用javamail发送邮件？如何接收邮件？如何访问多个文件夹等。问题零散，而历史的回复早已经淹没在问题的海洋之中。本人之前所做过一个java项目，其中包含有WebMail功能，当初为用java实现而对javamail摸索了一段时间，总算有点收获。看到论坛中的经常有此方面的问题，因此把我的一些经验帖出来，希望对大家有些帮助。此篇仅介绍用
探索实体类存在的真正意义 java小叶檀 POJO
一. 实体类简述实体类其实就是俗称的POJO,这种类一般不实现特殊框架下的接口，在程序中仅作为数据容器用来持久化存储数据用的 POJO（Plain Old Java Objects）简单的Java对象它的一般格式就是 public class A{ private String id; public Str

Spark源码阅读之存储体系--存储体系概述与shuffle服务

一、概述

1.块管理器BlockManager的实现

2.Spark存储体系架构

二、shuffle服务与客户端

1.Block的RPC服务

2.构造传输上下文TransportContext

3.RPC客户端工厂TransportClientFactory

4.Netty服务器TransportServer

5.获取远程shuffle文件

6.上传shuffle文件

你可能感兴趣的:(Spark源码阅读之存储体系--存储体系概述与shuffle服务)