yoona666

Spark消息通信

二、Spark通信机制

2.1 Spark通信机制的重要概念

（1）RpcEndpoint：RPC端点，Spark将每个通信实体/集群节点（Client/Master/Worker等）都称之为一个Rpc端点，且都实现了RpcEndpoint接口，内部根据不同端点的需求，设计不同的消息和不同的业务处理，如果需要发送消息则调用Dispatcher中的相关方法；

（2）RpcEnv：RPC上下文环境，RpcEndpoint运行时依赖的上下文环境称之为RpcEnv，其管理RpcEndpoint需要的一些东西，如Dispatcher消息分发器，每个RpcEndpoint都对应着自己的一个RpcEnv；

（3）Dispatcher（存在于RpcEnv中）：消息分发器，用于发送消息或者从远程RpcEndpoint和本地接收消息，并将消息分发至对应的指令收件箱/发件箱。如果消息接收方是自己的话（即发往本地的消息或从远程RpcEndpoint接收到的消息），那就将消息存入本地RpcEndpoint的收件箱，如果消息接收者为远程RpcEndpoint，则将消息放入指定远程RpcEndpoint的发件箱，每个RpcEndpoint内部维护了一批远程RpcEndpoint的Outbox，表示本地RpcEndpoint需要与这些RpcEndpoint进行通信。Dispatcher类中的MessageLoop线程负责读取LinkedBlockingQueue中的RpcMessage消息，然后处理Inbox中的消息，由于是阻塞队列，当没有消息的时候自然阻塞，一旦有消息，就开始工作。Dispatcher的ThreadPool负责消费这些Message。也就是说某个RpcEndpoint需要发送消息或接收到消息时均先将消息发送到自己的Dispatcher消息分发器中，然后再由消息分区器来分配消息的处理方式，RpcEndpoint对应的Dispatcher中维护了一些远程RpcEndpoint的地址（以Outbox的形式）。

（4）Inbox：本地RpcEndpoint的消息收件箱，一个本地RpcEndpoint对应一个Inbox，Dispatcher每次向Inbox存入消息时，都将对应的EndpointData（内部维护该消息发往的本地端点的endpoint和endpointRef，以及本地端点对应的Inbox）加入到内部的Receiver Queue（阻塞队列）中，且在Dispatcher创建时会启动一个单独的线程轮询Receiver Queue队列查看有无消息，若有消息则进行消息消费。

（5）Outbox（存在于RpcEnv中）：消息发件箱，一个RpcEndpoint对应的RpcEnv对象中维护了一些远程RpcEndpoint地址及其Outbox的映射（即某个RpcEndpoint中维护了一些远程RpcEndpoint的地址和对应于该远程RpcEndpoint的发件箱，便于拿到远程RpcEndpoint的地址，发送消息给远程RpcEndpoint），当消息放入Outbox后，紧接着将消息通过远程RpcEndpoint（实际是调用该端点的ref引用）对应的TransportClient发送出去。消息放入发件箱以及发送过程是在同一个线程中进行的。即发件箱中的消息是通过远程RpcEndpoint对应的TransportClient发送给其它RpcEndpoint。

（6）TransportClient：Netty通信客户端，根据Outbox消息的receiver的地址信息，实例化相应远程端点的TransportClient，然后发送消息至远程TransportServer，每个RpcEndpoint也维护了一个其它远程RpcEndpoint的TransportClient集合。

（7）TransportServer：Netty通信服务端，一个RpcEndpoint对应一个TransportServer，接收到远程消息后调用自己的Dispatcher分发消息至本地endpoint的收件箱。

综上所述：一个RpcEndpoint内部主要维护了以下一些东西：

（1）依赖一个RpcEnv上下文执行环境；

（2）维护一个Inbox，接收本地发往本地的消息以及从远程RpcEndpoint接收到的消息；

（3）维护多个远程RpcEndpoint对应的Outbox集合，每个远程RpcEndpoint对应一个Outbox，本地往某个远程RpcEndpoint发消息时，先根据远程RpcEndpoint地址找到对应的Outbox，往那个Outbox添加消息；

（4）一个Dispatcher消息分发器；

（5）维护远程RpcEndpoint对应的TransportClient映射；

（6）维护本地的TransportServer用于接收远程RpcEndpoint发送过来的消息。

RpcEndpoint接收/发送消息的过程大致如下：

接收消息：每个RpcEndpoint对应的TransportServer负责接收其它RpcEndpoint发送过来的消息，然后将消息添加到本地RpcEndpoint中的Dispatcher中，Dispatcher再将消息添加到本地的Inbox收件箱，Inbox中会有一个阻塞队列用于存放接收到的消息，然后有一个线程会不断地轮询这个队列，拉取消息进行消息的消费；

发送消息：RpcEndpoint发送消息时，先将消息放到自己的Dispatcher中，然后Dispatcher根据消息发往的远程RpcEndpoint地址找到相应的Outbox发件箱（每个本地端点维护了一些远程端点的Outbox对象），然后将消息添加到指定的Outbox中，后续通过远程RpcEndpoint对应的TransportClient将对应Outbox发件箱中的消息发送出去。

2.2 Spark通信相关类解析

2.2.1 RpcEndpoint

在Spark中，RpcEndpoint是所有通信实体的抽象。RpcEndpoint是一个trait，其中定义了一些函数，这些函数都是在收到某个特定的消息后才会被触发，执行相应的逻辑（真正的执行逻辑是由具体实现类实现的，如Master），其中onStart、receive和onStop这三个方法的调用是有先后顺序的，RpcEndpoint中的方法如下：

rpcEnv：RpcEndpoint执行依赖的上下文环境；

receive：接收消息并处理；

receiveAndReply：接收消息处理后，并给消息发送者返回响应；

onError：发生异常时调用；

onConnected：当客户端（远程端点）与本地RpcEndpoint建立连接后调用；

onDisconnected：当客户端与本地RpcEndpoint失去连接后调用；

onNetworkError：当网络连接发生错误时调用；

onStart：RpcEndpoint启动时调用；

onStop：RpcEndpoint停止时调用。

RpcEndpoint中最重要的几个方法：onStart、receive、receiveAndReply以及onStop，这几个方法就是RpcEndpoint的生命周期。

RpcEndpoint的继承体系如下图：

由上图可知，Master和Worker等都是一个RpcEndpoint，ClientEndpoint是每个SparkApp的终端点——即Spark应用对应的RpcEndpoint，DriverEndpoint是Spark Driver的endpoint，HeartbeatReceiver是Executor发送心跳消息给Driver的Endpoint，CoarseGrainedExecutorBackend是Spark Executor的endpoint，用于执行Executor的相关操作。上述这些RpcEndpoint都继承自ThreadSafeRpcEndpoint，即均是线程安全的。

2.2.2 RpcEndpointRef

RpcEndpointRef是对RpcEndpoint的引用，本地RpcEndpoint要向远端的一个RpcEndpoint发送消息时，必须通过远程RpcEndpoint的引用 RpcEndpointRef才能往远程端点发送消息。RpcEndpointRef指定了ip和port，是一个类似spark://host:port这种的地址，RpcEndpointRef在Spark中只有一个子类，即NettyRpcEndpointRef，即无论是何种类型的RpcEndpoint，其ref引用都是NettyRpcEndpointRef对象，内部提供了一些方法用于发送消息，如下所示：

RpcEndpoint的地址在spark中表示为RpcAddress对象，该类只有两个字段：host和port

//每个RpcEndpoint均对应不同的port，所以一个RpcEndpoint的地址由host和port唯一确定
private[spark] case class RpcAddress(host: String, port: Int) {
  def hostPort: String = host + ":" + port
  def toSparkURL: String = "spark://" + hostPort
  override def toString: String = hostPort
}

其中的address返回该引用对应的真实RpcEndpoint的地址，name则返回对应真实RpcEndpoint的名称。此外该类还提供了ask和askSync方法，其中ask方法是异步的，返回一个Future对象用于获取响应，而askSync则是同步的，调用时会阻塞等待结果返回，而send()方法只管发送消息，不关心响应，endpointRef中的ask和send方法都是用于向远程RpcEndpoint发送消息的。

2.2.3 RpcEnv

RpcEnv是RpcEndpoint的运行环境，内部维护了RpcEndpoint运行所需的一系列东西，如Dispatcher消息分发器、Outbox发件箱等（每个远程端点都对应一个Outbox），内部结构如下图：

RpcEnv类有一个伴生对象RpcEnv，该伴生对象内提供了两个create方法用于创建RpcEnv对象，其实最终调用的都是第二个create方法，通过RpcEnvFactory工厂创建NettyRpcEnv对象。

RpcEnv类中提供了一些方法用于在Dispatcher中注册RpcEndpoint和RpcEndpointRef对象，其中setupEndpoint()用于注册RpcEndpoint，setupEndpointRef()则用于获取RpcEndpointRef，在获取RpcEndpointRef时会先调用RpcEndpointVerfier这个endpoint校验对应的RpcEndpoint是否已经注册，若RpcEndpoint没有注册，则对应的RpcEndpointRef获取会失败，若已经在Dispacher中注册，则实例化一个RpcEndpointRef对象。

此外还提供了一些额外的方法：如address获取当前RpcEnv对应的地址，endpointRef根据endpoint获取对应的endpointRef对象，stop则停止当前的RpcEndpoint，shutDown则销毁当前的这个RpcEnv。

RpcEnv的在Spark中的唯一实现类NettyRpcEnv：

NettyRpcEnv中的一些成员如下所示：

private[netty] class NettyRpcEnv(
    val conf: SparkConf,//SparkConf对象
    javaSerializerInstance: JavaSerializerInstance,
    host: String,//RpcEndpoint所在节点ip
    securityManager: SecurityManager,
    //某个RpcEndpoint进程分配的可用核数
    numUsableCores: Int) extends RpcEnv(conf) with Logging {
//消息分发器，负责此RpcEndpoint的接收消息或发生消息
private val dispatcher: Dispatcher = new Dispatcher(this, numUsableCores)
//创建TransportClientFactory和TransportServer时使用
private val transportContext = new TransportContext(transportConf,
    new NettyRpcHandler(dispatcher, this, streamManager))
//创建TransportClient的工厂对象TransportClientFactory
private val clientFactory = transportContext.createClientFactory(createClientBootstraps())
//专门用于创建该RpcEndpoint对应的TransportClient的线程池，因为创建TransportClient是一个阻塞操作，所以将其放入线程池中执行实现主线程非阻塞地创建TransportClient对象，在建立Outbox与远程RpcEndpoint连接时使用该线程池创建远程RpcEndpoint对应的TransportClient对象
private[netty] val clientConnectionExecutor = ThreadUtils.newDaemonCachedThreadPool(
    "netty-rpc-connection",conf.getInt("spark.rpc.connect.threads", 64))
//该RpcEndpoint对应的TransportServer对象，用于接收远程RpcEndpoint发送过来的消息
@volatile private var server: TransportServer = _
//标识该RpcEndpoint是否停止运行
private val stopped = new AtomicBoolean(false)
//维护一些远程RpcEndpoint及对应Outbox的映射，即本地RpcEndpoint会为远程RpcEndpoint创建一个Outbox,并维护起来，当需要往某个远程RpcEndpoint发送消息时，根据远程RpcEndpoint的RpcAddress地址拿到对应的Outbox，把消息放入该Outbox，后续通过远程RpcEndpoint的TransportClient对象发送消息即可
private val outboxes = new ConcurrentHashMap[RpcAddress, Outbox]()

NettyRpcEnv覆写了RpcEnv中的所有方法，如setupEndpoint()注册RpcEndpoint方法，此外NettyRpcEnv自己实现了一些其它的方法，如send()、postToOutbox()等方法——发送消息至指定Outbox的方法。endpointRef的ask和send会调用RpcEnv中的ask和send方法，最终调用NettyRpcEnv的postToOutbox方法将消息添加到指定远程RpcEndpoint的Outbox中。

2.2.4 RpcEnv/RpcEndpoint以及RpcEndpointRef之间的关系

RpcEnvFactory在spark中只有一个实现——NettyRpcEnvFactory；

RpcEnv在spark中也只有一个实现——NettyRpcEnv;

RpcEndpoint在spark中有多个实现，如Master/Worker/BlockManagerEndpoint等实现；

RpcEndpointRef在spark中只有一个实现——NettyRpcEndpointRef，即所有不同类型的RpcEndpoint的引用都是NettyRpcEndpointRef。

（1）对于服务端来说，RpcEnv是RpcEndpoint的运行环境，负责RpcEndpoint整个生命周期的管理，它可以注册RpcEndpoint，解析TCP层的数据包并反序列化，封装成RpcMessage，并且路由请求到指定的RpcEndpoint，调用业务逻辑代码，如果RpcEndpoint需要响应，则把返回的对象序列化后通过TCP层再传输到远程RpcEndpoint，如果RpcEndpoint发生异常，那么调用RpcCallContext.sendFailure把异常发送回去。

（2）对于客户端来说，通过本地RpcEndpoint的RpcEnv可以获取远程RpcEndpoint的RpcEndpointRef对象——封装在Outbox中，拿到RpcEndpointRef后，就可以调用相应的发送消息的方法将消息发往远程端点。

RpcEnv的创建由RpcEnvFactory负责，RpcEnvFactory在spark中目前只有一个子类——NettyRpcEnvFactory，NettyRpcEnvFactory.create()方法一旦调用（创建NettyRpcEnv）就同时会在相应的address和port上实例化并启动一个TransportServer用于接收其它远程RpcEndpoint发送过来的消息，即实例化某个RpcEndpoint的NettyRpcEnv对象时就同时实例化了该RpcEndpoint对应的TransportServer对象，并随之启动接收其它远程RpcEndpoint发送过来的消息。

NettyRpcEnv由NettyRpcEnvFactory.create()创建，这是整个Spark core和org.apache.spark.spark-network-common 的桥梁。其中核心方法setupEndpoint会在Dispatcher中注册Endpoint，而setupEndpointRef获取endpoint引用前会先去调用RpcEndpointVerifier这个终端点验证本地或者远程是否存在某个endpoint，若存在对应的endpoint才会获取相应RpcEndpoint的RpcEndpointRef引用对象。

2.2.5 Dispatcher消息分发器

Dispacher消息分发器对象在RpcEndpoint对应的NettyRpcEnv对象实例化时被初始化，其依附于NettyRpcEnv。Dispacher主要负责对应RpcEndpoint的发送和接收消息的流程。

2.2.5.1 Dispatcher中的重要成员

//nettyEnv：依赖的NettyRpcEnv对象，numUsableCores：对应RpcEndpoint进程分配的可用核数
private[netty] class Dispatcher(nettyEnv: NettyRpcEnv, numUsableCores: Int) extends Logging {
//内部类EndpointData,包含name/RpcEndpoint/RpcEndpointRef/Inbox，每个RpcEndpoint只有一个Inbox，用于存放InboxMessage，表示本地发送到本地的消息以及远程端点发往本地的消息，RpcEndpoint接收到的消息都抽象为EndpointData对象，放入消息队列中
private class EndpointData(
    val name: String,
    val endpoint: RpcEndpoint,
    val ref: NettyRpcEndpointRef) {
  val inbox = new Inbox(ref, endpoint)
}
//维护本地RpcEndpoint的name -> EndpointData的映射，name是相应RpcEndpoint的名字，后续会先从此映射中获取本地RpcEndpoint对应的EndpointData对象，若没有则实例化一个新的EndPointData对象
private val endpoints: ConcurrentMap[String, EndpointData] =
    new ConcurrentHashMap[String, EndpointData]
//维护本地的RpcEndpoint与RpcEndpointRef之间的映射，里面还有一个RpcEndpointVerfier这个类型endpoint，每个RpcEndpoint都对应着一个RpcEndpointVerfier类型的endpoint，用于验证RpcEndpoint是否已经成功注册，RpcEndpoint与对应的RpcEndpointVerfier这两个endpoint的地址是一样的
private val endpointRefs: ConcurrentMap[RpcEndpoint, RpcEndpointRef] =
    new ConcurrentHashMap[RpcEndpoint, RpcEndpointRef]
//阻塞队列，维护EndpointData集合，一个EndpointData对应一个发往本地RpcEndpoint的消息，内部封装了本地的Inbox，每次发消息到本地时，都会获取一个EndpointData对象（要么从endpoints中获取，要么新实例化一个），并将其添加到receivers队列中等待消费
private val receivers = new LinkedBlockingQueue[EndpointData]
//毒药消息，只有在Dispatcher调用stop()时，才会往receivers阻塞队列中添加这个毒药消息，此时对应的MessageLoop线程就停止了，该RpcEndpoint也就挂掉了，RpcEndpoint中的某个消息消费线程从receivers队列中接收到此毒药消息后，会立马停止线程，然后重新把该毒药消息放到receivers阻塞队列中，所以最终该RpcEndpoint所有的消息消费线程都会停止
private val PoisonPill = new EndpointData(null, null, null)

2.2.5.2 Dispatcher中的消息分发原理

Dispatcher中维护了一个线程池threadpool（执行MessageLoop线程），线程池中的线程会执行MessageLoop线程对象，然后这个线程对象内的逻辑就是一直在轮询receivers阻塞队列，处理其中的消息。

//维护的线程池对象，用于轮询receivers链表的消息，也就是当RpcEnv中实例化Dispatcher对象时，这个Dispatcher内部就起了numThreads个MessageLoop线程在轮询receivers阻塞队列，并行处理该RpcEndpoint收到的消息
private val threadpool: ThreadPoolExecutor = {
  // 获取该RpcEndpoint分配的核数
  val availableCores =
    if (numUsableCores > 0) numUsableCores else Runtime.getRuntime.availableProcessors()
  // 线程池中的线程数目，即该RpcEndpoint中并行处理消息的线程数
  val numThreads = nettyEnv.conf.getInt("spark.rpc.netty.dispatcher.numThreads",
    math.max(2, availableCores))
  // 创建定长的守护线程池
  val pool = ThreadUtils.newDaemonFixedThreadPool(numThreads, "dispatcher-event-loop")
  for (i <- 0 until numThreads) {
    // 线程池中起了numThreads个线程，分别执行MessageLoop的run()，从receivers阻塞队列中拉取消息进行消费
    pool.execute(new MessageLoop)
  }
  pool
}

MessageLoop线程对象：

//MessageLoop线程对象，其中的run()方法就是在不断地轮询receivers阻塞队列获取EndpointData对象，其中封装了本地RpcEndpoint的Inbox，真正的消息在Inbox中
private class MessageLoop extends Runnable {
  override def run(): Unit = {
    try {
      // 一直在循环，除非拿到毒药消息才会停止该线程
      while (true) {
        try {
          //若receivers阻塞队列中没有消息，则所有的MessageLoop线程阻塞于此
          val data = receivers.take()
          //若拿到的消息是个毒药消息，则重新将这个毒药消息放到receivers阻塞队列中,然后这个MessageLoop线程就停止消费消息了，最后线程池中所有的MessageLoop线程都会接收到此毒药消息进而停止消费消息
          if (data == PoisonPill) {
            //重新将毒药消息放到receivers阻塞队列中
            receivers.offer(PoisonPill)
            //拿到毒药消息，该线程直接退出
            return
          }
          //调用获取到的EndpointData对象中的inbox的process方法处理Inbox中的消息
          data.inbox.process(Dispatcher.this)
        } catch {
          case NonFatal(e) => logError(e.getMessage, e)
        }
      }
    } catch {
      ......
    }
  }
}

在实例化Dispatcher对象时会创建一个线程池，线程池数量为spark.rpc.netty.dispatcher.numThreads设置的值，若没有设置则使用默认值math.max(2, Runtime.getRuntime.availableProcessors())。该线程池会启动一些MessageLoop线程，这些MessageLoop线程一直在轮询Dispacher中的receivers阻塞队列，从中取出EndpointData对象进行处理，如果receivers中没有消息，则所有线程就会阻塞。有EndpointData就从该EndpointData的Inbox中取出消息进行消费，至于Inbox内部是如何消费消息的，后面再分析，若拿到的消息是PoisonPill毒药消息，则此MessageLoop线程停止，最后该Dispatcher所有的MessageLoop线程均会停止，导致整个Dispatcher停止。

2.2.5.3 Dispatcher中的其它方法

Dispatcher类中有一系列的postMessage()方法，如postLocalMessage、postOneWayMessage、postRemoteMessage等方法，这些方法均是往receivers阻塞队列中添加EndpointData对象，这些方法将本地发往本地的消息以及从远程RpcEndpoint接收到的消息都添加到receivers阻塞队列中，然后由上述启动的那些MessageLoop线程来消费这些消息。

Dispatcher类中还有一个registerRpcEndpoint()方法，即在Dispatcher消息分发器中注册并启动本地的RpcEndpoint对象，启动/注册endpoint时都会调用registerRpcEndpoint()方法，该方法会往本地RpcEndpoint的Inbox中添加一条OnStart消息，即发送一条OnStart消息给自己，启动相应的RpcEndpoint。

2.2.6 Inbox收件箱

Inbox中的消息对象都是InboxMessage对象，具体使用时是其子类：OneWayMessage、RpcMessage等

2.2.6.1 Inbox类的重要成员

首先Inbox的构造会接收一个RpcEndpoint和RpcEndpointRef对象，标识该Inbox属于该RpcEndpoint：

private[netty] class Inbox(
    val endpointRef: NettyRpcEndpointRef,
    val endpoint: RpcEndpoint)
  extends Logging

//Inbox中存放消息的链表，消息的抽象是InboxMessage，其包含很多子类如OnStart、OnStop消息等
@GuardedBy("this")
protected val messages = new java.util.LinkedList[InboxMessage]()
//是否允许多个线程同时消费Inbox中的消息，默认为false
@GuardedBy("this")
private var enableConcurrent = false
//同时消费消息的线程数
@GuardedBy("this")
private var numActiveThreads = 0

// 在实例化Inbox对象时，会先将OnStart消息放入messages链表，即OnStart消息是所有RpcEndpoint消费的第一个消息，在注册/启动RpcEndpoint时就会实例化一个EndpointData，其内部会实例化Inbox对象，在实例化Inbox对象时，会添加一条OnStart消息至Inbox的messages消息链表中，然后MessageLoop线程处理该消息时会调用该RpcEndpoint的start()方法启动本地的RpcEndpoint
inbox.synchronized {
  messages.add(OnStart)
}

2.2.6.2 Inbox类的重要方法

主要是process()和post()方法，process()方法用于处理Inbox中的messages链表中的消息，根据不同的消息类型有不同的消息处理方法，后续再来看这个process方法。还有一个post()方法，该方法主要是将消息加入到messages链表中，然后等待process方法来处理消息。

2.2.6.3 Inbox的消息源

Dispatcher中的MessageLoop线程轮询receivers阻塞队列，消费各个EndpointData中的Inbox中的消息，这些消息的来源有以下几个：

（1）registerRpcEndpoint：向RpcEnv中的Dispacher注册RpcEndpoint

该方法会向RpcEnv（某个RpcEndpoint运行环境）中的Dispatcher注册该RpcEndpoint，即将该RpcEndpoint添加到Dispatcher的相关集合中，注册Endpoint时会实例化一个对应的EndpointData对象，而每次实例化EndpointData时都会创建一个与之对应的Inbox，在Inbox中会将OnStart消息加入其messages链表，最后将EndpointData放入receivers阻塞队列，此时MessageLoop线程就会消费该消息，每个RpcEndpoint对应一个EndpointData对象，并维护起来在endpoints集合中，key为endpoint的名字，value为对应的EndpointData对象，当调用registerRpcEndpoint方法时，会先实例化该endpoint对应的EndpointData对象（内部会实例化一个Inbox对象，同时往Inbox中添加一条OnStart消息），后续发送消息时，会根据endpoint名字从endpoints集合中找到对应的EndpointData对象，然后往其中的Inbox中添加其他消息，所以一个endpoint对应一个EndpointData对象，也对应一个Inbox对象。

//name:RpcEndpoint的名字；endpoint：待注册的RpcEndpoint
def registerRpcEndpoint(name: String, endpoint: RpcEndpoint): NettyRpcEndpointRef = {
  //实例化RpcEndpoint的地址，包括ip、port和name
  val addr = RpcEndpointAddress(nettyEnv.address, name)
  //实例化RpcEndpoint对应的Ref引用对象
  val endpointRef = new NettyRpcEndpointRef(nettyEnv.conf, addr, nettyEnv)
  synchronized {
    if (stopped) {
      throw new IllegalStateException("RpcEnv has been stopped")
    }
    //实例化该RpcEndpoint对应的EndpointData对象，添加至Dispacher维护的endpoints映射中
    if (endpoints.putIfAbsent(name, new EndpointData(name, endpoint, endpointRef)) != null){
      throw new IllegalArgumentException(s"There is already an RpcEndpoint called $name")
    }
    //根据RpcEndpoint名获取对应的EndpointData对象，所以RpcEndpoint的名字需要是全局唯一的
    val data = endpoints.get(name)
    //将该RpcEndpoint与其对应的ref添加至endpointRefs映射
    endpointRefs.put(data.endpoint, data.ref)
    //将此EndPointData对象添加到receivers阻塞队列，该EndpointData中的Inbox中的messages消息链表中已有OnStart消息
    receivers.offer(data)  
  }
  endpointRef
}

经过上述的流程，RpcEndpoint就已经向其RpcEnv中的Dispacher注册成功了。

（2）unregisterRpcEndpoint：将某个RpcEndpoint从其依赖的RpcEnv中的Dispatcher中移除

private def unregisterRpcEndpoint(name: String): Unit = {
  val data = endpoints.remove(name)//先从endpoints集合移除相应RpcEndpoint的EndpointData对象
  if (data != null) {
    //这里调用Inbox的stop()方法往Inbox的messages链表中添加OnStop消息停止该RpcEndpoint
    data.inbox.stop()
    //最后将添加了OnStop消息的EndpointData添加到receivers阻塞队列中，这是对应RpcEndpoint的最后一个消息，此时endpoints中已经没有该RpcEndpoint的EndpointData对象了
    receivers.offer(data)
  }
  //在OnStop的消息处理过程中清空endpointRefs映射，若在此处清空，则可能其他地方还用到了该RpcEndpoint的ref引用，还要往该RpcEndpoint发送消息，这样就会报错，而OnStop消息一定是RpcEndpoint处理的最后一个消息，所以在处理OnStop消息时清空endpointRefs映射
}

（3）postMessage：将RpcEndpoint接收到的消息添加到Inbox中

Dispatcher类中提供了很多将接收到的消息添加至RpcEndpoint对应的Inbox的方法，如postRpcMessage、postRemoteMessage等，但底层都是调用postMessage方法，不管是本地发往本地的消息，还是从远程RpcEndpoint接收到的消息都需要先调用postMessage将接收到的消息添加到Inbox中，然后才能进行消费：

private def postMessage(
    endpointName: String,//本地RpcEndpoint名
    message: InboxMessage,//接收到的消息
    callbackIfStopped: (Exception) => Unit): Unit = {
  val error = synchronized {
    //先从endpoints集合中根据RpcEndpoint名获取对应的EndpointData对象，内部维护了该RpcEndpoint的Inbox对象。endpoints集合维护了endpoint的名字与对应EndpointData的映射。所以这里是先找到对应endpoint的EndpointData对象，然后往该EndpointData的Inbox中添加其他消息
    //endpoints映射中还有另外一个RpcEndpoint，专门用于验证真正的RpcEndpoint是否注册成功，两个RpcEndpoint的地址相同
    val data = endpoints.get(endpointName)
    if (stopped) {
      Some(new RpcEnvStoppedException())
    } else if (data == null) {
      Some(new SparkException(s"Could not find $endpointName."))
    } else {
      //调用Inbox的post方法往EndpointData的Inbox中添加消息
      data.inbox.post(message)
      //将添加消息后的EndpointData对象添加到receivers阻塞队列中等待消费消息，还是同一个EndpointData对象，只是往其中的Inbox中添加了消息
      receivers.offer(data)
      None
    }
  }
  error.foreach(callbackIfStopped)
}

根据上面的代码，处理接收到的消息的逻辑如下：

Step1：根据消息发往的RpcEndpoint的名字（这里即是本地RpcEndpoint名字）从endpoints集合获取相应的EndpointData对象，每个EndpointData对应一个RpcEndpoint端点；

Step2：从获得的EndpointData对象中拿到指定RpcEndpoint的Inbox对象；

Step3：往拿到的Inbox对象内的messages消息链表中添加要发送的消息；

Step4：将添加消息后的EndpointData对象添加到receivers阻塞队列中。

后续再通过MessageLoop轮询receivers阻塞队列中的EndpointData对象，然后调用Inbox的process方法处理Inbox的message链表中的消息。

（4）stop：停止Dispatcher

Dispatcher类中有一个stop()方法，当调用了此方法后，表示这个Dispatcher对象就停止了，这个方法会调用unregisterRpcEndpoint方法，将RpcEndpoint从Dispacher中移除并停止RpcEndpoint，RpcEndpoint停止后会向Dispacher的receivers阻塞队列中投递PoisonPill毒药（其实也是一个EndpointData对象，只是内部成员全都是null），毒药消息会使Dispatcher维护的线程池中的MessageLoop线程全部停止运行（这段逻辑可回到MessageLoop查看，MessageLoop线程一旦拿到毒药消息，会将毒药消息放回receivers阻塞队列，最后此MessageLoop线程停止），直至最后所有的线程都停止了，关闭线程池。

//调用Dispatcher的stop方法停止Dispatcher
def stop(): Unit = {
  synchronized {
    if (stopped) {
      return
    }
    stopped = true
  }
  //对每个RpcEndpoint对应的EndpointData对象调用unregisterRpcEndpoint方法停止所有的endpoint，实际是往所有的RpcEndpoint发送了一个OnStop消息，某个RpcEndpoint对应的Dispacher中的endpoints映射中只有两个RpcEndpoint，一个是真正的RpcEndpoint，还有一个是用于验证之前那个RpcEndpoint是否注册成功的RpcEndpoint
  endpoints.keySet().asScala.foreach(unregisterRpcEndpoint)
  // 往receivers阻塞队列中添加一个毒药消息，用于停止Dispatcher中的线程池中的所有MessageLoop线程
  receivers.offer(PoisonPill)
  //最后关闭线程池
  threadpool.shutdown()
}

2.2.7 Dispatcher和Inbox的请求流程

2.2.8 Outbox

某个RpcEndpoint对应的NettyRpcEnv中有一个outboxes字段，其维护了远端RpcAddress -> Outbox的映射，即每个远程RpcEndpoint对应一个Outbox。当本地RpcEndpoint需要向另外一个远程RpcEndpoint发送消息时，会调用NettyRpcEnv的postToOutbox方法将消息添加到远程RpcEndpoint的Outbox中，由Outbox自行通过TransportClient发送消息至远程RpcEndpoint上，其中TransportClient也是对于某个远程RpcEndpoint的，远程RpcEndpoint的TransportServer接收到消息后，就会调用Dispacher的postMessage方法将接收到的消息添加到Inbox中进行消费。

2.2.8.1 Outbox类中的重要成员

//nettyEnv：本地RpcEndpoint运行的RpcEnv环境
//address：对应这个Outbox远程端点的地址，即消息接收者远程RpcEndpoint的地址
private[netty] class Outbox(nettyEnv: NettyRpcEnv, val address: RpcAddress) {
//存放发送到此Outbox对应远程RpcEndpoint的消息的消息链表
@GuardedBy("this")
private val messages = new java.util.LinkedList[OutboxMessage]
//Outbox中发送消息到远程RpcEndpoint需要的TransportClient对象
@GuardedBy("this")
private var client: TransportClient = null
//connectFuture表示该Outbox与对应远程RpcEndpoint是否正在连接，即是否正在创建远程RpcEndpoint的TransportClient对象
@GuardedBy("this")
private var connectFuture: java.util.concurrent.Future[Unit] = null
//表示该Outbox是否停止
@GuardedBy("this")
private var stopped = false
//表示是否有线程在清空该Outbox的messages消息链表内的所有消息，即是否有线程正在发送outbox中的消息，因为Outbox中的消息都是一次性发送到远端的，不能同时有多个线程发送消息
@GuardedBy("this")
private var draining = false
}

2.2.8.2 Outbox类中的方法

（1）send：发送消息到远程端点

//发送消息至远程RpcEndpoint，每次调用Outbox的send发送消息时内部都会将Outbox中当前所有的消息都发送到远程RpcEndpoint上
def send(message: OutboxMessage): Unit = {
  val dropped = synchronized {
    if (stopped) {
      true
    } else {
      messages.add(message)//先将要发送的消息添加到messages消息链表中
      false
    }
  }
  if (dropped) {
    message.onFailure(new SparkException("Message is dropped because Outbox is stopped"))
  } else {
    //将messages链表中的所有消息发送到远程RpcEndpoint，每次调用drainOutbox()时都会将messages链表中当前的所有消息发送给对应的远程RpcEndpoint，反过来即每次调用Outbox的send()方法时就会将消息链表中的所有消息发送给远程RpcEndpoint
    drainOutbox()
  }
}

（2）drainOutbox()：清空消息链表，即将消息链表中的所有消息都发送给远程RpcEndpoint

该方法主要是清空Oubox中的消息，若当前已经有其它线程在清空消息链表了，则该清空线程就退出。若当前Outbox没有建立与远程RpcEndpoint的连接，即Outbox的TransportClient成员为null，则该Outbox先与远程RpcEndpoint建立连接（即先根据消息接收者的地址，实例化一个TransportClient对象），然后再发送消息。

if (client == null) {
  // launchConnectTask方法中在创建了与远程RpcEndpoint的连接后，会立即调用drainOutbox()方法发送消息到远程RpcEndpoint，且创建连接是在子线程中做的，所以主线程在这里就return了，即在子线程中发送消息至远程RpcEndpoint
  launchConnectTask()
  return
}
// 如果本地端点已经拥有远程消息接收者的TransportClient对象（即之前已经发送过消息给这个远程RpcEndpoint，Outbox会维护对应远程RpcEndpoint的TransportClient对象），则直接从Outbox的messages消息链表中拉取一条消息发送到远程端点
message = messages.poll()//从消息链表中拉取一条消息
if (message == null) {
    return
}

//这是一个死循环，只有当该Outbox停止或messages消息链表中的消息全部都发送给远程RpcEndpoint时才会退出
while (true) {
  try {
    val _client = synchronized { client }
    if (_client != null) {
      message.sendWith(_client)//调用OutboxMessage的sendWith()方法发送消息至远程RpcEndpoint，实际发送逻辑就是Netty里面发送消息的那套
    } else {
      assert(stopped == true)
    }
  } catch {
    case NonFatal(e) =>
      handleNetworkFailure(e)
      return
  }
  synchronized {
    if (stopped) {
      return
    }
    //发送完一条消息后，会再从messages消息链表中获取后面的消息，然后再次发送出去，直至messages链表中没有剩余消息才退出
    message = messages.poll()
    if (message == null) {
      draining = false
      return
    }
  }
}

（3）launchConnectTask()：创建Outbox与对应远程RpcEndpoint之间的连接，只需建立一次连接即可，建立成功后该Outbox就会将该TransportClient维护起来，若在发送消息时，该Outbox还未与远程RpcEndpoint创建连接，则调用该方法建立连接，返回TransportClient对象进行保存，后续该Outbox发送消息时都用这个TransportClient对象，因为一个Outbox对应远端的一个RpcEndpoint，所以连接信息是不会变的。

private def launchConnectTask(): Unit = {
  //nettyEnv中的clientConnectionExecutor是线程池，所以是在线程池中非阻塞地创建与远程RpcEndpoint的连接，创建TransportClient成功后，也是在线程池中的子线程中发送消息的，所以主线程——Outbox.send()可以直接返回
  connectFuture = nettyEnv.clientConnectionExecutor.submit(new Callable[Unit] {
    override def call(): Unit = {
      try {
        //通过TransportClientFactory创建与远程RpcEndpoint的TransportClient连接，address是消息接收者的地址
        val _client = nettyEnv.createClient(address)
        outbox.synchronized {
          client = _client//保存创建成功的TransportClient对象，方便后续使用
          if (stopped) {
            closeClient()
          }
        }
      } catch {
        ......
      }
      outbox.synchronized { connectFuture = null }
      // 创建完连接后，由于当前messages消息链表中可能有未发送的消息，所以这里需要调用drainOutbox()方法将messages链表中的消息发送到远程端点，否则需要等到下一条消息过来才能将之前的消息一同发送过去
      drainOutbox()
    }
  })
}

（4）stop()：停止Outbox

def stop(): Unit = {
  synchronized {
    if (stopped) {
      return
    }
    stopped = true
    if (connectFuture != null) {
      connectFuture.cancel(true)
    }
    //关闭TransportClient
    closeClient()
  }
  //将messages消息链表中剩余未发送的消息标记failure返回
  var message = messages.poll()
  while (message != null) {
    message.onFailure(new SparkException("Message is dropped because Outbox is stopped"))
    message = messages.poll()
  }
}

2.2.8.3 本地RpcEndpoint向远程RpcEndpoint发送消息

调用的是NettyRpcEnv的postToOutbox()方法发送消息至远程RpcEndpoint。

//receiver：远程消息接收者的ref引用
private def postToOutbox(receiver: NettyRpcEndpointRef, message: OutboxMessage): Unit = {
  if (receiver.client != null) {
    //若NettyRpcEndpointRef对象中的TransportClient已经实例化了，则直接调用message的sendWith方法发送消息至远程端点即可
    message.sendWith(receiver.client)
  } else {
    require(receiver.address != null,
      "Cannot send message to client endpoint with no listen address.")
    //根据要发送消息的远程RpcEndpoint地址，获取相应的Outbox
    val targetOutbox = {
      val outbox = outboxes.get(receiver.address)
      //若NettyRpcEnv的outboxes集合中还没有对应远程RpcEndpoint的Outbox，则实例化一个Outbox对象，放入NettyRpcEnv的outboxes集合中，若outboxes集合总已经有了对应的Outbox了，则直接返回这个Outbox
      if (outbox == null) {
        val newOutbox = new Outbox(this, receiver.address)
        val oldOutbox = outboxes.putIfAbsent(receiver.address, newOutbox)
        if (oldOutbox == null) {
          newOutbox
        } else {
          oldOutbox
        }
      } else {
        outbox
      }
    }
    if (stopped.get) {
      // It's possible that we put `targetOutbox` after stopping. So we need to clean it.
      outboxes.remove(receiver.address)
      targetOutbox.stop()
    } else {
      //拿到相应的Outbox后，就调用Outbox的send方法发送消息，send方法执行逻辑上面分析过，先将消息添加到messages链表中，然后发送到远程端点
      targetOutbox.send(message)
    }
  }
}

2.2.9 Outbox和TransportClient消息发送请求流程

总体流程如下所述：

Step1：发送消息时，调用消息接收者引用NettyRpcEndpointRef的send和ask方法；

Step2：ref中的send和ask底层调用的是NettyRpcEnv中的send和ask方法（具体调用的是哪个RpcEndpoint依赖的RpcEnv则需要看当前执行的是哪个RpcEndpoint的逻辑，若消息接收者的地址与当前RpcEndpoint依赖的RpcEnv地址相同，则说明是发往本地的消息，否则就是发往远程RpcEndpoint的消息）；

Step3：NettyRpcEnv中的send和ask方法中会调用postToOutbox方法实例化要发送的消息到远程RpcEndpoint对应的Outbox对象，并将该Outbox添加到本地RpcEndpoint依赖的NettyRpcEnv的outboxes集合中进行维护；

Step4：调用Outbox的send方法，将待发送的OutboxMessage添加到Outbox的messages消息链表中，然后调用Outbox的drainOutbox方法，将messages消息链表中当前的所有消息发送到指定的远程RpcEndpoint上进行处理。

2.2.10 RpcEndpoint启动时序图

启动流程分析：

Step1：不同类型的RpcEndpoint启动时，先会创建一个RpcEnvFactory（NettyRpcEnvFactory），然后通过这个RpcEnvFactory创建相应的RpcEnv（NettyRpcEnv），即RpcEndpoint运行需要的rpc环境；

Step2：在创建RpcEnv的过程中同时会实例化一个TransportServer对象用于接收其它远程RpcEndpoint发送到此RpcEndpoint上的消息；

Step3：在创建RpcEnv的过程中同时会实例化一个Dispatcher对象，表示该RpcEndpoint的消息分发器，调用NettyRpcEnv的setupEndpoint（注册本地端点）时会实例化一个对应的EndpointData对象，内部会实例化一个Inbox对象，表示本地端点的收件箱，并往Inbox的消息链表中添加OnStart消息；

Step4：将EndpointData添加到Dispatcher的receivers阻塞队列中，然后Dispatcher内部维护了一个线程池，该线程池中的线程（MessageLoop）会不断从receivers阻塞队列中拉取EndpointData对象，并获取其中的Inbox对象，最后调用Inbox的process方法处理之前添加的OnStart消息，接收到消息后具体的RpcEndpoint子类会调用其onStart方法进行启动。

2.2.11 RpcEndpoint的send和ask发送消息时序图

流程分析：

Step1：RpcEndpoint调用send/ask方法发送消息，内部调用其引用NettyRpcEndpointRef的send/ask方法，最终调用的是NettyRpcEnv中的send/ask方法；

Step2：根据要发送消息对象中封装的RpcAddress对象判断该消息是发往本地的endpoint还是远程的endpoint；

Step3：若消息发往本地的endpoint，则调用postOneWayMessage方法，底层最终调用postMessage，该方法会从Dispatcher中维护的EndpointData集合中找到对应的EndpointData对象，然后将要发送的消息添加到这个EndpointData对应Inbox的messages消息链表中，并将这个添加消息后的EndpointData对象添加到receivers阻塞队列中，由于Dispatcher中的MessageLoop线程在不断轮询receivers阻塞队列，队列中一有消息，就会被消费；

Step4：若消息发往远程RpcEndpoint，则会调用NettyRpcEnv的postToOutbox方法，先根据消息发往的远程endpoint地址找到对应的Outbox，若没有对应的Outbox则实例化一个，然后将要发送的消息添加到这个Outbox的messages消息链表中，然后会调用drainOutbox方法将当前messages链表中的消息全部发往远程RpcEndpoint。

2.2.12 RpcEndpoint receive接收消息时序图

你可能感兴趣的:(大数据,spark)

数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
提升企业级数据处理效率！TDengine 四个集群优化点详解 TDengine （老段） TDengine 运维大数据数据库物联网时序数据库服务器运维 tdengine
为了帮助企业更好地进行大数据处理，我们在此前TDengine3.x系列版本中进行了几项与集群相关的优化和新功能开发，以提升集群的稳定性和在异常情况下的恢复能力。这些优化包括clusterID隔离、leaderrebalance、raftlearner和restorednode。本文将对这几项重要优化进行详细阐述，以解答企业在此领域的疑问，并帮助大家更好地应对相关挑战。clusterID隔离问题fi
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
全面探索Kafka：架构、应用与流处理
Kafka：企业级消息系统与流处理平台的深度解析ApacheKafka作为分布式流处理平台，广泛应用于大数据处理和实时分析领域。本文将基于其官方文档，详细探讨Kafka的核心功能、应用场景以及如何进行有效管理。背景简介Kafka作为高吞吐量的消息系统，支持企业级的发布-订阅模式。它能够处理大量实时数据，并支持高并发读写操作。本文将依据Kafka官方文档的内容，逐层深入，从入门到高级应用，帮助读者全
Flink时间窗口详解 bxlj_jcj Flink flink 大数据
一、引言在大数据流处理的领域中，Flink的时间窗口是一项极为关键的技术，想象一下，你要统计一个电商网站每小时的订单数量。由于订单数据是持续不断产生的，这就形成了一个无界数据流。如果没有时间窗口的概念，你就需要处理无穷无尽的数据，难以进行有效的统计分析。而时间窗口的作用，就是将这无界的数据流按照时间维度切割成一个个有限的“数据块”，方便我们对这些数据进行处理和分析。比如，我们可以定义一个1小时的时
探索实时流处理的未来：Kafka Streams 深度指南秋或依
探索实时流处理的未来：KafkaStreams深度指南项目介绍欢迎进入KafkaStreams：实时流处理的世界！这不仅仅是一本书，更是一个通往流处理领域深层奥秘的门户。由PrashantPandey编著，这本书以ApacheKafka2.1中的KafkaStreams库为核心，为读者铺就了一条从理解基础概念到熟练掌握KafkaStreams编程的路径。无论是软件工程师、数据架构师，还是对大数据处
Elasticsearch搜索引擎存储：从原理到实践的全景解析 Python×CATIA工业智造搜索引擎 elasticsearch 大数据
引言在大数据时代，数据规模呈指数级增长，传统数据库的模糊查询、实时分析能力逐渐成为瓶颈。Elasticsearch（简称ES）凭借其分布式架构、实时搜索和灵活的数据分析能力，成为企业级搜索与存储的核心引擎。截至2025年，ES在全球日志分析、电商搜索、实时监控等场景的市场占有率超过60%。本文将从存储架构、核心技术、应用场景及优化策略四个维度，深入解析Elasticsearch的设计哲学与实践价值
【Kafka专栏 13】Kafka的消息确认机制：不是所有的“收到”都叫“确认”！
作者名称：夏之以寒作者简介：专注于Java和大数据领域，致力于探索技术的边界，分享前沿的实践和洞见文章专栏：夏之以寒-kafka专栏专栏介绍：本专栏旨在以浅显易懂的方式介绍Kafka的基本概念、核心组件和使用场景，一步步构建起消息队列和流处理的知识体系，无论是对分布式系统感兴趣，还是准备在大数据领域迈出第一步，本专栏都提供所需的一切资源、指导，以及相关面试题，立刻免费订阅，开启Kafka学习之旅！
C语言学生成绩管理系统<；自创>；(功能7有小错误,但可运行） han_xue_feng java
腾讯云加速企业和个人开发创新公开直播预告直播预告：07/18(周四)15:00-16:00随着人工智能与大模型的蓬勃发展，我们正步入一个由技微信实习第一天周五入职，早上早早来到了公司，发现好多人都没上班，到十点才陆陆续续有人来，办理完入职后，mentor中联夏令营遗憾没有入选不过hr的回复真的很好，辛苦啦#提前批简历挂麻了怎么办##机械制造投递记录#大数据开发的工作有点过于简单了吧sq大数据开发的
Python爬虫：从图片或扫描文档中提取文字数据的完整指南 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言数据挖掘 c++
1.引言随着大数据技术的不断进步，图像数据逐渐成为了许多行业中重要的数据源之一。图像中不仅包含了丰富的视觉信息，还可能蕴含着大量的文字数据。对于科研、企业、政府等多个领域而言，如何从图片或扫描文档中提取出有价值的文字信息是一个亟待解决的问题。在这一过程中，OCR（OpticalCharacterRecognition，光学字符识别）技术成为了解决这一问题的重要工具。在本文中，我们将探讨如何使用Py
【C语言经典面试题】memcpy函数有没有更高效的拷贝实现方法？架构师李肯嵌入式物联网开发进阶 c语言面试性能优化
【C语言经典面试题】memcpy函数有没有更高效的拷贝实现方法？我相信大部分初中级C程序员在面试的过程中，可能都被问过关于memcpy函数的问题，甚至需要手撕memcpy。本文从另一个角度带你领悟一下memcpy的面试题，你可以看看是否能接得住？文章目录1写在前面2源码实现2.1函数申明2.2简单的功能实现2.3满足大数据量拷贝的功能实现3源码测试4小小总结5更多分享1写在前面假如你遇到下面的面试
python基于Hadoop的NBA球员大数据分析与可视化系统
目录技术栈介绍具体实现截图系统设计研究方法：设计步骤设计流程核心代码部分展示研究方法详细视频演示试验方案论文大纲源码获取/详细视频演示技术栈介绍Django-SpringBoot-php-Node.js-flask本课题的研究方法和研究步骤基本合理，难度适中，本选题是学生所学专业知识的延续，符合学生专业发展方向，对于提高学生的基本知识和技能以及钻研能力有益。该学生能够在预定时间内完成该课题的设计。
大数据技术之集群数据迁移
dfs.namenode.rpc-address.nameservice1.namenode30hadoop104:8020dfs.namenode.rpc-address.nameservice1.namenode37hadoop106:8020dfs.namenode.http-address.nameservice1.namenode30hadoop104:9870dfs.namenode.
如何通过YashanDB优化企业大数据处理流程数据库
在当今数据驱动的商业环境中，企业面临着巨大的数据处理挑战。性能瓶颈、数据一致性问题和可扩展性需求使得大数据处理成为一项复杂任务。作为一种新兴的数据库管理系统，YashanDB以其独特的架构设计和强大的数据处理能力，在解决这些挑战方面提供了有效的手段。本文旨在探讨如何利用YashanDB优化大数据处理流程，为企业提供高效、可靠的解决方案。YashanDB的体系架构与部署形态YashanDB支持多种部
Pandas 学习教程 _pass_ Data-Alaysis pandas 信息可视化
目录定义基本操作一维数组操作二维数组操作数据选择过滤数据处理数据清洗数据转换数据分析排序分组聚合数据透视表高级操作合并数据时间序列处理自定义函数调用数据可视化集成数据导出和导入大数据分块处理定义全称：'paneldata'and'pythondataanalysis'Analy:Series(一维数据)、DataFrame(二维数据)主要应用：数据清洗：处理缺失数据、重复数据等数据转换：改变数据的
如何通过YashanDB提升客户体验数据库
如何优化查询速度？这是许多企业在使用数据库技术时常常会遇到的问题。查询速度的快慢直接影响到用户的体验，尤其是在大数据量和高并发的使用场景中。顾客期望迅速获取信息，若响应时间过长，可能导致客户流失。因此，优化数据库的性能成为提升客户体验的关键举措之一。YashanDB作为一种高性能的数据库技术架构，提供了多种优化机制，以提升系统的查询速度和整体处理能力。多种部署架构YashanDB支持多种部署架构，
如何通过YashanDB数据库实现企业级数据分区管理？数据库
在当今大数据时代，企业面临着海量数据的管理和优化访问的问题。如何有效地组织和划分庞大的数据集，以提升查询性能和运维效率，成为数据库系统设计的核心挑战。数据分区技术作为解决大规模数据处理的关键手段，能够显著减少无关数据的访问，优化资源利用率。本文聚焦于YashanDB数据库，详细解析其数据分区管理的实现机制及应用，为企业级应用提供高效、灵活的数据分区解决方案。YashanDB中的数据分区基础Yash
国产开源高性能对象存储RustFS保姆级上手指南光爷不秃对象存储 rust 国产开源软件 rust 云计算开源软件 github 开源数据仓库 database
在云计算与大数据爆发的时代，企业和开发者对存储方案的要求愈发严苛——不仅要能扛住海量数据的读写压力，还得兼顾安全性、可扩展性和兼容性。今天给大家介绍一款基于Rust语言开发的开源分布式对象存储系统——RustFS，它不仅是MinIO的国产化优秀替代方案，更是AI、大数据和云原生场景的理想之选。本文将从基础介绍到实战操作，带大家快速上手这款"优雅的存储解决方案"。一、RustFS核心特性解析Rust
通过YashanDB提升大数据处理能力的指南数据库
数据的急剧增长给数据库技术领域带来了诸多挑战，包括性能瓶颈、数据一致性问题及处理效率低下等。为了应对这些挑战，企业需采取有效的技术手段来提升大数据处理能力。YashanDB作为一款高性能的数据库产品，通过其先进的体系架构、优化的数据存储形式以及强大的并发控制能力，有效地提升了大数据环境下的处理性能。本文旨在为技术人员和决策者提供深入的技术分析和可操作的建议，通过YashanDB的功能特性来实现大数
Java多线程实战指南：从基础到高并发的核心技术解析添砖Java中 java python 开发语言 spring boot spring cloud spring
一、为什么必须掌握多线程？在单核CPU时代，多线程主要用于提高程序响应速度；在如今的多核处理器时代，多线程已成为榨干硬件性能的必备技能。无论是高并发Web服务器、实时数据处理系统，还是游戏引擎，都离不开多线程技术的支撑。典型案例：电商秒杀系统：1秒内处理10万+请求大数据处理：并行计算TB级数据金融交易系统：毫秒级订单撮合二、线程创建的四大核心方式1.继承Thread类（不推荐）classMyTh
安全运维的 “五层防护”：构建全方位安全体系 KKKlucifer 安全运维
在数字化运维场景中，异构系统复杂、攻击手段隐蔽等挑战日益突出。保旺达基于“全域纳管-身份认证-行为监测-自动响应-审计溯源”的五层防护架构，融合AI、零信任等技术，构建全链路安全运维体系，以下从技术逻辑与实践落地展开解析：第一层：全域资产纳管——筑牢安全根基挑战云网基础设施包含分布式计算（Hadoop/Spark）、数据流处理（Storm/Flink）等异构组件，通信协议繁杂，传统方案难以全面纳管
3D 可视化技术开启污水治理全新发展阶段广州华锐视点 3d
3D可视化大屏展示技术在污水厂的应用，已然开启了污水处理的全新篇章。它不仅为污水厂解决了当下管理和展示的难题，更如同一座灯塔，照亮了未来污水处理领域的发展道路。随着科技的持续进步，3D可视化大屏展示技术必将迎来更加辉煌的发展。一方面，其与人工智能、大数据、物联网等前沿技术的融合将愈发紧密。借助人工智能算法，大屏系统将具备更强大的自主学习和分析能力，能够根据实时数据和历史经验，自动优化污水处理工艺参
UI前端大数据可视化实战策略：如何设计交互式数据探索界面？ UI前端开发工作室 ui 前端信息可视化
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“被动观看”到“主动探索”的可视化革命传统大数据可视化常陷入“图表堆砌”的困境：企业dashboard上布满折线图、饼图，却难以回答“销售额下降的核心区域是哪里”“用户流失与哪个行为强相关”等深度问题。
【HTML网页】智能健康监测——全方位健康管理专家（包含网页源代码）
智能健康监测分析系统智能健康监测分析系统是一种基于物联网、大数据、人工智能等技术的综合性健康管理解决方案。它具有以下六大核心功能：实时监测系统通过智能传感器和可穿戴设备，实时采集用户的生理数据，例如心率、血压、血氧饱和度、血糖水平和睡眠质量等，确保用户随时掌握自己的身体状况。健康数据分析利用人工智能和大数据分析技术，系统对采集到的数据进行处理和分析，提取有价值的健康信息，如心率变异性、呼吸频率等，
Elasticsearch 高可用实战：架构设计与场景化解决方案辣呼呼的哈哈 Elasticsearch 入门到精通 elasticsearch wpf 大数据全文检索搜索引擎 restful java
Elasticsearch高可用实战：架构设计与场景化解决方案本文深入探讨Elasticsearch在高并发、大数据量场景下的高可用架构设计，结合电商搜索、日志分析等真实案例，提供可落地的技术方案与Java实现。一、高可用架构设计原则1.分布式架构核心要素客户端负载均衡层协调节点数据节点-分片1数据节点-分片2数据节点-分片3副本分片副本分片副本分片2.高可用黄金法则冗余设计：至少3节点集群+1副
oracle 数据库迁移expdp，impdp（数据泵导出导入）方法小张是铁粉 oracle 数据库
一.优缺点优点：1.高效性能：expdp，impdp使用并行技术，可以显著提高导出导入速度，尤其适用于大数据量的迁移。支持压缩和加密，减少导出文件的大小并提高安全性。2.灵活的对象选择：可以导出整个数据库、特定表空间、用户（Schema）或单个表。支持过滤条件，例如只导出特定表的数据或元数据。3.跨平台兼容性：支持跨平台迁移（例如从Linux到Windows），但需要注意字节序（endiannes
用Python的Chartify库，商业数据可视化效率提升13倍！忆愿 Python编程的脉动之声 python opencv 人工智能计算机视觉深度学习神经网络机器学习
文章目录为啥要用Chartify？安装那些事儿从零开始画图基础柱状图进阶折线图散点图与气泡图专业数据分析必备技能多维度分析时间序列分析高级可视化技巧自定义主题交互式特性批量图表生成性能优化技巧大数据集处理内存优化实战案例：销售数据分析系统数据可视化这事儿，搞过的都知道有多费劲。用matplotlib画个图要调半天参数，才能让图表看起来稍微顺眼一点；seaborn虽然画出来的图确实好看，但是配置项太
【大数据】FP-growth算法大雨淅淅大数据算法人工智能大数据
目录一、FP-growth算法概述二、FP-growth算法代码实现2.1FP-growth算法matlab实现2.2FP-growth算法python实现三、FP-growth算法应用四、FP-growth算法发展趋势一、FP-growth算法概述FP-growth算法是一种用于发现数据集中频繁项集的高效算法。它由JiaweiHan等人提出，旨在解决Apriori算法在大数据集上效率低下的问题。
第八十九篇大数据开发中的数据算法：贪心策略 - 生活中的“精打细算”艺术
在资源有限的世界里，贪心算法教会我们：局部最优的累积，往往是通往全局最高效的捷径。本文通过3个生活化场景+原创图表，揭示大数据开发中最实用的优化策略。目录一、贪心算法核心思想：当下即最优二、三大核心应用场景详解（附原创图表）1.文件压缩优化：Huffman编码2.任务调度优化：SPT算法3.网络拓扑优化：Prim算法三、贪心算法适用性分析四、大数据工程最佳实践五、总结：贪心思维的艺术一、贪心算法核
vivo Pulsar 万亿级消息处理实践（3）-KoP指标异常修复
作者：vivo互联网大数据团队-ChenJianbo本文是《vivoPulsar万亿级消息处理实践》系列文章第3篇。Pulsar是Apache基金会的开源分布式流处理平台和消息中间件，它实现了Kafka的协议，可以让使用KafkaAPI的应用直接迁移至Pulsar，这使得Pulsar在Kafka生态系统中更加容易被接受和使用。KoP提供了从Kafka到Pulsar的无缝转换，用户可以使用Kafka
解线性方程组 qiuwanchi
package gaodai.matrix; import java.util.ArrayList; import java.util.List; import java.util.Scanner; public class Test { public static void main(String[] args) { Scanner scanner = new Sc
在mysql内部存储代码 annan211 性能 mysql 存储过程触发器
在mysql内部存储代码在mysql内部存储代码，既有优点也有缺点，而且有人倡导有人反对。先看优点： 1 她在服务器内部执行，离数据最近，另外在服务器上执行还可以节省带宽和网络延迟。 2 这是一种代码重用。可以方便的统一业务规则，保证某些行为的一致性，所以也可以提供一定的安全性。 3 可以简化代码的维护和版本更新。 4 可以帮助提升安全，比如提供更细
Android使用Asynchronous Http Client完成登录保存cookie的问题 hotsunshine android
Asynchronous Http Client是android中非常好的异步请求工具除了异步之外还有很多封装比如json的处理，cookie的处理引用 Persistent Cookie Storage with PersistentCookieStore This library also includes a PersistentCookieStore whi
java面试题 Array_06 java 面试
java面试题第一，谈谈final, finally, finalize的区别。 final-修饰符（关键字）如果一个类被声明为final，意味着它不能再派生出新的子类，不能作为父类被继承。因此一个类不能既被声明为 abstract的，又被声明为final的。将变量或方法声明为final，可以保证它们在使用中不被改变。被声明为final的变量必须在声明时给定初值，而在以后的引用中只能
网站加速 oloz 网站加速
前序:本人菜鸟，此文研究总结来源于互联网上的资料，大牛请勿喷！本人虚心学习，多指教. 1、减小网页体积的大小，尽量采用div+css模式，尽量避免复杂的页面结构，能简约就简约。 2、采用Gzip对网页进行压缩； GZIP最早由Jean-loup Gailly和Mark Adler创建，用于UNⅨ系统的文件压缩。我们在Linux中经常会用到后缀为.gz
正确书写单例模式随意而生 java 设计模式单例
　　单例模式算是设计模式中最容易理解，也是最容易手写代码的模式了吧。但是其中的坑却不少，所以也常作为面试题来考。本文主要对几种单例写法的整理，并分析其优缺点。很多都是一些老生常谈的问题，但如果你不知道如何创建一个线程安全的单例，不知道什么是双检锁，那这篇文章可能会帮助到你。　　懒汉式，线程不安全　　当被问到要实现一个单例模式时，很多人的第一反应是写出如下的代码，包括教科书上也是这样
单例模式香水浓 java
懒汉调用getInstance方法时实例化 public class Singleton { private static Singleton instance; private Singleton() {} public static synchronized Singleton getInstance() { if(null == ins
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" AdyZhang apache http server
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" 每次到这一步都很小心防它的端口冲突问题，结果，特意留出来的80端口就是不能用，烦。解决方法确保几处： 1、停止IIS启动 2、把端口80改成其它（譬如90，800，，，什么数字都好） 3、防火墙(关掉试试) 在运行处输入 cmd 回车，转到apa
如何在android 文件选择器中选择多个图片或者视频？ aijuans android
我的android app有这样的需求，在进行照片和视频上传的时候，需要一次性的从照片/视频库选择多条进行上传但是android原生态的sdk中，只能一个一个的进行选择和上传。我想知道是否有其他的android上传库可以解决这个问题，提供一个多选的功能，可以使checkbox之类的，一次选择多个处理方法官方的图片选择器(但是不支持所有版本的androi，只支持API Level
mysql中查询生日提醒的日期相关的sql baalwolf mysql
SELECT sysid,user_name,birthday,listid,userhead_50,CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')),CURDATE(), dayofyear( CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')))-dayofyear(
MongoDB索引文件破坏后导致查询错误的问题 BigBird2012 mongodb
问题描述： MongoDB在非正常情况下关闭时，可能会导致索引文件破坏，造成数据在更新时没有反映到索引上。解决方案：使用脚本，重建MongoDB所有表的索引。 var names = db.getCollectionNames(); for( var i in names ){ var name = names[i]; print(name);
Javascript Promise bijian1013 JavaScript Promise
Parse JavaScript SDK现在提供了支持大多数异步方法的兼容jquery的Promises模式，那么这意味着什么呢，读完下文你就了解了。一.认识Promises “Promises”代表着在javascript程序里下一个伟大的范式，但是理解他们为什么如此伟大不是件简
[Zookeeper学习笔记九]Zookeeper源代码分析之Zookeeper构造过程 bit1129 zookeeper
Zookeeper重载了几个构造函数，其中构造者可以提供参数最多，可定制性最多的构造函数是 public ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolea
【Java命令三】jstack bit1129 jstack
jstack是用于获得当前运行的Java程序所有的线程的运行情况(thread dump），不同于jmap用于获得memory dump [hadoop@hadoop sbin]$ jstack Usage: jstack [-l] <pid> (to connect to running process) jstack -F
jboss 5.1启停脚本　动静分离部署 ronin47
以前启动jboss，往各种xml配置文件，现只要运行一句脚本即可。start nohup sh /**/run.sh -c servicename -b ip -g clustername -u broatcast jboss.messaging.ServerPeerID=int -Djboss.service.binding.set=p
UI之如何打磨设计能力? brotherlamp UI ui教程 ui自学 ui资料 ui视频
在越来越拥挤的初创企业世界里，视觉设计的重要性往往可以与杀手级用户体验比肩。在许多情况下，尤其对于 Web 初创企业而言，这两者都是不可或缺的。前不久我们在《右脑革命：别学编程了，学艺术吧》中也曾发出过重视设计的呼吁。如何才能提高初创企业的设计能力呢?以下是 9 位创始人的体会。 1.找到自己的方式如果你是设计师，要想提高技能可以去设计博客和展示好设计的网站如D-lists或
三色旗算法 bylijinnan java 算法
import java.util.Arrays; /** 问题：假设有一条绳子，上面有红、白、蓝三种颜色的旗子，起初绳子上的旗子颜色并没有顺序，您希望将之分类，并排列为蓝、白、红的顺序，要如何移动次数才会最少，注意您只能在绳子上进行这个动作，而且一次只能调换两个旗子。网上的解法大多类似：在一条绳子上移动，在程式中也就意味只能使用一个阵列，而不使用其它的阵列来
警告:No configuration found for the specified action: \'s chiangfai configuration
1.index.jsp页面form标签未指定namespace属性。  <%@taglib prefix="s" uri="/struts-tags"%> ... <s:form action="submit" method="post"&g
redis -- hash_max_zipmap_entries设置过大有问题 chenchao051 redis hash
使用redis时为了使用hash追求更高的内存使用率，我们一般都用hash结构，并且有时候会把hash_max_zipmap_entries这个值设置的很大，很多资料也推荐设置到1000，默认设置为了512，但是这里有个坑 #define ZIPMAP_BIGLEN 254 #define ZIPMAP_END 255 /* Return th
select into outfile access deny问题 daizj mysql txt 导出数据到文件
本文转自：http://hatemysql.com/2010/06/29/select-into-outfile-access-deny%E9%97%AE%E9%A2%98/ 为应用建立了rnd的帐号，专门为他们查询线上数据库用的，当然，只有他们上了生产网络以后才能连上数据库，安全方面我们还是很注意的，呵呵。授权的语句如下： grant select on armory.* to rn
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
<?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('This example should only be run from a Web Brows
美国电影超短200句 dcj3sjt126com 电影
1. I see．我明白了。2. I quit! 我不干了!3. Let go! 放手!4. Me too．我也是。5. My god! 天哪!6. No way! 不行!7. Come on．来吧(赶快)8. Hold on．等一等。9. I agree。我同意。10. Not bad．还不错。11. Not yet．还没。12. See you．再见。13. Shut up!
Java访问远程服务 dyy_gusi httpclient webservice get post
随着webService的崛起，我们开始中会越来越多的使用到访问远程webService服务。当然对于不同的webService框架一般都有自己的client包供使用，但是如果使用webService框架自己的client包，那么必然需要在自己的代码中引入它的包，如果同时调运了多个不同框架的webService，那么就需要同时引入多个不同的clien
Maven的settings.xml配置 geeksun settings.xml
settings.xml是Maven的配置文件，下面解释一下其中的配置含义： settings.xml存在于两个地方： 1.安装的地方：$M2_HOME/conf/settings.xml 2.用户的目录：${user.home}/.m2/settings.xml 前者又被叫做全局配置，后者被称为用户配置。如果两者都存在，它们的内容将被合并，并且用户范围的settings.xml优先。
ubuntu的init与系统服务设置 hongtoushizi ubuntu
转载自： http://iysm.net/?p=178 init Init是位于/sbin/init的一个程序，它是在linux下，在系统启动过程中，初始化所有的设备驱动程序和数据结构等之后，由内核启动的一个用户级程序，并由此init程序进而完成系统的启动过程。 ubuntu与传统的linux略有不同，使用upstart完成系统的启动，但表面上仍维持init程序的形式。运行
跟我学Nginx+Lua开发目录贴 jinnianshilongnian nginx lua
使用Nginx+Lua开发近一年的时间，学习和实践了一些Nginx+Lua开发的架构，为了让更多人使用Nginx+Lua架构开发，利用春节期间总结了一份基本的学习教程，希望对大家有用。也欢迎谈探讨学习一些经验。目录第一章安装Nginx+Lua开发环境第二章 Nginx+Lua开发入门第三章 Redis/SSDB+Twemproxy安装与使用第四章 L
php位运算符注意事项 home198979 位运算 PHP &
$a = $b = $c = 0; $a & $b = 1; $b | $c = 1 问a,b,c最终为多少? 当看到这题时，我犯了一个低级错误，误以为位运算符会改变变量的值。所以得出结果是1 1 0 但是位运算符是不会改变变量的值的，例如： $a=1;$b=2; $a&$b; 这样a,b的值不会有任何改变
Linux shell数组建立和使用技巧 pda158 linux
1.数组定义　　[chengmo@centos5 ~]$ a=(1 2 3 4 5) 　　[chengmo@centos5 ~]$ echo $a 　　1 　　一对括号表示是数组，数组元素用“空格”符号分割开。　　 2.数组读取与赋值　　得到长度：　　[chengmo@centos5 ~]$ echo ${#a[@]} 　　5 　　用${#数组名[@或
hotspot源码(JDK7) ol_beta java HotSpot jvm
源码结构图，方便理解： ├─agent Serviceab
Oracle基本事务和ForAll执行批量DML练习 vipbooks oracle sql
基本事务的使用：从账户一的余额中转100到账户二的余额中去，如果账户二不存在或账户一中的余额不足100则整笔交易回滚 select * from account; -- 创建一张账户表 create table account( -- 账户ID id number(3) not null, -- 账户名称 nam