weixin_30703911

Spark Streaming性能优化: 如何在生产环境下应对流数据峰值巨变

1、为什么引入Backpressure

默认情况下，Spark Streaming通过Receiver以生产者生产数据的速率接收数据，计算过程中会出现batch processing time > batch interval的情况，其中batch processing time 为实际计算一个批次花费时间， batch interval为Streaming应用设置的批处理间隔。这意味着Spark Streaming的数据接收速率高于Spark从队列中移除数据的速率，也就是数据处理能力低，在设置间隔内不能完全处理当前接收速率接收的数据。如果这种情况持续过长的时间，会造成数据在内存中堆积，导致Receiver所在Executor内存溢出等问题（如果设置StorageLevel包含disk, 则内存存放不下的数据会溢写至disk, 加大延迟）。Spark 1.5以前版本，用户如果要限制Receiver的数据接收速率，可以通过设置静态配制参数“spark.streaming.receiver.maxRate
”的值来实现，此举虽然可以通过限制接收速率，来适配当前的处理能力，防止内存溢出，但也会引入其它问题。比如：producer数据生产高于maxRate，当前集群处理能力也高于maxRate，这就会造成资源利用率下降等问题。为了更好的协调数据接收速率与资源处理能力，Spark Streaming 从v1.5开始引入反压机制（back-pressure）,通过动态控制数据接收速率来适配集群数据处理能力。
2、Backpressure
Spark Streaming Backpressure: 根据JobScheduler反馈作业的执行信息来动态调整Receiver数据接收率。通过属性“spark.streaming.backpressure.enabled”来控制是否启用backpressure机制，默认值false，即不启用。
2.1 Streaming架构如下图所示（详见Streaming数据接收过程文档和Streaming 源码解析）

Spark Streaming性能优化: 如何在生产环境下应对流数据峰值巨变_第1张图片

2.2 BackPressure执行过程如下图所示:
　　在原架构的基础上加上一个新的组件RateController,这个组件负责监听“OnBatchCompleted”事件，然后从中抽取processingDelay 及schedulingDelay信息. Estimator依据这些信息估算出最大处理速度（rate），最后由基于Receiver的Input Stream将rate通过ReceiverTracker与ReceiverSupervisorImpl转发给BlockGenerator（继承自RateLimiter）.

Spark Streaming性能优化: 如何在生产环境下应对流数据峰值巨变_第2张图片

3、BackPressure 源码解析
3.1 RateController类体系
RatenController 继承自StreamingListener. 用于处理BatchCompleted事件。核心代码为：

**
 * A StreamingListener that receives batch completion     updates, and maintains
 * an estimate of the speed at which this stream should ingest messages,
 * given an estimate computation from a `RateEstimator`
 */
private[streaming] abstract class RateController(val streamUID: Int, rateEstimator: RateEstimator)
extends StreamingListener with Serializable {
  /**
   * Compute the new rate limit and publish it asynchronously.
   */
  private def computeAndPublish(time: Long, elems: Long, workDelay: Long, waitDelay: Long): Unit =
Future[Unit] {
  val newRate = rateEstimator.compute(time, elems, workDelay, waitDelay)
  newRate.foreach { s =>
    rateLimit.set(s.toLong)
    publish(getLatestRate())
  }
}
def getLatestRate(): Long = rateLimit.get()

override def onBatchCompleted(batchCompleted: StreamingListenerBatchCompleted) {
val elements = batchCompleted.batchInfo.streamIdToInputInfo
for {
  processingEnd <- batchCompleted.batchInfo.processingEndTime
  workDelay <- batchCompleted.batchInfo.processingDelay
  waitDelay <- batchCompleted.batchInfo.schedulingDelay
  elems <- elements.get(streamUID).map(_.numRecords)
} computeAndPublish(processingEnd, elems, workDelay, waitDelay)
}
}

3.2 RateController的注册
JobScheduler启动时会抽取在DStreamGraph中注册的所有InputDstream中的rateController，并向ListenerBus注册监听. 此部分代码如下：

def start(): Unit = synchronized {
   if (eventLoop != null) return // scheduler has already been started

   logDebug("Starting JobScheduler")
   eventLoop = new EventLoop[JobSchedulerEvent]("JobScheduler") {
   override protected def onReceive(event: JobSchedulerEvent): Unit = processEvent(event)

   override protected def onError(e: Throwable): Unit = reportError("Error in job scheduler", e)
 }
 eventLoop.start()

 // attach rate controllers of input streams to receive batch completion updates
 for {
   inputDStream <- ssc.graph.getInputStreams
   rateController <- inputDStream.rateController
 } ssc.addStreamingListener(rateController)

 listenerBus.start()
 receiverTracker = new ReceiverTracker(ssc)
 inputInfoTracker = new InputInfoTracker(ssc)
 receiverTracker.start()
 jobGenerator.start()
 logInfo("Started JobScheduler")
}

3.3 BackPressure执行过程分析
BackPressure 执行过程分为BatchCompleted事件触发时机和事件处理两个过程
3.3.1 BatchCompleted触发过程
对BatchedCompleted的分析，应该从JobGenerator入手，因为BatchedCompleted是批次处理结束的标志，也就是JobGenerator产生的作业执行完成时触发的，因此进行作业执行分析。
Streaming 应用中JobGenerator每个Batch Interval都会为应用中的每个Output Stream建立一个Job, 该批次中的所有Job组成一个Job Set.使用JobScheduler的submitJobSet进行批量Job提交。此部分代码结构如下所示

 /** Generate jobs and perform checkpoint for the given `time`.  */
private def generateJobs(time: Time) {
  // Set the SparkEnv in this thread, so that job generation code can access the environment
  // Example: BlockRDDs are created in this thread, and it needs to access BlockManager
  // Update: This is probably redundant after threadlocal stuff in SparkEnv has been removed.
  SparkEnv.set(ssc.env)

  // Checkpoint all RDDs marked for checkpointing to ensure their lineages are
  // truncated periodically. Otherwise, we may run into stack overflows (SPARK-6847).
  ssc.sparkContext.setLocalProperty(RDD.CHECKPOINT_ALL_MARKED_ANCESTORS, "true")
  Try {
    jobScheduler.receiverTracker.allocateBlocksToBatch(time) // allocate received blocks to batch
    graph.generateJobs(time) // generate jobs using allocated block
  } match {
    case Success(jobs) =>
      val streamIdToInputInfos = jobScheduler.inputInfoTracker.getInfo(time)
jobScheduler.submitJobSet(JobSet(time, jobs, streamIdToInputInfos))
    case Failure(e) =>
      jobScheduler.reportError("Error generating jobs for time " + time, e)
}
eventLoop.post(DoCheckpoint(time, clearCheckpointDataLater = false))
}

其中，sumitJobSet会创建固定数量的后台线程（具体由“spark.streaming.concurrentJobs”指定），去处理Job Set中的Job. 具体实现逻辑为：

def submitJobSet(jobSet: JobSet) {
  if (jobSet.jobs.isEmpty) {
    logInfo("No jobs added for time " + jobSet.time)
  } else {
    listenerBus.post(StreamingListenerBatchSubmitted(jobSet.toBatchInfo))
    jobSets.put(jobSet.time, jobSet)
    jobSet.jobs.foreach(job => jobExecutor.execute(new JobHandler(job)))
    logInfo("Added jobs for time " + jobSet.time)
  }
}

其中JobHandler用于执行Job及处理Job执行结果信息。当Job执行完成时会产生JobCompleted事件. JobHandler的具体逻辑如下面代码所示：

当Job执行完成时，向eventLoop发送JobCompleted事件。EventLoop事件处理器接到JobCompleted事件后将调用handleJobCompletion 来处理Job完成事件。handleJobCompletion使用Job执行信息创建StreamingListenerBatchCompleted事件并通过StreamingListenerBus向监听器发送。实现如下：

private def handleJobCompletion(job: Job, completedTime: Long) {
   val jobSet = jobSets.get(job.time)
   jobSet.handleJobCompletion(job)
   job.setEndTime(completedTime)
   listenerBus.post(StreamingListenerOutputOperationCompleted(job.toOutputOperationInfo))
   logInfo("Finished job " + job.id + " from job set of time " + jobSet.time)
   if (jobSet.hasCompleted) {
     jobSets.remove(jobSet.time)
     jobGenerator.onBatchCompletion(jobSet.time)
     logInfo("Total delay: %.3f s for time %s (execution: %.3f s)".format(
     jobSet.totalDelay / 1000.0, jobSet.time.toString,
     jobSet.processingDelay / 1000.0
   ))
 listenerBus.post(StreamingListenerBatchCompleted(jobSet.toBatchInfo))
 }
 job.result match {
   case Failure(e) =>
       reportError("Error running job " + job, e)
   case _ =>
 }
}

3.3.2、BatchCompleted事件处理过程
StreamingListenerBus将事件转交给具体的StreamingListener，因此BatchCompleted将交由RateController进行处理。RateController接到BatchCompleted事件后将调用onBatchCompleted对事件进行处理。

override def onBatchCompleted(batchCompleted: StreamingListenerBatchCompleted) {
  val elements = batchCompleted.batchInfo.streamIdToInputInfo

  for {
    processingEnd <- batchCompleted.batchInfo.processingEndTime
    workDelay <- batchCompleted.batchInfo.processingDelay
    waitDelay <- batchCompleted.batchInfo.schedulingDelay
    elems <- elements.get(streamUID).map(_.numRecords)
  } computeAndPublish(processingEnd, elems, workDelay, waitDelay)
}

onBatchCompleted会从完成的任务中抽取任务的执行延迟和调度延迟，然后用这两个参数用RateEstimator（目前存在唯一实现PIDRateEstimator，proportional-integral-derivative (PID) controller， PID控制器）估算出新的rate并发布。代码如下：

/**
   * Compute the new rate limit and publish it asynchronously.
   */
  private def computeAndPublish(time: Long, elems: Long, workDelay: Long, waitDelay: Long): Unit =
Future[Unit] {
  val newRate = rateEstimator.compute(time, elems, workDelay, waitDelay)
  newRate.foreach { s =>
    rateLimit.set(s.toLong)
    publish(getLatestRate())
  }
}

其中publish()由RateController的子类ReceiverRateController来定义。具体逻辑如下（ReceiverInputDStream中定义）：

/**
   * A RateController that sends the new rate to receivers, via the receiver tracker.
   */
 private[streaming] class ReceiverRateController(id: Int, estimator: RateEstimator)
  extends RateController(id, estimator) {
  override def publish(rate: Long): Unit =
    ssc.scheduler.receiverTracker.sendRateUpdate(id, rate)
}

publish的功能为新生成的rate 借助ReceiverTracker进行转发。ReceiverTracker将rate包装成UpdateReceiverRateLimit事交ReceiverTrackerEndpoint

/** Update a receiver's maximum ingestion rate */
def sendRateUpdate(streamUID: Int, newRate: Long):   Unit = synchronized {
  if (isTrackerStarted) {
    endpoint.send(UpdateReceiverRateLimit(streamUID, newRate))
  }
}

ReceiverTrackerEndpoint接到消息后，其将会从receiverTrackingInfos列表中获取Receiver注册时使用的endpoint(实为ReceiverSupervisorImpl)，再将rate包装成UpdateLimit发送至endpoint.其接到信息后，使用updateRate更新BlockGenerators(RateLimiter子类),来计算出一个固定的令牌间隔。

其中RateLimiter的updateRate实现如下：

/**
  * Set the rate limit to `newRate`. The new rate will not exceed the maximum rate configured by
  * {{{spark.streaming.receiver.maxRate}}}, even if `newRate` is higher than that.
  *
  * @param newRate A new rate in events per second. It has no effect if it's 0 or negative.
  */
 private[receiver] def updateRate(newRate: Long): Unit =
   if (newRate > 0) {
   if (maxRateLimit > 0) {
     rateLimiter.setRate(newRate.min(maxRateLimit))
   } else {
     rateLimiter.setRate(newRate)
   }
 }

setRate的实现如下：

public final void setRate(double permitsPerSecond) {
  Preconditions.checkArgument(permitsPerSecond > 0.0
    && !Double.isNaN(permitsPerSecond), "rate must be positive");
  synchronized (mutex) {
    resync(readSafeMicros());
    double stableIntervalMicros = TimeUnit.SECONDS.toMicros(1L) / permitsPerSecond;  //固定间隔
    this.stableIntervalMicros = stableIntervalMicros;
    doSetRate(permitsPerSecond, stableIntervalMicros);
  }
}

到此，backpressure反压机制调整rate结束。

4．流量控制点
　　当Receiver开始接收数据时，会通过supervisor.pushSingle()方法将接收的数据存入currentBuffer等待BlockGenerator定时将数据取走，包装成block. 在将数据存放入currentBuffer之时，要获取许可（令牌）。如果获取到许可就可以将数据存入buffer, 否则将被阻塞，进而阻塞Receiver从数据源拉取数据。

  /**
   * Push a single data item into the buffer.
   */
  def addData(data: Any): Unit = {
      if (state == Active) {
         waitToPush()  //获取令牌
        synchronized {
          if (state == Active) {
            currentBuffer += data
          } else {
            throw new SparkException(
        "Cannot add data as BlockGenerator has not been started or has been stopped")
          }
        }
      } else {
        throw new SparkException(
    "Cannot add data as BlockGenerator has not been started or has been stopped")
}

其令牌投放采用令牌桶机制进行，原理如下图所示:

令牌桶机制：大小固定的令牌桶可自行以恒定的速率源源不断地产生令牌。如果令牌不被消耗，或者被消耗的速度小于产生的速度，令牌就会不断地增多，直到把桶填满。后面再产生的令牌就会从桶中溢出。最后桶中可以保存的最大令牌数永远不会超过桶的大小。当进行某操作时需要令牌时会从令牌桶中取出相应的令牌数，如果获取到则继续操作，否则阻塞。用完之后不用放回。
　　Streaming 数据流被Receiver接收后，按行解析后存入iterator中。然后逐个存入Buffer，在存入buffer时会先获取token，如果没有token存在，则阻塞；如果获取到则将数据存入buffer. 然后等价后续生成block操作。

转载于:https://www.cnblogs.com/itboys/p/6486089.html

新手发小红书笔记怎么赚钱?新手小红书赚钱攻略详解日常购物技巧呀
小红书作为一个社交分享平台，用户在这里可以搜集到各种各样的干货，帮助他们解决生活中的问题。如果有这方面经验的用户，可以在小红书上面注册账号，分享一些干货，运气好的话也可以进行变现赚钱，那么如何做小红书赚钱？大家好，我是高省APP联合创始人万方导师，高省APP是2021年推出的电商导购平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个可省钱佣金高，能赚钱有收益的平台，
英超直播：纽卡斯尔联队十年前五名，球迷们难忘的时刻体育日记本
在过去的十年里，纽卡斯尔联队创造了许多特别而难忘的时刻，但是在这十年里，我们对俱乐部最美好的回忆是什么？过去的十年在卡通军心中引发了一场情绪的过山车。纽卡斯尔联队成功跻身前五，并在同一个十年经历了两次降级。从在圣詹姆斯公园听到欧罗巴联赛的圣歌，到在冠军路上迎战普利茅斯阿盖尔，一点都不好玩。尽管如此，在所有的低潮时刻，这十年确实包含了一些令人难忘的时刻，纽卡斯尔联队的球迷可以在未来几年与年轻一代分享
lesson11：Python的字典及方法你的电影很有趣 windows python
目录前言一、字典的定义与核心价值创建方式：二、核心特性：键的规则与无序性演变1、键的不可变性与唯一性2、无序性与Python版本差异三、常用操作与方法全解析四、与列表/元组的对比：数据结构选型指南五、高级应用技巧六、避坑指南：常见错误与最佳实践总结前言在Python的“数据结构工具箱”中，字典（Dictionary）无疑是最灵活、最强大的工具之一。无论是存储用户信息、解析JSON数据，还是实现缓存
无题唐春元ok
北方的雪美了冬天南方的夜暖了骄阳我在南方守着一寸夕阳思念家乡，多了惆怅雪是我来到这个世界第一眼遇见的光芒。就在今天我哇哇落地家乡也美美的下了一场雪只是不知南方当时的融融暖意。图片发自App图片发自App
你在羡慕别人的时候，别人也在羡慕你小火慢炖
昨天听闺蜜诉说自己的委屈，突然发现我们都在羡慕着别人拥有的东西，却不知道这世界上还有很多人在羡慕我们。闺蜜跟自己家人吵架，生气跑出门，在外面待了三个小时。她哭着说，为什么家人总是不理解他？她觉得自己的生活有点悲惨。其实在我看来，她有房有车，有疼爱自己的老公，还有一个可爱的孩子。生活已经很幸福了，不过当然，再幸福的生活也免不了琐碎的事情，磕磕绊绊。这些都是非常正常的，但是大多数人都会存在在这样一个循
雪落无声，你的动静打扰了我们 VickyLi_文丽
早上起来，外面路上铺满了白色的雪花，来到学校白茫茫一片，孩子们很高兴。在第二节课后阳光活动，由于天气原因，没法进行跑操，所以有的班依然在上课。我在二班上课，隔壁的三班机几个男生大声喊叫，大声吵闹。我作为班主任赶紧回班看看发生了什么事情？原来，我们班孩子在没有老师的情况下，跃跃欲试，要出去玩雪。本身，喜欢玩耍是孩子的天性，如果是平时，出去玩也没事情。可是偌大的走廊上，另外的班在上课，只有我们班在吵闹
C语言实现扫雷游戏：从经典玩法到代码构建
文章目录C语言实现扫雷游戏：从经典玩法到代码构建一、游戏简介：经典玩法回顾二、扫雷游戏的设计与实现2.1整体设计思路与技术选型核心技术栈多文件分工2.2棋盘设计：核心数据结构棋盘尺寸与扩展设计双棋盘机制2.3核心功能实现1.棋盘初始化与打印2.随机布置地雷3.地雷排查与数字计算2.4游戏流程控制4.排查逻辑完整实现三、功能扩展：提升游戏体验四、总结C语言实现扫雷游戏：从经典玩法到代码构建扫雷作为一
感恩疫情期间，依然可以看见阳光 Tina与你同行
女儿佳琳一路小跑着来到我的工作室，边跑边说，快把手机给我：“我一定要把这美丽的一幕拍下来。”原来是撒落在客厅里的阳光。她要在阳光驻足的时候把它留住。过了一会，她拿来这张照片给我看。她趴在被照亮的沙发一角，小脸紧贴着深蓝色的沙发面，放松得裹在暖阳里，露出灿烂的笑容。看着好温暖。感谢女儿让我留意到温暖的阳光，还有任何情况下都可以嘴角上扬的微笑。疫情基本不出门，享受不到户外的阳光。可是，太阳就在那里。它
深度学习超参数优化（HPO）终极指南：从入门到前沿
摘要：在深度学习的实践中，模型性能的好坏不仅取决于算法和数据，更在一半程度上取决于超参数的精妙设置。本文是一篇关于超参数优化（HyperparameterOptimization,HPO）的综合性指南，旨在带领读者从最基础的概念出发，系统性地梳理从经典到前沿的各类优化方法，并最终落地于实用策略和现代工具。无论您是初学者还是资深从业者，都能从中获得宝贵的见解。第一部分：夯实基础——HPO的核心概念1
Apple设备双重认证-获取验证码 fb69e982796d
方式1.在新设备上登录appleid和密码登录，在其他信任的设备上会出现登录通知，轻点”允许“以接受验证码，在这台新设备上输入这个验证码登录即可方式2.若身边无可信任设备，点按登录屏幕上的”没有收到验证码吗“，选择将验证码发送到受信任的电话号码，apple将通过短信或者电话向您提供验证码。新设备输入此验证码以完成登录。方式3.从受信任设备上的“设置”获取验证码。如果无法在受信任设备上自动收到验证码
使用 Git 结合 GitHub 管理代码 - Autodl（笔记）
核心目标：在AutoDL服务器上方便地获取、修改和同步代码。利用GitHub作为中央代码仓库，实现版本控制、备份和协作。保持本地开发环境（如果有的话）与AutoDL服务器环境的代码同步。全流程步骤：阶段一：准备工作(在本地和GitHub上)拥有GitHub账户:如果没有，先去GitHub官网注册一个账户。创建GitHub仓库(Repository):登录GitHub。点击右上角的"+"号，选择"N
【嘟嘟嘀嘀】20180223学习力践行D136 嘟嘟嘀嘀
今天年初八，我们从老家开车回来广东，一路都有交通事故，所以一路都有塞车，总共开了8个来小时，时间比较长，宝宝在车上总体也算好，就是堵车的时候他也比较烦躁，会哭闹一下，烦躁时我们会念念手指谣，听听音乐，他的心情就会好些。回来家里，睡前也看了《蹦》、《语言启蒙》红本。
复盘，温故而知新 yang40
———————今日复盘———————回顾本周的学习写作，请谈谈你的收获和反思【我的技能】本周学习，对之前已经学习一次的写作技巧，又在此复习一遍，如何开头，如何结尾，有了新体验和新想法。【我要发问】本周所学内容中，你有哪些不会的呢？如何系统的输出干货，如何让自己不断积累，找到适合自己的速度和方法，坚持的动力是什么？【我的闪光点】本周你做的好的地方？继续早起，并且开始自由写作，对自由写作有新的认识，和
【PTA数据结构 | C语言版】将表达式树转换成中缀表达式
本专栏持续输出数据结构题目集，欢迎订阅。文章目录题目代码题目请编写程序，读入两个操作数和一个操作符，建立表达式树，输出中缀表达式。输入格式：输入给出2个整数和一个字符，依次为表达式的第1、2个操作数，和操作符。输出格式：在一行中输出中缀表达式，其中左右子表达式各用一对圆括号()括起，两对括号中间输出操作符。表达式中没有任何空格。输入样例：12+输出样例：(1)+(2)代码#include#incl
2024必入的现象级流量卡推荐！电信卡移动联通卡推荐~移动联通电信流量卡电话卡手机卡全面评测！优惠攻略官
拯救每一个想办流量卡的姐妹作为一个长期和各种流量卡打交道的人，我深知大家在选择流量卡时的疑虑和困扰。市面上的流量卡五花八门，让人眼花缭乱，那么，哪些才是真正靠谱的流量卡呢?✨在我看来，一个靠谱的流量卡应该具备以下几点：运营商授权:这是最基本的一点，正规流量卡都是有运营商授权的，大家在购买的时候一定要注意查看价格合理:正规的手机套餐价格都比较合理，不会出现4.9、这样的小数价格。功能齐全:靠谱的流量
【C++特殊工具与技术】固有的不可移植的特性(3)::extern“C“
在软件开发中，混合编程是常见需求：C++调用C语言编写的底层库（如Linux系统调用）、C程序调用C++实现的算法模块，甚至C++与Ada、Fortran等其他语言交互。但不同语言在函数命名规则和调用约定上的差异，会导致链接阶段出现“无法解析的外部符号”错误。目录一、命名修饰与链接问题：CvsC++1.1C++的命名修饰机制1.2C语言的“无修饰”命名1.3链接失败的典型场景二、extern"C"
【读书清单】《了凡四训》&积善之方幻岭之漫
1.与人为善说话做事，不只是为自己所想，而是立足于客观事实的，不有意在他人面前卖弄自己骄傲的智慧和才能2.爱敬存心君子和小人差别就在于尊重爱护众人的那份心。各种各样的人，都是我们的同胞，都是值得尊敬的3.成人之美看到一个人做好事，或看到他的志向可以支持，资质可以进步的，都要对他进行引导，最终能造就他们4.劝人为善在忙碌着追逐名利的人，容易迷失自我。与他们相处时要随时提醒他们帮他们摆脱疑惑。比如看到
性能优化 —— 通过移除 pagefile.sys 和 hiberfil.sys 文件释放C盘空间（不推荐） ice.Ynov23 Windows Solutions windows
通过移除pagefile.sys和hiberfil.sys文件释放C盘空间（不推荐）点击查看->选项->文件夹选项->查看，取消勾选“隐藏受保护的操作系统文件(推荐)”，选择“显示隐藏的文件，文件夹和驱动”，C盘下面会出现三个文件hiberfil.sys，pagefile.sys还有swapfile.sys那么问题来了：文件hiberfil.sys,pagefile.sys是干啥的呀？可以删掉么？
华山论剑润树
华山论剑，在旧武侠小说中，通常指的是武林高手大展身手，问鼎武林至尊的比试。中国的武术渊远流长，生出了许多门派，难以述尽。然而，有两大门派的功夫，是可以作为代表的，一派是至刚的少林功夫，一派是至柔的太极功夫，此功夫以武当派为代表，至于葵花宝典之类的，我们暂且放置一边不提。到底是少林功夫强？还是太极功夫历害？武学家是各有见解、各执一词；小说家也是打了很长时间的笔墨官司，似乎也还无定论。在这里，我想起了
神秘的西藏－－拉鲁湿地公园萍水相聚
我们是在Ｂooking上定的民宿“香巴拉宫”，藏式风格，离大昭寺很近，老城区、出行方便、价格实惠，优惠后价格不到200元/天，前台小伙是位地道的藏民，名叫嘉央罗珠，今年27岁，右腿有些残疾。几天相处下来，人非常纯朴，家在日喀则，来拉萨这里打工。在2018年以前，“香巴拉宫”非常受外国友人欢迎，生意很好，后来老外禁止入藏后，加上疫情原因，民宿生意下滑很多，每年5-10月份，生意才逐渐好转。每天见到嘉
三年打磨，一次飞跃！KubeSphere 企业版 4.2.0 引爆云原生变革
历经三年匠心打造，KubeSphere企业版4.2.0正式发布！今天，我们激动地宣布KubeSphere企业版4.2.0正式发布！这是一个承载着KubeSphere团队近三年心血的重磅版本，标志着KubeSphere在云原生领域的又一次跨越式发展。四大核心升级，全面重塑云原生体验1.全新UI设计，打造极致用户体验五大设计改动，让容器管理更高效KubeSphere企业版4.2.0带来全新的UI设计理
Hadoop与云原生集成：弹性扩缩容与OSS存储分离架构深度解析
Hadoop与云原生集成的必要性Hadoop在大数据领域的基石地位作为大数据处理领域的奠基性技术，Hadoop自2006年诞生以来已形成包含HDFS、YARN、MapReduce三大核心组件的完整生态体系。根据CSDN技术社区的分析报告，全球超过75%的《财富》500强企业仍在使用Hadoop处理EB级数据，其分布式文件系统HDFS通过数据分片（默认128MB块大小）和三副本存储机制，成功解决了P
React教程(-一 ) -- 快速构建React开发环境嚣张.miner react react入门 react环境
React初接触一.react的安装1).使用方法可以直接下载使用http://facebook.github.io/react/下载最新2).直接使用BootCDN的ReactCDN库.在.html文件中直接引用-react.min.js-React的核心库-react-dom.min.js-提供与DOM相关的功能-babel.min.js-Babel可以将ES6代码转为ES5代码，这样我们就能
卢战卡：看懂客户是真问题还是假问题，制造先发优势！卢战卡
大家好，我是卢战卡！你经常会接到这个客户反问过来的问题：你要判断明白，再做回答；否则，你的回答可能就就是无效；假问题是不要回答。真问题适合解决，假问题不适合解决。真问题VS假问题一、真问题时，适合解决：真问题一般情况下对方的微表情往往都是表里如一、一致性特别强，没有别扭的感觉、没有让你觉得不舒服，很不正常的感觉；同时情绪真挚，他的感觉是能够带出他的真挚。二、假问题时，不宜解决：假问题往往有什么样的
用错“蒋巴法”的收获 2cf56416257e
从我开始想修蒋巴法开始，我就开始关注周围人的需要。有些人说出来，需要很明确，有些人不不说我就要去猜测。19年8月份，在我去内观之前，我们机构正好做活动。我最好的朋友一听说我做活动，就帮助我，把钱交上了。2019元的押金，领两个榴莲，试听一个月的课程。第一个榴莲领了。9月份，我离开了英语机构。排课的时候却因为两个机构的事情没有排上。那个时候，朋友就说让我退款。我觉得他帮助了我，我就不能让她白白帮我，
Python 模块化编程全解析：模块、包与第三方库管理指南 xw3373409564 java 前端数据库
模块与包模块化编程是什么？用生活例子秒懂想象你在搭乐高积木：每个小积木块都有特定功能（比如轮子、窗户、墙壁）——这就像模块（一个.py文件，封装了函数或类）。把相关的积木块装进一个盒子里，方便分类和取用——这就像包（一个文件夹，里面装多个模块和子包，带__init__.py标识）。模块化编程的核心思想是：把复杂代码拆成小而独立的"积木"，需要时直接拿来用，不用重复造轮子。1.模块的概念模块就是一个
考级柠檬膏剂
今天要考级了，可以说我是非常紧张。考级的等待过程时不时停一下电，我们大家还没考试之前就已经大汗淋漓了。我九点就到了，我是我们班第十二个来的。我们在一楼等了半小时左右，就到二楼啦，二楼非常凉快。我们的汗顿时就没了。没过多久老师来了，老师给我们打气，加油，还叫我们不要紧张，要放轻松。我的信心顿时大增。“民族二班快点来！”一个急促的声音催促道。原来是到我们了，我拿上手绢，穿上舞蹈鞋就走了。到了考试教室，
神龙霸业怎么当托神龙霸业内部福利号如何才能申请？会飞滴鱼儿
现在的手游不管是刚公测，或是已经上线很久，官方都会公布一些实用的礼包兑换码来给玩家使用，玩家可以在游戏内获得一些道具，或是一些各种游戏内的金币钻石等福利，现在很多手游平台不仅有礼包码提供给玩家，还有很多游戏都有大幅度的充值折扣等，最低可以1-5折等优惠，不过这些礼包兑换码和折扣福利虽然不错，不过和内部号相比，还是相差甚远，下面小编就来总体的和大家聊聊什么是内部号！说起内部号可能很多朋友都是见过的，
他趣邀请码是什么是多少（他趣APP邀请码使用方法介绍）女神心动版桃朵十三
近日，一款名为“他趣”的APP在社交圈内引起了广泛关注。他趣邀请码是【FGJ8HT】和【NMV43T】这款APP凭借其独特的邀请码机制，吸引了众多用户参与。那么，“他趣”邀请码是什么呢？又该如何使用呢？接下来，让我们一起揭开“他趣”邀请码的神秘面纱。“他趣”邀请码【FGJ8HT】和【NMV43T】是用户在注册时需要填写的一种数字组合。每个邀请码都代表着一个独特的用户身份，用于识别和区分不同的用户。
基于R语言的极值统计学及其在相关领域中的实践技术应用科研的力量语言类课程极值统计学
受到气候变化、温室效应以及人类活动等因素的影响，自然界中极端高温、极端环境污染、大洪水和大暴雨等现象的发生日益频繁；在人类社会中，股市崩溃、金融危机等极端情况也时有发生；今年的新冠疫情就是非常典型的极端现象。研究此类极端现象需要新的统计学方法，该类统计学的理论和方法都与传统的基于高斯分布的统计学模型有极大的不同。极值统计学就是专门研究自然界和人类社会中很少发生，然而发生之后有着巨大影响的极端现象的
数据采集高并发的架构应用 3golden .net
问题的出发点：最近公司为了发展需要，要扩大对用户的信息采集，每个用户的采集量估计约2W。如果用户量增加的话，将会大量照成采集量成3W倍的增长，但是又要满足日常业务需要，特别是指令要及时得到响应的频率次数远大于预期。 &n
不停止 MySQL 服务增加从库的两种方式 brotherlamp linux linux视频 linux资料 linux教程 linux自学
现在生产环境MySQL数据库是一主一从，由于业务量访问不断增大，故再增加一台从库。前提是不能影响线上业务使用，也就是说不能重启MySQL服务，为了避免出现其他情况，选择在网站访问量低峰期时间段操作。一般在线增加从库有两种方式，一种是通过mysqldump备份主库，恢复到从库，mysqldump是逻辑备份，数据量大时，备份速度会很慢，锁表的时间也会很长。另一种是通过xtrabacku
Quartz——SimpleTrigger触发器 eksliang SimpleTrigger TriggerUtils quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208166 一.概述 SimpleTrigger触发器，当且仅需触发一次或者以固定时间间隔周期触发执行；二.SimpleTrigger的构造函数 SimpleTrigger(String name, String group)：通过该构造函数指定Trigger所属组和名称； Simpl
Informatica应用（1） 18289753290 sql workflow lookup 组件 Informatica
1.如果要在workflow中调用shell脚本有一个command组件，在里面设置shell的路径；调度wf可以右键出现schedule，现在用的是HP的tidal调度wf的执行。 2.designer里面的router类似于SSIS中的broadcast（多播组件）;Reset_Workflow_Var：参数重置（比如说我这个参数初始是1在workflow跑得过程中变成了3我要在结束时还要
python 获取图片验证码中文字酷的飞上天空 python
根据现成的开源项目 http://code.google.com/p/pytesser/改写在window上用easy_install安装不上看了下源码发现代码很少于是就想自己改写一下添加支持网络图片的直接解析 #coding:utf-8 #import sys #reload(sys) #sys.s
AJAX 永夜-极光 Ajax
1.AJAX功能:动态更新页面,减少流量消耗,减轻服务器负担 2.代码结构: <html> <head> <script type="text/javascript"> function loadXMLDoc() { .... AJAX script goes here ...
创业OR读研随便小屋创业
现在研一，有种想创业的想法，不知道该不该去实施。因为对于的我情况这两者是矛盾的，可能就是鱼与熊掌不能兼得。研一的生活刚刚过去两个月，我们学校主要的是
需求做得好与坏直接关系着程序员生活质量 aijuans IT 生活
这个故事还得从去年换工作的事情说起，由于自己不太喜欢第一家公司的环境我选择了换一份工作。去年九月份我入职现在的这家公司，专门从事金融业内软件的开发。十一月份我们整个项目组前往北京做现场开发，从此苦逼的日子开始了。系统背景：五月份就有同事前往甲方了解需求一直到6月份，后续几个月也完
如何定义和区分高级软件开发工程师 aoyouzi
在软件开发领域，高级开发工程师通常是指那些编写代码超过 3 年的人。这些人可能会被放到领导的位置，但经常会产生非常糟糕的结果。Matt Briggs 是一名高级开发工程师兼 Scrum 管理员。他认为，单纯使用年限来划分开发人员存在问题，两个同样具有 10 年开发经验的开发人员可能大不相同。近日，他发表了一篇博文，根据开发者所能发挥的作用划分软件开发工程师的成长阶段。　　初
Servlet的请求与响应百合不是茶 servlet get提交 java处理post提交
Servlet是tomcat中的一个重要组成,也是负责客户端和服务端的中介 1,Http的请求方式(get ,post); 客户端的请求一般都会都是Servlet来接受的,在接收之前怎么来确定是那种方式提交的,以及如何反馈,Servlet中有相应的方法, http的get方式 servlet就是都doGet(
web.xml配置详解之listener bijian1013 java web.xml listener
一.定义 <listener> <listen-class>com.myapp.MyListener</listen-class> </listener> 二.作用该元素用来注册一个监听器类。可以收到事件什么时候发生以及用什么作为响
Web页面性能优化（yahoo技术） Bill_chen JavaScript Ajax Web css Yahoo
1.尽可能的减少HTTP请求数 content 2.使用CDN server 3.添加Expires头(或者 Cache-control) server 4.Gzip 组件 server 5.把CSS样式放在页面的上方。 css 6.将脚本放在底部(包括内联的) javascript 7.避免在CSS中使用Expressions css 8.将javascript和css独立成外部文
【MongoDB学习笔记八】MongoDB游标、分页查询、查询结果排序 bit1129 mongodb
游标游标，简单的说就是一个查询结果的指针。游标作为数据库的一个对象，使用它是包括声明打开循环抓去一定数目的文档直到结果集中的所有文档已经抓取完关闭游标游标的基本用法，类似于JDBC的ResultSet(hasNext判断是否抓去完,next移动游标到下一条文档)，在获取一个文档集时，可以提供一个类似JDBC的FetchSize
ORA-12514 TNS 监听程序当前无法识别连接描述符中请求服务的解决方法白糖_ ORA-12514
今天通过Oracle SQL*Plus连接远端服务器的时候提示“监听程序当前无法识别连接描述符中请求服务”，遂在网上找到了解决方案： ①打开Oracle服务器安装目录\NETWORK\ADMIN\listener.ora文件，你会看到如下信息： # listener.ora Network Configuration File: D:\database\Oracle\net
Eclipse 问题 A resource exists with a different case bozch eclipse
在使用Eclipse进行开发的时候，出现了如下的问题： Description Resource Path Location TypeThe project was not built due to "A resource exists with a different case: '/SeenTaoImp_zhV2/bin/seentao'.&
编程之美-小飞的电梯调度算法 bylijinnan 编程之美
public class AptElevator { /** * 编程之美小飞电梯调度算法 * 在繁忙的时间，每次电梯从一层往上走时，我们只允许电梯停在其中的某一层。 * 所有乘客都从一楼上电梯，到达某层楼后，电梯听下来，所有乘客再从这里爬楼梯到自己的目的层。 * 在一楼时，每个乘客选择自己的目的层，电梯则自动计算出应停的楼层。 * 问：电梯停在哪
SQL注入相关概念 chenbowen00 sql Web 安全
SQL Injection：就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串，最终达到欺骗服务器执行恶意的SQL命令。具体来说，它是利用现有应用程序，将（恶意）的SQL命令注入到后台数据库引擎执行的能力，它可以通过在Web表单中输入（恶意）SQL语句得到一个存在安全漏洞的网站上的数据库，而不是按照设计者意图去执行SQL语句。首先让我们了解什么时候可能发生SQ
[光与电]光子信号战防御原理 comsci 原理
无论是在战场上,还是在后方,敌人都有可能用光子信号对人体进行控制和攻击,那么采取什么样的防御方法,最简单,最有效呢? 我们这里有几个山寨的办法,可能有些作用,大家如果有兴趣可以去实验一下根据光
oracle 11g新特性:Pending Statistics daizj oracle dbms_stats
oracle 11g新特性:Pending Statistics 转从11g开始，表与索引的统计信息收集完毕后，可以选择收集的统信息立即发布，也可以选择使新收集的统计信息处于pending状态，待确定处于pending状态的统计信息是安全的，再使处于pending状态的统计信息发布，这样就会避免一些因为收集统计信息立即发布而导致SQL执行计划走错的灾难。在 11g 之前的版本中，D
快速理解RequireJs dengkane jquery requirejs
RequireJs已经流行很久了，我们在项目中也打算使用它。它提供了以下功能：声明不同js文件之间的依赖可以按需、并行、延时载入js库可以让我们的代码以模块化的方式组织初看起来并不复杂。在html中引入requirejs 在HTML中，添加这样的 <script> 标签： <script src="/path/to
C语言学习四流程控制if条件选择、for循环和强制类型转换 dcj3sjt126com c
# include <stdio.h> int main(void) { int i, j; scanf("%d %d", &i, &j); if (i > j) printf("i大于j\n"); else printf("i小于j\n"); retu
dictionary的使用要注意 dcj3sjt126com IO
NSDictionary *dict = [NSDictionary dictionaryWithObjectsAndKeys: user.user_id , @"id", user.username , @"username",
Android 中的资源访问(Resource) finally_m xml android String drawable color
简单的说，Android中的资源是指非代码部分。例如，在我们的Android程序中要使用一些图片来设置界面，要使用一些音频文件来设置铃声，要使用一些动画来显示特效，要使用一些字符串来显示提示信息。那么，这些图片、音频、动画和字符串等叫做Android中的资源文件。在Eclipse创建的工程中，我们可以看到res和assets两个文件夹，是用来保存资源文件的，在assets中保存的一般是原生
Spring使用Cache、整合Ehcache 234390216 spring cache ehcache @Cacheable
Spring使用Cache 从3.1开始，Spring引入了对Cache的支持。其使用方法和原理都类似于Spring对事务管理的支持。Spring Cache是作用在方法上的，其核心思想是这样的：当我们在调用一个缓存方法时会把该方法参数和返回结果作为一个键值对存放在缓存中，等到下次利用同样的
当druid遇上oracle blob(clob) jackyrong oracle
http://blog.csdn.net/renfufei/article/details/44887371 众所周知，Oracle有很多坑, 所以才有了去IOE。在使用Druid做数据库连接池后，其实偶尔也会碰到小坑，这就是使用开源项目所必须去填平的。【如果使用不开源的产品，那就不是坑，而是陷阱了，你都不知道怎么去填坑】用Druid连接池，通过JDBC往Oracle数据库的
easyui datagrid pagination获得分页页码、总页数等信息 ldzyz007
var grid = $('#datagrid'); var options = grid.datagrid('getPager').data("pagination").options; var curr = options.pageNumber; var total = options.total; var max =
浅析awk里的数组 nigelzeng 二维数组 array 数组 awk
awk绝对是文本处理中的神器，它本身也是一门编程语言，还有许多功能本人没有使用到。这篇文章就单单针对awk里的数组来进行讨论，如何利用数组来帮助完成文本分析。有这么一组数据： abcd,91#31#2012-12-31 11:24:00 case_a,136#19#2012-12-31 11:24:00 case_a,136#23#2012-12-31 1
搭建 CentOS 6 服务器(6) - TigerVNC rensanning centos
安装GNOME桌面环境 # yum groupinstall "X Window System" "Desktop" 安装TigerVNC # yum -y install tigervnc-server tigervnc 启动VNC服务 # /etc/init.d/vncserver restart # vncser
Spring 数据库连接整理 tomcat_oracle spring bean jdbc
1、数据库连接jdbc.properties配置详解　　jdbc.url=jdbc:hsqldb:hsql://localhost/xdb 　　jdbc.username=sa 　　jdbc.password= 　　jdbc.driver=不同的数据库厂商驱动，此处不一一列举　　接下来，详细配置代码如下：　　 Spring连接池
Dom4J解析使用xpath java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常 xp9802
用Dom4J解析xml,以前没注意,今天使用dom4j包解析xml时在xpath使用处报错异常栈：java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常导入包 jaxen-1.1-beta-6.jar 解决; &nb

Spark Streaming性能优化: 如何在生产环境下应对流数据峰值巨变

你可能感兴趣的:(Spark Streaming性能优化: 如何在生产环境下应对流数据峰值巨变)