柯里昂

spark 版本定制第5课：基于案例一节课贯通Spark Streaming流计算框架运行源码11

上文已经从源码分析了Receiver接收的数据交由BlockManager管理，整个数据接收流都已经运转起来了，那么让我们回到分析JobScheduler的博客中。

// JobScheduler.scala line 62
  def start(): Unit = synchronized {
    if (eventLoop != null) return // scheduler has already been started

    logDebug("Starting JobScheduler")
    eventLoop = new EventLoop[JobSchedulerEvent]("JobScheduler") {
      override protected def onReceive(event: JobSchedulerEvent): Unit = processEvent(event)

      override protected def onError(e: Throwable): Unit = reportError("Error in job scheduler", e)
    }
    eventLoop.start()

    // attach rate controllers of input streams to receive batch completion updates
    for {
      inputDStream <- ssc.graph.getInputStreams
      rateController <- inputDStream.rateController
    } ssc.addStreamingListener(rateController)

    listenerBus.start(ssc.sparkContext)
    receiverTracker = new ReceiverTracker(ssc)
    inputInfoTracker = new InputInfoTracker(ssc)
    receiverTracker.start()
    jobGenerator.start()
    logInfo("Started JobScheduler")
  }

前面好几篇博客都是由 receiverTracker.start() 延展开。延展完毕后，继续下一步。

// JobScheduler.scala line 83
jobGenerator.start()

jobGenerator的实例化过程，前面已经分析过。深入下源码了解到。

实例化eventLoop，此处的eventLoop与JobScheduler中的eventLoop不一样，对应的是不同的泛型。
EventLoop.start
首次启动，startFirstTime

  // JobGenerator.scala line 78
  /** Start generation of jobs */
  def start(): Unit = synchronized {
    if (eventLoop != null) return // generator has already been started

    // Call checkpointWriter here to initialize it before eventLoop uses it to avoid a deadlock.
    // See SPARK-10125
    checkpointWriter

    eventLoop = new EventLoop[JobGeneratorEvent]("JobGenerator") {
      override protected def onReceive(event: JobGeneratorEvent): Unit = processEvent(event)
      override protected def onError(e: Throwable): Unit = {
        jobScheduler.reportError("Error in job generator", e)
      }
    }
    eventLoop.start()

    if (ssc.isCheckpointPresent) {
      restart()
    } else {
      startFirstTime()
    }
  }

// JobGenerator.scala line 189
  /** Starts the generator for the first time */
  private def startFirstTime() {
    val startTime = new Time(timer.getStartTime())
    graph.start(startTime - graph.batchDuration)
    timer.start(startTime.milliseconds)
    logInfo("Started JobGenerator at " + startTime)
  }

将DStreamGraph.start

将所有的outputStreams都initialize，初始化首次执行时间，依赖的DStream一并设置。
如果设置了duration，将所有的outputStreams都remember，依赖的DStream一并设置
启动前验证，主要是验证chechpoint设置是否冲突以及各种Duration
将所有的inputStreams启动；读者扫描了下目前版本1.6.0InputDStraem及其所有的子类。start方法啥都没做。结合之前的博客，inputStreams都已经交由ReceiverTracker管理了。

// DStreamGraph.scala line 39
  def start(time: Time) {
    this.synchronized {
      require(zeroTime == null, "DStream graph computation already started")
      zeroTime = time
      startTime = time
      outputStreams.foreach(_.initialize(zeroTime))
      outputStreams.foreach(_.remember(rememberDuration))
      outputStreams.foreach(_.validateAtStart)
      inputStreams.par.foreach(_.start())
    }
  }

至此，只是做了一些简单的初始化，并没有让数据处理起来。

再回到JobGenerator。此时，将循环定时器启动，

// JobGenerator.scala line 193
    timer.start(startTime.milliseconds)

循环定时器启动；读者是不是很熟悉，是不是在哪见过这个循环定时器？

没错，就是BlockGenerator.scala line 105 、109 ，两个线程，其中一个是循环定时器，定时将数据放入待push队列中。

// RecurringTimer.scala line 59
  def start(startTime: Long): Long = synchronized {
    nextTime = startTime
    thread.start()
    logInfo("Started timer for " + name + " at time " + nextTime)
    nextTime
  }

具体的逻辑是在构造是传入的方法：longTime => eventLoop.post(GenerateJobs(new Time(longTime)))；

输入是Long，

方法体是eventLoop.post(GenerateJobs(new Time(longTime)))

// JobGenerator.scala line 58
  private val timer = new RecurringTimer(clock, ssc.graph.batchDuration.milliseconds,
    longTime => eventLoop.post(GenerateJobs(new Time(longTime))), "JobGenerator")

只要线程状态不是stopped，一直循环。

初始化的时候将上面的方法传进来， callback: (Long) => Unit 对应的就是 longTime => eventLoop.post(GenerateJobs(new Time(longTime)))
start的时候 thread.run启动，里面的loop方法被执行。
loop中调用的是 triggerActionForNextInterval。
triggerActionForNextInterval调用构造传入的callback，也就是上面的 longTime => eventLoop.post(GenerateJobs(new Time(longTime)))

private[streaming]
class RecurringTimer(clock: Clock, period: Long, callback: (Long) => Unit, name: String)
  extends Logging {
// RecurringTimer.scala line 27
  private val thread = new Thread("RecurringTimer - " + name) {
    setDaemon(true)
    override def run() { loop }
  }
// RecurringTimer.scala line 56
  /**
   * Start at the given start time.
   */
  def start(startTime: Long): Long = synchronized {
    nextTime = startTime
    thread.start()
    logInfo("Started timer for " + name + " at time " + nextTime)
    nextTime
  }
// RecurringTimer.scala line 92
  private def triggerActionForNextInterval(): Unit = {
    clock.waitTillTime(nextTime)
    callback(nextTime)
    prevTime = nextTime
    nextTime += period
    logDebug("Callback for " + name + " called at time " + prevTime)
  }

// RecurringTimer.scala line 100
  /**
   * Repeatedly call the callback every interval.
   */
  private def loop() {
    try {
      while (!stopped) {
        triggerActionForNextInterval()
      }
      triggerActionForNextInterval()
    } catch {
      case e: InterruptedException =>
    }
  }
// ...一些代码
}

定时发送GenerateJobs 类型的事件消息，eventLoop.post中将事件消息加入到eventQueue中

// EventLoop.scala line 102
  def post(event: E): Unit = {
    eventQueue.put(event)
  }

同时，此EventLoop中的另一个成员变量 eventThread。会一直从队列中取事件消息，将此事件作为参数调用onReceive。而此onReceive在实例化时被override了。

// JobGenerator.scala line 86
    eventLoop = new EventLoop[JobGeneratorEvent]("JobGenerator") {
      override protected def onReceive(event: JobGeneratorEvent): Unit = processEvent(event)

      override protected def onError(e: Throwable): Unit = {
        jobScheduler.reportError("Error in job generator", e)
      }
    }
    eventLoop.start()

onReceive调用的是

// JobGenerator.scala line 177
  /** Processes all events */
  private def processEvent(event: JobGeneratorEvent) {
    logDebug("Got event " + event)
    event match {
      case GenerateJobs(time) => generateJobs(time)
      // 其他case class
    }
  }

GenerateJobs case class 是匹配到 generateJobs(time:Time) 来处理

获取当前时间批次ReceiverTracker收集到的所有的Blocks，若开启WAL会执行WAL
DStreamGraph生产任务
提交任务
若设置checkpoint，则checkpoint

// JobGenerator.scala line 240
  /** Generate jobs and perform checkpoint for the given `time`.  */
  private def generateJobs(time: Time) {
    // Set the SparkEnv in this thread, so that job generation code can access the environment
    // Example: BlockRDDs are created in this thread, and it needs to access BlockManager
    // Update: This is probably redundant after threadlocal stuff in SparkEnv has been removed.
    SparkEnv.set(ssc.env)
    Try {
      jobScheduler.receiverTracker.allocateBlocksToBatch(time) // allocate received blocks to batch
      graph.generateJobs(time) // generate jobs using allocated block
    } match {
      case Success(jobs) =>
        val streamIdToInputInfos = jobScheduler.inputInfoTracker.getInfo(time)
        jobScheduler.submitJobSet(JobSet(time, jobs, streamIdToInputInfos))
      case Failure(e) =>
        jobScheduler.reportError("Error generating jobs for time " + time, e)
    }
    eventLoop.post(DoCheckpoint(time, clearCheckpointDataLater = false))
  }

上述代码不是特别容易理解。细细拆分：咋一看以为是try{} catch{case ... }，仔细一看，是Try{}match{}

追踪下代码，原来Try是大写的，是一个伴生对象，apply接收的参数是一个方法，返回Try的实例。在scala.util.Try.scala 代码如下：

// scala.util.Try.scala line 155
object Try {
  /** Constructs a `Try` using the by-name parameter.  This
   * method will ensure any non-fatal exception is caught and a
   * `Failure` object is returned.
   */
  def apply[T](r: => T): Try[T] =
    try Success(r) catch {
      case NonFatal(e) => Failure(e)
    }

}

Try有两个子类，都是case class 。分别是Success和Failure。如图。

再返回调用处，Try中的代码块最后执行的是 graph.generateJobs(time) 。跟踪下：

返回的是outputStream.generateJob(time)。

// DStreamGraph.scala line 111
  def generateJobs(time: Time): Seq[Job] = {
    logDebug("Generating jobs for time " + time)
    val jobs = this.synchronized {
      outputStreams.flatMap { outputStream =>
        val jobOption = outputStream.generateJob(time)
        jobOption.foreach(_.setCallSite(outputStream.creationSite))
        jobOption
      }
    }
    logDebug("Generated " + jobs.length + " jobs for time " + time)
    jobs
  }

从前文可知，outputStream其实都是ForEachDStream。进入ForEachDStream，override了generateJob。

parent.getOrCompute(time) 返回一个Option[Job]。
若有rdd，则返回可能是new Job(time,jobFunc)

// ForEachDStream.scala line 46
  override def generateJob(time: Time): Option[Job] = {
    parent.getOrCompute(time) match {
      case Some(rdd) =>
        val jobFunc = () => createRDDWithLocalProperties(time, displayInnerRDDOps) {
          foreachFunc(rdd, time)
        }
        Some(new Job(time, jobFunc))
      case None => None
    }
  }

那么ForEachDStream的parent是什么呢？看下我们的案例：

import org.apache.spark.SparkConf
import org.apache.spark.streaming.{Durations, StreamingContext}
/**
  * 感谢王家林老师的知识分享
  * 王家林老师名片：
  * 中国Spark第一人
  * 新浪微博：http://weibo.com/ilovepains
  * 微信公众号：DT_Spark
  * 博客：http://blog.sina.com.cn/ilovepains
  * 手机：18610086859
  * QQ：1740415547
  * 邮箱：[email protected]
  * YY课堂：每天20:00免费现场授课频道68917580
  * 王家林：DT大数据梦工厂创始人、Spark亚太研究院院长和首席专家、大数据培训专家、大数据架构师。
  */
object StreamingWordCountSelfScala {
  def main(args: Array[String]) {
    val sparkConf = new SparkConf().setMaster("spark://master:7077").setAppName("StreamingWordCountSelfScala")
    val ssc = new StreamingContext(sparkConf, Durations.seconds(5)) // 每5秒收割一次数据
    val lines = ssc.socketTextStream("localhost", 9999) // 监听 本地9999 socket 端口
    val words = lines.flatMap(_.split(" ")).map((_, 1)).reduceByKey(_ + _) // flat map 后 reduce
    words.print() // 打印结果
    ssc.start() // 启动
    ssc.awaitTermination()
    ssc.stop(true)
  }
}

按照前文的描述：本例中 DStream的依赖是 SocketInputDStream << FlatMappedDStream << MappedDStream << ShuffledDStream << ForEachDStream

笔者扫描了下DStream及其所有子类，发现只有DStream有 getOrCompute，没有一个子类override了此方法。如此一来，是ShuffledDStream.getorCompute

在一般情况下，是RDD不存在，执行orElse代码快，

// DStream.scala line 338
  /**
   * Get the RDD corresponding to the given time; either retrieve it from cache
   * or compute-and-cache it.
   */
  private[streaming] final def getOrCompute(time: Time): Option[RDD[T]] = {
    // If RDD was already generated, then retrieve it from HashMap,
    // or else compute the RDD
    generatedRDDs.get(time).orElse {
      // Compute the RDD if time is valid (e.g. correct time in a sliding window)
      // of RDD generation, else generate nothing.
      if (isTimeValid(time)) {

        val rddOption = createRDDWithLocalProperties(time, displayInnerRDDOps = false) {
          // Disable checks for existing output directories in jobs launched by the streaming
          // scheduler, since we may need to write output to an existing directory during checkpoint
          // recovery; see SPARK-4835 for more details. We need to have this call here because
          // compute() might cause Spark jobs to be launched.
          PairRDDFunctions.disableOutputSpecValidation.withValue(true) {
            compute(time)  // line 352
          }
        }

        rddOption.foreach { case newRDD =>
          // Register the generated RDD for caching and checkpointing
          if (storageLevel != StorageLevel.NONE) {
            newRDD.persist(storageLevel)
            logDebug(s"Persisting RDD ${newRDD.id} for time $time to $storageLevel")
          }
          if (checkpointDuration != null && (time - zeroTime).isMultipleOf(checkpointDuration)) {
            newRDD.checkpoint()
            logInfo(s"Marking RDD ${newRDD.id} for time $time for checkpointing")
          }
          generatedRDDs.put(time, newRDD)
        }
        rddOption
      } else {
        None
      }
    }
  }

ShuffledDStream.compute

又调用parent.getOrCompute

// ShuffledDStream.scala line 40
  override def compute(validTime: Time): Option[RDD[(K, C)]] = {
    parent.getOrCompute(validTime) match {
      case Some(rdd) => Some(rdd.combineByKey[C](
          createCombiner, mergeValue, mergeCombiner, partitioner, mapSideCombine))
      case None => None
    }
  }

MappedDStream的compute，又是父类的getOrCompute，结果又调用compute，如此循环。

// MappedDStream.scala line 34
  override def compute(validTime: Time): Option[RDD[U]] = {
    parent.getOrCompute(validTime).map(_.map[U](mapFunc))
  }

FlatMappedDStream的compute，又是父类的getOrCompute。结果又调用compute，如此循环。

// FlatMappedDStream.scala line 34
  override def compute(validTime: Time): Option[RDD[U]] = {
    parent.getOrCompute(validTime).map(_.flatMap(flatMapFunc))
  }

直到DStreamshi SocketInputDStream，也就是inputStream时，compute是继承自父类。

先不考虑if中的逻辑，直接else代码块。

进入createBlockRDD

// ReceiverInputDStream.scala line 69
  override def compute(validTime: Time): Option[RDD[T]] = {
    val blockRDD = {

      if (validTime < graph.startTime) {
        // If this is called for any time before the start time of the context,
        // then this returns an empty RDD. This may happen when recovering from a
        // driver failure without any write ahead log to recover pre-failure data.
        new BlockRDD[T](ssc.sc, Array.empty)
      } else {
        // Otherwise, ask the tracker for all the blocks that have been allocated to this stream
        // for this batch
        val receiverTracker = ssc.scheduler.receiverTracker
        val blockInfos = receiverTracker.getBlocksOfBatch(validTime).getOrElse(id, Seq.empty)

        // Register the input blocks information into InputInfoTracker
        val inputInfo = StreamInputInfo(id, blockInfos.flatMap(_.numRecords).sum)
        ssc.scheduler.inputInfoTracker.reportInfo(validTime, inputInfo)

        // Create the BlockRDD
        createBlockRDD(validTime, blockInfos)
      }
    }
    Some(blockRDD)
  }

new BlockRDD[T](ssc.sc, validBlockIds) line 127，RDD实例化成功

// ReceiverInputDStream.scala line 94
  private[streaming] def createBlockRDD(time: Time, blockInfos: Seq[ReceivedBlockInfo]): RDD[T] = {

    if (blockInfos.nonEmpty) {
      val blockIds = blockInfos.map { _.blockId.asInstanceOf[BlockId] }.toArray

      // Are WAL record handles present with all the blocks
      val areWALRecordHandlesPresent = blockInfos.forall { _.walRecordHandleOption.nonEmpty }

      if (areWALRecordHandlesPresent) {
        // If all the blocks have WAL record handle, then create a WALBackedBlockRDD
        val isBlockIdValid = blockInfos.map { _.isBlockIdValid() }.toArray
        val walRecordHandles = blockInfos.map { _.walRecordHandleOption.get }.toArray
        new WriteAheadLogBackedBlockRDD[T](
          ssc.sparkContext, blockIds, walRecordHandles, isBlockIdValid)
      } else {
        // Else, create a BlockRDD. However, if there are some blocks with WAL info but not
        // others then that is unexpected and log a warning accordingly.
        if (blockInfos.find(_.walRecordHandleOption.nonEmpty).nonEmpty) {
          if (WriteAheadLogUtils.enableReceiverLog(ssc.conf)) {
            logError("Some blocks do not have Write Ahead Log information; " +
              "this is unexpected and data may not be recoverable after driver failures")
          } else {
            logWarning("Some blocks have Write Ahead Log information; this is unexpected")
          }
        }
        val validBlockIds = blockIds.filter { id =>
          ssc.sparkContext.env.blockManager.master.contains(id)
        }
        if (validBlockIds.size != blockIds.size) {
          logWarning("Some blocks could not be recovered as they were not found in memory. " +
            "To prevent such data loss, enabled Write Ahead Log (see programming guide " +
            "for more details.")
        }
        new BlockRDD[T](ssc.sc, validBlockIds) // line 127
      }
    } else {
      // If no block is ready now, creating WriteAheadLogBackedBlockRDD or BlockRDD
      // according to the configuration
      if (WriteAheadLogUtils.enableReceiverLog(ssc.conf)) {
        new WriteAheadLogBackedBlockRDD[T](
          ssc.sparkContext, Array.empty, Array.empty, Array.empty)
      } else {
        new BlockRDD[T](ssc.sc, Array.empty)
      }
    }
  }

此BlockRDD是Spark Core的RDD的子类，且没有依赖的RDD。至此，RDD的实例化已经完成。

// BlockRDD.scala line 30
private[spark]
class BlockRDD[T: ClassTag](sc: SparkContext, @transient val blockIds: Array[BlockId])
  extends RDD[T](sc, Nil) 

// RDd.scala line 74
abstract class RDD[T: ClassTag](
    @transient private var _sc: SparkContext,
    @transient private var deps: Seq[Dependency[_]]
  ) extends Serializable with Logging

至此，最终还原回来的RDD：

new BlockRDD[T](ssc.sc, validBlockIds).map(_.flatMap(flatMapFunc)).map(_.map[U](mapFunc)).combineByKey[C](createCombiner, mergeValue, mergeCombiner, partitioner, mapSideCombine)。

在本例中则为

new BlockRDD[T](ssc.sc, validBlockIds).map(_.flatMap(t=>t.split(" "))).map(_.map[U](t=>(t,1))).combineByKey[C](t=>t, (t1,t2)=>t1+t2, (t1,t2)=>t1+t2,partitioner, true)

而最终的print为

() => foreachFunc(new BlockRDD[T](ssc.sc, validBlockIds).map(_.flatMap(t=>t.split(" "))).map(_.map[U](t=>(t,1))).combineByKey[C](t=>t, (t1,t2)=>t1+t2, (t1,t2)=>t1+t2,partitioner, true),time)

其中foreachFunc为 DStrean.scala line 766

至此，RDD已经通过DStream实例化完成，现在再回顾下，是否可以理解DStream是RDD的模版。

不过别急，回到ForEachDStream.scala line 46 ，将上述函数作为构造参数，传入Job。

下节内容从源码分析Job提交，敬请期待。

感谢王家林老师的知识分享

王家林老师名片：

中国Spark第一人

新浪微博：http://weibo.com/ilovepains

微信公众号：DT_Spark

博客：http://blog.sina.com.cn/ilovepains

手机：18610086859

QQ：1740415547

邮箱：[email protected]

YY课堂：每天20:00免费现场授课频道68917580

王家林：DT大数据梦工厂创始人、Spark亚太研究院院长和首席专家、大数据培训专家、大数据架构师。

Java面试题汇总-集合篇+JUC篇泰山小张只吃荷园 java 哈希算法开发语言后端面试 spring boot
其他面试题Java面试题汇总-Java基础篇（共50道题）-CSDN博客Java集合目录1.请你说说java中hashmap的原理2.HashMap的put(key,value)和get(key)过程3.在使用hashmap时，有哪些提升性能的技巧？4.什么是哈希碰撞？怎么解决哈希碰撞？5.谈一谈hashmap的扩容操作？6.hashmap的初始容量和负载因子越大越好吗？7.为什么jdk1.8之后
Xbox：Xbox游戏编程入门_2024-07-19_20-02-54.Tex chenjj4003 游戏开发2 xbox 游戏 java 前端 ux
Xbox：Xbox游戏编程入门游戏开发环境搭建安装VisualStudio环境准备在开始Xbox游戏开发之前，首先需要一个强大的集成开发环境(IDE)，VisualStudio是微软提供的一个广泛使用的开发工具，它支持多种编程语言，包括C++，这是Xbox游戏开发的主要语言。下载与安装访问VisualStudio官方网站，下载最新版本的VisualStudio。在安装向导中，选择“创建游戏”工作负
书籍推荐 —— UML和模式应用（原书第3版） blackcat王文俊心得体会 uml 分析设计
出版社：机械工业出版社ISBN：9787111186823版次：1商品编码：13745494品牌：机工出版包装：平装丛书名：软件工程技术丛书开本：16开出版时间：2022-06-01用纸：胶版纸页数：524内容简介■关于面向对象分析与设计及UML的经典之作。■全面升级到UML2和新的迭代/敏捷实践。■增加了全新的案例研究，阐述了大量关键思想。无论对于专业人士还是教师来说，本书都堪称经典之作。本书介
阿里云通义开源首个推理步骤评估标准，探索AI推理模型新路径量子位
1月16日，阿里云通义开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM，72B及7B尺寸模型性能均大幅超越同类开源过程奖励模型；在识别推理错误步骤能力上，Qwen2.5-Math-PRM以7B的小尺寸就超越了GPT-4o。同时，通义团队还开源首个步骤级的评估标准ProcessBench，填补了大模型推理过程错误评估的空白。在当前大模型推理过程中，不时存在逻辑错误或编造看似合理的推理步
大数据新视界 -- 大数据大厂之 Hive 数据安全：权限管理体系的深度解读（上）（15/ 30）青云交大数据新视界 #Hive 之道大数据 Hive 集成大数据工具集成模式优化策略未来趋势数据一致性
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：大数
大数据新视界 -- 大数据大厂之 Impala 性能提升：高级执行计划优化实战案例（下）（18/30）青云交大数据新视界 #Impala 之道大数据 Impala 高级执行计划优化实战案例金融电商性能提升
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：大数
mindspeed-llm源码解析（一）preprocess_data 人工智能
mindspeed-llm是昇腾模型套件代码仓，原来叫"modelLink"。这篇文章带大家阅读一下数据处理脚本preprocess_data.py（基于1.0.0分支），数据处理是模型训练的第一步，经常会用到。文章中贴的源码加了相关注释，同学们可以把源码和注释结合起来看。首先来看一下main函数defmain():#获取入参，通过后面的代码可以知道有哪些关键参数args=get_args()#参
html2canvas 页面变图片
我们用的uni-app页面做的页面，需要把页面转成图片；问题1：不同的手机会偶发文字挤在一块，不是所有的都是那种问题2:图片出现加载不出来解决问题1:是因为我的文字写的居中，html2canvas居中会导致分布不均匀，有针对性的写样式font-smoothing:antialiased;-webkit-text-size-adjust:100%；letter-spacing:0.05em;解决问题
日志2025.1.16 science怪兽笔记 unity
日志2025.1.161.增加了手枪，霰弹枪，狙击枪所对应的动画//选择当前该播放的武器动画层（手枪，霰弹枪，狙击枪）privatevoidSwitchAnimationLayer(intlayerIndex){//将所有武器动画层的权重设置为0for(inti=1;i
移动终端基带芯片的基本架构介绍之二（移动终端中的基带芯片） a1809032425 网络通信学习
移动终端基带芯片的基本架构介绍之二（移动终端中的基带芯片）参考链接：https://blog.csdn.net/lxl584685501/article/details/46771429http://m.blog.csdn.net/blog/suipingsp/35280465http://m.blog.csdn.net/blog/suipingsp/35574959http://www.bubu
【YashanDB知识库】安装共享集群时报错：YAS-05721 数据库
本文内容来自YashanDB官网，原文内容请见https://www.yashandb.com/newsinfo/7919226.html?templateId=171...【标题】安装共享集群时报错：YAS-05721invalidinputparameter,reason:nodenameinvalid【问题分类】安装部署【关键字】YAS-05721、共享集群、主机名、特殊符号、中划线、部署【
PyTorch建模与应用：从深度学习到大模型屿小夏书籍推荐深度学习 pytorch 人工智能
文章目录一、内容简介二、值得一读1.从基础到深入，适合不同层次的读者2.丰富的实战案例3.全面的数据处理与模型构建三、适用人群1.AI技术初学者2.在校学生和从业者3.培训机构和高校教学四、总结一、内容简介《动手学PyTorch建模与应用:从深度学习到大模型》是一本从零基础上手深度学习和大模型的PyTorch实战指南。全书共11章，内容涵盖了从深度学习的基础概念到大语言模型的应用。第1章介绍了深度
【YashanDB知识库】YMP校验从yashandb同步到oracle的数据时，字段timestamp(0)出现不一致数据库
本文内容来自YashanDB官网，原文内容请见https://www.yashandb.com/newsinfo/7901520.html?templateId=171...问题现象在YMP校验过程中，从yashandb同步到oracle的数据时，字段timestamp(0)出现不一致问题的风险及影响YMP校验出现数据内容不一致问题影响的版本yashandb版本：23.2.7.101YMP版本：2
【YashanDB知识库】Hive 命令工具insert崖山数据库报错数据库
本文内容来自YashanDB官网，原文内容请见https://www.yashandb.com/newsinfo/7919217.html?templateId=171...【问题分类】功能兼容【关键字】spark30041、不兼容【问题描述】本项目的架构是hadoop+hive+yashandb使用崖山数据库，初始化所有的原数据表和数据新建表之后，插入数据时候报错，hadoopcode30041
会捡垃圾、能干家务，元萝卜“视觉+机械臂”技术扫地机器人首秀量子位
在2025开年科技盛宴CES（国际消费电子展）上，AI机器人无疑成为全场焦点，而其中来自中国科技企业展示和发布的仿生多关节机械手技术在扫地机器人产品上的应用，更获得了全球媒体的高度关注。通过将视觉感知与机械臂技术相结合，能够自主完成拾取垃圾入桶等任务，不仅展示了家用机器人发展的未来形态，也让大众看到了具身智能机器人融入家庭生活的广阔前景。随着大模型技术和具身智能浪潮汹涌而至，家用机器人正迎来全新发
论文翻译：A survey on large language model (LLM) security and privacy: The Good, The Bad, and The Ugly CSPhD-winston-杨帆论文翻译 LLMs-鲁棒性语言模型人工智能自然语言处理
Asurveyonlargelanguagemodel(LLM)securityandprivacy:TheGood,TheBad,andTheUglyhttps://www.sciencedirect.com/science/article/pii/S266729522400014X文章目录关于大型语言模型（LLM）安全性和隐私的调查：好的、坏的和丑陋的摘要1.引言2.背景2.1大型语言模型（L
vue3中的provide和inject实用案例之基于el-dialog的命令式弹框，直接一行js代码打开
需求场景某些情况下，我们要使用一个弹框组件的时候一般都是这样使用：Thisisadialogimport{ElDialog}from'element-plus'import{ref}from"vue";constdialogVisible=ref(false)constopen=()=>{dialogVisible.value=true}也就是说，每次想要有一个弹框打开功能都需要引入ElDialo
圈子交友app小程序公众号/圈子社群创建必须要注意的几个点
技术选型与平台搭建技术选型：根据需求选择合适的开发技术和框架。例如，对于跨平台应用，可以考虑使用vue、uniapp等前端框架；后端则可以选择php等组合，以保证数据处理的效率和安全性。平台搭建：搭建稳定、易用、美观的App、小程序或公众号平台。注重用户体验，确保界面简洁、操作流畅。用户体验优化界面设计：注重UI/UX设计，确保界面美观、简洁、易用。这有助于提升用户的满意度和忠诚度。交互流程：优化
现场签约！YashanDB加入国家新一代自主安全计算系统产业集群数据库sql运维服务器
现场签约!YashanDB加入国家新一代自主安全计算系统产业集群12月11日，在2024第二届国家新一代自主安全计算系统产业集群融通生态大会上，深圳计算科学研究院(简称：深算院)与长沙市国链安全可靠计算机产业促进中心(简称：国链中心)共同签署了自主安全计算项目合作协议，崖山数据库作为国产数据库厂商代表，加入国家新一代自主安全计算系统产业集群。国家新一代自主安全计算系统产业集群全面贯彻落实国家“两个
2025最新搭建交友平台/交友系统源码-支持H5小程序+带安装说明+可封装APP 前端后端软件工程php
在相亲交友领域，选择开发APP还是小程序，需要综合考虑多个因素，包括用户需求、功能丰富性、开发成本、维护成本、用户体验以及市场推广等。APP的优势功能丰富：APP可以实现更复杂的功能，满足用户多样化的需求。用户体验好：APP通常具有更好的界面设计和交互体验，能够提供更流畅的用户体验。离线使用：APP可以离线使用，无需依赖网络连接。推送消息和通知：APP可以实时推送消息和通知，提高用户活跃度和粘性。
手把手教你学simulink（79.1）--智能家居窗帘与窗户控制场景实例：基于Simulink设计和仿真一个智能窗帘与窗户控制系统，以实现对室内环境的有效管理小蘑菇二号手把手教你学 MATLAB 专栏手把手教你学 Simulink matlab simulink
目录智能窗帘与窗户控制系统场景下的天气适应性操作建模项目实例项目背景介绍系统架构1.传感器模块(Sensors)2.控制器模块(Controller)3.执行器模块(Actuator)4.通信模块(Communication)仿真实现步骤1.创建新的Simulink模型2.添加传感器模块光照传感器温度传感器天气传感器在Simulink中实现传感器模块3.添加控制器模块天气分析算法决策算法在Simu
遗传算法与深度学习实战（25）——使用Keras构建卷积神经网络盼小辉丶遗传算法与深度学习实战深度学习 keras cnn
遗传算法与深度学习实战（25）——使用Keras构建卷积神经网络0.前言1.卷积神经网络基本概念1.1卷积1.2步幅1.3填充1.4激活函数1.5池化2.使用Keras构建卷积神经网络3.CNN层的问题4.模型泛化小结系列链接0.前言卷积神经网络(ConvolutionalNeuralNetwork,CNN)的提出是为了解决传统神经网络的缺陷。即使对象位于图片中的不同位置或其在图像中具有不同占比，
嵌入式杂谈——（问题解决三：嵌入式中的数据类型） CV金科嵌入式杂谈蓝桥杯嵌入式硬件 stm32 c语言 keil
列举1.标准固定宽度整数类型这些类型定义在头文件中，用于明确指定数据的位数，适合嵌入式系统中需要精确控制数据大小的场景。类型位数范围（有符号）范围（无符号）说明int8_t8-128到127-8位有符号整数uint8_t8-0到2558位无符号整数int16_t16-32,768到32,767-16位有符号整数uint16_t16-0到65,53516位无符号整数int32_t32-2,147,4
Python进阶-在Ubuntu上部署Flask应用
随着云计算和容器化技术的普及，Linux服务器已成为部署Web应用程序的主流平台之一。Python作为一种简单易用的编程语言，适用于开发各种应用程序。本文将详细介绍如何在Ubuntu服务器上部署Python应用，包括环境准备、应用发布、配置反向代理（Nginx）、设置系统服务以及日志管理等步骤。一、部署准备在开始之前，请确保你具备以下条件：一台运行Ubuntu（如Ubuntu20.04或22.04
万字长文，k8s之父带你阅读 deployment 源码 go
4.3deploymentcontroller01DeploymentController是Kube-Controller-Manager中最常用的Controller之一管理Deployment资源。而Deployment的本质就是通过管理ReplicaSet和Pod在Kubernetes集群中部署无状态Workload。Deployment与控制器模式在K8s中，pod是最小的资源单位，而po
【华为OD-E卷 - 篮球比赛 100分（python、java、c++、js、c）】 CodeClimb 算法题华为od （A+B+C+D+E 卷）收录分享华为od python java c++javascript
【华为OD-E卷-篮球比赛100分（python、java、c++、js、c）】题目篮球(5V5)比赛中，每个球员拥有一个战斗力，每个队伍的所有球员战斗力之和为该队伍的总体战斗力。现有10个球员准备分为两队进行训练赛，教练希望2个队伍的战斗力差值能够尽可能的小，以达到最佳训练效果。给出10个球员的战斗力，如果你是教练，你该如何分队，才能达到最佳训练效果?请说出该分队方案下的最小战斗力差值输入描述0
202501015 C18298182575 数据库
为什么不遵循最左匹配原则会导致索引失效最左匹配原则原因为什么不遵循最左匹配原则会导致索引失效最左匹配原则原因_mob6454cc7a6087的技术博客_51CTO博客java事物失效原因Spring事务@Transactional常见的8种失效场景（通俗易懂）_事务失效的8大场景-CSDN博客sql优化方案sql优化的15个小技巧（必知五颗星），面试说出七八个就有了_sql优化常用的15种方法-C
iOS 集成 ijkplayer k0.11.9 过程
ijkplayerk0.11.9适用于iOS、tvOS、macOS三大平台，据说还会支持安卓平台。下面介绍三种常用的集成ijkplayer的方式：CocoaPods集成可通过CocoaPods快速集成到工程，方便快捷：pod"IJKMediaPlayerKit",:podspec=>'https://github.com/debugly/ijkplayer/releases/download/k0
深入解析Vue.js组件开发：从基础到进阶冷夜雨. vue.js
Vue.js作为一款渐进式的JavaScript框架，其独特的设计理念和易用性使得它在现代前端开发中占据了重要地位。Vue组件是Vue.js中最核心的组成部分，它是构建应用的基础单元，也是Vue项目模块化和重用的关键所在。在这篇文章中，我们将深入探讨Vue.js的组件开发，涵盖从基础到进阶的各个方面，包括组件的创建、通信、生命周期、性能优化等内容，帮助你掌握Vue组件开发的核心技巧。一、Vue组件
基于JavaScript的网页设计案例分析：打造现代化、交互性强的网站体验冷夜雨. javascript
引言随着互联网的快速发展，网页设计的要求也在不断提升。从最初的静态页面到如今的动态、交互式网页，JavaScript作为一种重要的前端开发语言，已成为现代网页设计中不可或缺的一部分。它能够为网页带来更强的交互性、灵活性和动态效果，不仅提升用户体验，也能在设计过程中实现更复杂的功能。本文将通过一个具体的JavaScript网页设计案例，来展示如何利用JavaScript打造现代化、交互性强的网站，并
mongodb3.03开启认证 21jhf mongodb
下载了最新mongodb3.03版本，当使用--auth 参数命令行开启mongodb用户认证时遇到很多问题，现总结如下：（百度上搜到的基本都是老版本的，看到db.addUser的就是，请忽略） Windows下我做了一个bat文件，用来启动mongodb，命令行如下： mongod --dbpath db\data --port 27017 --directoryperdb --logp
【Spark103】Task not serializable bit1129 Serializable
Task not serializable是Spark开发过程最令人头疼的问题之一，这里记录下出现这个问题的两个实例，一个是自己遇到的，另一个是stackoverflow上看到。等有时间了再仔细探究出现Task not serialiazable的各种原因以及出现问题后如何快速定位问题的所在，至少目前阶段碰到此类问题，没有什么章法 1. package spark.exampl
你所熟知的 LRU(最近最少使用) dalan_123 java
关于LRU这个名词在很多地方或听说，或使用，接下来看下lru缓存回收的实现 1、大体的想法 a、查询出最近最晚使用的项 b、给最近的使用的项做标记通过使用链表就可以完成这两个操作，关于最近最少使用的项只需要返回链表的尾部；标记最近使用的项，只需要将该项移除并放置到头部，那么难点就出现你如何能够快速在链表定位对应的该项？这时候多
Javascript 跨域周凡杨 JavaScript jsonp 跨域 cross-domain
linux下安装apache服务器 g21121 apache
安装apache 下载windows版本apache，下载地址：http://httpd.apache.org/download.cgi 1.windows下安装apache Windows下安装apache比较简单，注意选择路径和端口即可，这里就不再赘述了。 2.linux下安装apache：下载之后上传到linux的相关目录，这里指定为/home/apach
FineReport的JS编辑框和URL地址栏语法简介老A不折腾 finereport web报表报表软件语法总结
JS编辑框： 1.FineReport的js。作为一款BS产品，browser端的JavaScript是必不可少的。 FineReport中的js是已经调用了finereport.js的。大家知道，预览报表时，报表servlet会将cpt模板转为html，在这个html的head头部中会引入FineReport的js，这个finereport.js中包含了许多内置的fun
根据STATUS信息对MySQL进行优化墙头上一根草 status
mysql 查看当前正在执行的操作，即正在执行的sql语句的方法为: show processlist 命令 mysql> show global status;可以列出MySQL服务器运行各种状态值，我个人较喜欢的用法是show status like '查询值%';一、慢查询mysql> show variab
我的spring学习笔记7-Spring的Bean配置文件给Bean定义别名 aijuans Spring 3
本文介绍如何给Spring的Bean配置文件的Bean定义别名？原始的 <bean id="business" class="onlyfun.caterpillar.device.Business"> <property name="writer"> <ref b
高性能mysql 之性能剖析 annan211 性能 mysql mysql 性能剖析剖析
1 定义性能优化 mysql服务器性能，此处定义为响应时间。在解释性能优化之前，先来消除一个误解，很多人认为，性能优化就是降低cpu的利用率或者减少对资源的使用。这是一个陷阱。资源时用来消耗并用来工作的，所以有时候消耗更多的资源能够加快查询速度，保持cpu忙绿，这是必要的。很多时候发现编译进了新版本的InnoDB之后，cpu利用率上升的很厉害，这并不
主外键和索引唯一性约束百合不是茶索引唯一性约束主外键约束联机删除
目标;第一步;创建两张表用户表和文章表第二步;发表文章 1,建表; ---用户表 BlogUsers --userID唯一的 --userName --pwd --sex create
线程的调度 bijian1013 java 多线程 thread 线程的调度 java多线程
1. Java提供一个线程调度程序来监控程序中启动后进入可运行状态的所有线程。线程调度程序按照线程的优先级决定应调度哪些线程来执行。 2. 多数线程的调度是抢占式的（即我想中断程序运行就中断，不需要和将被中断的程序协商） a)
查看日志常用命令 bijian1013 linux 命令 unix
一.日志查找方法，可以用通配符查某台主机上的所有服务器grep "关键字" /wls/applogs/custom-*/error.log 二.查看日志常用命令1.grep '关键字' error.log：在error.log中搜索'关键字'2.grep -C10 '关键字' error.log：显示关键字前后10行记录3.grep '关键字' error.l
【持久化框架MyBatis3一】MyBatis版HelloWorld bit1129 helloworld
MyBatis这个系列的文章，主要参考《Java Persistence with MyBatis 3》。样例数据本文以MySQL数据库为例，建立一个STUDENTS表，插入两条数据，然后进行单表的增删改查 CREATE TABLE STUDENTS ( stud_id int(11) NOT NULL AUTO_INCREMENT,
【Hadoop十五】Hadoop Counter bit1129 hadoop
1. 只有Map任务的Map Reduce Job File System Counters FILE: Number of bytes read=3629530 FILE: Number of bytes written=98312 FILE: Number of read operations=0 FILE: Number of lar
解决Tomcat数据连接池无法释放 ronin47 tomcat 连接池　优化
近段时间，公司的检测中心报表系统(SMC)的开发人员时不时找到我，说用户老是出现无法登录的情况。前些日子因为手头上有Jboss集群的测试工作，发现用户不能登录时，都是在Tomcat中将这个项目Reload一下就好了，不过只是治标而已，因为大概几个小时之后又会再次出现无法登录的情况。今天上午，开发人员小毛又找到我，要我协助将这个问题根治一下，拖太久用户难保不投诉。简单分析了一
java-75-二叉树两结点的最低共同父结点 bylijinnan java
import java.util.LinkedList; import java.util.List; import ljn.help.*; public class BTreeLowestParentOfTwoNodes { public static void main(String[] args) { /* * node data is stored in
行业垂直搜索引擎网页抓取项目 carlwu Lucene Nutch Heritrix Solr
公司有一个搜索引擎项目，希望各路高人有空来帮忙指导，谢谢！这是详细需求：（1）通过提供的网站地址(大概100-200个网站)，网页抓取程序能不断抓取网页和其它类型的文件（如Excel、PDF、Word、ppt及zip类型），并且程序能够根据事先提供的规则，过滤掉不相干的下载内容。（2）程序能够搜索这些抓取的内容，并能对这些抓取文件按照油田名进行分类，然后放到服务器不同的目录中。
[通讯与服务]在总带宽资源没有大幅增加之前,不适宜大幅度降低资费 comsci 资源
降低通讯服务资费，就意味着有更多的用户进入，就意味着通讯服务提供商要接待和服务更多的用户，在总体运维成本没有由于技术升级而大幅下降的情况下，这种降低资费的行为将导致每个用户的平均带宽不断下降，而享受到的服务质量也在下降，这对用户和服务商都是不利的。。。。。。。。 &nbs
Java时区转换及时间格式 Cwind java
本文介绍Java API 中 Date, Calendar, TimeZone和DateFormat的使用，以及不同时区时间相互转化的方法和原理。问题描述：向处于不同时区的服务器发请求时需要考虑时区转换的问题。譬如，服务器位于东八区（北京时间，GMT+8:00），而身处东四区的用户想要查询当天的销售记录。则需把东四区的“今天”这个时间范围转换为服务器所在时区的时间范围。
readonly,只读，不可用 dashuaifu js jsp disable readOnly readOnly
readOnly 和 readonly 不同，在做js开发时一定要注意函数大小写和jsp黄线的警告！！！我就经历过这么一件事：使用readOnly在某些浏览器或同一浏览器不同版本有的可以实现“只读”功能，有的就不行，而且函数readOnly有黄线警告！！！就这样被折磨了不短时间！！！（期间使用过disable函数，但是发现disable函数之后后台接收不到前台的的数据！！！）
LABjs、RequireJS、SeaJS 介绍 dcj3sjt126com js Web
LABjs 的核心是 LAB（Loading and Blocking）：Loading 指异步并行加载，Blocking 是指同步等待执行。LABjs 通过优雅的语法（script 和 wait）实现了这两大特性，核心价值是性能优化。LABjs 是一个文件加载器。RequireJS 和 SeaJS 则是模块加载器，倡导的是一种模块化开发理念，核心价值是让 JavaScript 的模块化开发变得更
[应用结构]入口脚本 dcj3sjt126com PHP yii2
入口脚本入口脚本是应用启动流程中的第一环，一个应用（不管是网页应用还是控制台应用）只有一个入口脚本。终端用户的请求通过入口脚本实例化应用并将将请求转发到应用。 Web 应用的入口脚本必须放在终端用户能够访问的目录下，通常命名为 index.php，也可以使用 Web 服务器能定位到的其他名称。控制台应用的入口脚本一般在应用根目录下命名为 yii（后缀为.php），该文
haoop shell命令 eksliang hadoop hadoop shell
cat chgrp chmod chown copyFromLocal copyToLocal cp du dus expunge get getmerge ls lsr mkdir movefromLocal mv put rm rmr setrep stat tail test text
MultiStateView不同的状态下显示不同的界面 gundumw100 android
只要将指定的view放在该控件里面，可以该view在不同的状态下显示不同的界面，这对ListView很有用，比如加载界面，空白界面，错误界面。而且这些见面由你指定布局，非常灵活。 PS：ListView虽然可以设置一个EmptyView，但使用起来不方便，不灵活，有点累赘。 <com.kennyc.view.MultiStateView xmlns:android=&qu
jQuery实现页面内锚点平滑跳转 ini JavaScript html jquery html5 css
平时我们做导航滚动到内容都是通过锚点来做，刷的一下就直接跳到内容了，没有一丝的滚动效果，而且 url 链接最后会有“小尾巴”，就像#keleyi，今天我就介绍一款 jquery 做的滚动的特效，既可以设置滚动速度，又可以在 url 链接上没有“小尾巴”。效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/37.htmHTML文件代码： &
kafka offset迁移 kane_xie kafka
在早前的kafka版本中（0.8.0），offset是被存储在zookeeper中的。到当前版本（0.8.2）为止，kafka同时支持offset存储在zookeeper和offset manager（broker）中。从官方的说明来看，未来offset的zookeeper存储将会被弃用。因此现有的基于kafka的项目如果今后计划保持更新的话，可以考虑在合适
android > 搭建 cordova 环境 mft8899 android
1 , 安装 node.js http://nodejs.org node -v 查看版本 2, 安装 npm 可以先从 https://github.com/isaacs/npm/tags 下载源码解压到
java封装的比较器，比较是否全相同，获取不同字段名字 qifeifei
非常实用的java比较器，贴上代码： import java.util.HashSet; import java.util.List; import java.util.Set; import net.sf.json.JSONArray; import net.sf.json.JSONObject; import net.sf.json.JsonConfig; i
记录一些函数用法 .Aky. 位运算 PHP 数据库函数 IP
高手们照旧忽略。想弄个全天朝IP段数据库，找了个今天最新更新的国内所有运营商IP段，copy到文件，用文件函数，字符串函数把玩下。分割出startIp和endIp这样格式写入.txt文件，直接用phpmyadmin导入.csv文件的形式导入。（生命在于折腾，也许你们觉得我傻X，直接下载人家弄好的导入不就可以，做自己的菜鸟，让别人去说吧）当然用到了ip2long()函数把字符串转为整型数
sublime text 3 rust wudixiaotie Sublime Text
1.sublime text 3 => install package => Rust 2.cd ~/.config/sublime-text-3/Packages 3.mkdir rust 4.git clone https://github.com/sp0/rust-style 5.cd rust-style 6.cargo build --release 7.ctrl

spark 版本定制 第5课：基于案例一节课贯通Spark Streaming流计算框架运行源码11

你可能感兴趣的:(spark 版本定制 第5课：基于案例一节课贯通Spark Streaming流计算框架运行源码11)

spark 版本定制第5课：基于案例一节课贯通Spark Streaming流计算框架运行源码11

你可能感兴趣的:(spark 版本定制第5课：基于案例一节课贯通Spark Streaming流计算框架运行源码11)