柯里昂

spark 版本定制第5课：基于案例一节课贯通Spark Streaming流计算框架的运行源码6

先贴下案例源码

import org.apache.spark.SparkConf
import org.apache.spark.streaming.{Durations, StreamingContext}
/**
  * 感谢王家林老师的知识分享
  * 王家林老师名片：
  * 中国Spark第一人
  * 感谢王家林老师的知识分享
  * 新浪微博：http://weibo.com/ilovepains
  * 微信公众号：DT_Spark
  * 博客：http://blog.sina.com.cn/ilovepains
  * 手机：18610086859
  * QQ：1740415547
  * 邮箱：[email protected]
  * YY课堂：每天20:00免费现场授课频道68917580
  * 王家林：DT大数据梦工厂创始人、Spark亚太研究院院长和首席专家、大数据培训专家、大数据架构师。
  */
object StreamingWordCountSelfScala {
  def main(args: Array[String]) {
    val sparkConf = new SparkConf().setMaster("spark://master:7077").setAppName("StreamingWordCountSelfScala")
    val ssc = new StreamingContext(sparkConf, Durations.seconds(5)) // 每5秒收割一次数据
    val lines = ssc.socketTextStream("localhost", 9999) // 监听 本地9999 socket 端口
    val words = lines.flatMap(_.split(" ")).map((_, 1)).reduceByKey(_ + _) // flat map 后 reduce
    words.print() // 打印结果
    ssc.start() // 启动
    ssc.awaitTermination()
    ssc.stop(true)
  }
}

上文已经从源码分析到将Receiver作为RDD提交给Spark，本文将聚焦于Receiver在Spark 集群中执行的运行时。

提交给DAGScheduler，返回异步执行等待器JobWaiter。
返回SimpleFutureAction对象。

// SparkContext.scala line 1980
def submitJob[T, U, R](
    rdd: RDD[T], // 基于Receiver的RDD，见 ReceiverTracker.scala line 583
    processPartition: Iterator[T] => U, // 此参数为 startReceiverFunc ，见 ReceiverTracker.scala line 564
    partitions: Seq[Int], // 此处传入的是 Seq(0)，见 ReceiverTracker.scala line 595
    resultHandler: (Int, U) => Unit, // 调用时传入的是 (_, _) => Unit，因此 resultHandler = (_, _) => Unit，啥也没干。见 ReceiverTracker.scala line 595
    resultFunc: => R): SimpleFutureAction[R] = // 调用时是 (_, _) => Unit，因此 resultHandler = ()，啥也没干。见 ReceiverTracker.scala line 595
{
  assertNotStopped()
  val cleanF = clean(processPartition) // 加工
  val callSite = getCallSite
  val waiter = dagScheduler.submitJob( // 提交给DAGScheduler，返回JobWaiter类型对象，执行结果等待器
    rdd, 
    (context: TaskContext, iter: Iterator[T]) => cleanF(iter), // 构建同构方法签名
    partitions,
    callSite,
    resultHandler,
    localProperties.get) 
  new SimpleFutureAction(waiter, resultFunc)
}

看下DAGScheduler.submitJob的内容

// DAGScheduler.scala line 543
/**
 * Submit an action job to the scheduler.
 *
 * @param rdd target RDD to run tasks on
 * @param func a function to run on each partition of the RDD
 * @param partitions set of partitions to run on; some jobs may not want to compute on all
 *   partitions of the target RDD, e.g. for operations like first()
 * @param callSite where in the user program this job was called
 * @param resultHandler callback to pass each result to
 * @param properties scheduler properties to attach to this job, e.g. fair scheduler pool name
 *
 * @return a JobWaiter object that can be used to block until the job finishes executing
 *         or can be used to cancel the job.
 *
 * @throws IllegalArgumentException when partitions ids are illegal
 */
def submitJob[T, U](
    rdd: RDD[T], // 基于Receiver的RDD，见 ReceiverTracker.scala line 583
    func: (TaskContext, Iterator[T]) => U,
    partitions: Seq[Int], // 此处传入的是 Seq(0)，见 ReceiverTracker.scala line 595
    callSite: CallSite,
    resultHandler: (Int, U) => Unit, // 调用时传入的是 (_, _) => Unit，因此 resultHandler = (_, _) => Unit，啥也没干。见 ReceiverTracker.scala line 595
    properties: Properties): JobWaiter[U] = {
  // Check to make sure we are not launching a task on a partition that does not exist.
  val maxPartitions = rdd.partitions.length
  partitions.find(p => p >= maxPartitions || p < 0).foreach { p =>
    throw new IllegalArgumentException(
      "Attempting to access a non-existent partition: " + p + ". " +
        "Total number of partitions: " + maxPartitions)
  }

  val jobId = nextJobId.getAndIncrement() // 获取JobID
  if (partitions.size == 0) { // partitions = Seq(0) 因此，size==0 => false
    // Return immediately if the job is running 0 tasks
    return new JobWaiter[U](this, jobId, 0, resultHandler)
  }

  assert(partitions.size > 0)
  val func2 = func.asInstanceOf[(TaskContext, Iterator[_]) => _]  // 此时 方法签名已经将输出弱化了，输出什么已经不重要了。
  val waiter = new JobWaiter(this, jobId, partitions.size, resultHandler) // 实例化JobWaiter，因为基于不同的调度模式，可能会排队。异步等待来接收结果。
  eventProcessLoop.post(JobSubmitted( // 提交JobSubmitted类型的case class给eventProcessLoop
    jobId, rdd, func2, partitions.toArray, callSite, waiter,
    SerializationUtils.clone(properties)))
  waiter // 返回结果
}

了解下这个事件的定义

看下JobSubmitted这个case class。继承自

// DAGSchedulerEvent.scala line 39
/** A result-yielding job was submitted on a target RDD */
private[scheduler] case class JobSubmitted(
    jobId: Int,
    finalRDD: RDD[_],
    func: (TaskContext, Iterator[_]) => _,
    partitions: Array[Int],
    callSite: CallSite,
    listener: JobListener,
    properties: Properties = null)
  extends DAGSchedulerEvent

// DAGSchedulerEvent.scala line 30
/**
 * Types of events that can be handled by the DAGScheduler. The DAGScheduler uses an event queue
 * architecture where any thread can post an event (e.g. a task finishing or a new job being
 * submitted) but there is a single "logic" thread that reads these events and takes decisions.
 * This greatly simplifies synchronization.
 */
private[scheduler] sealed trait DAGSchedulerEvent

此时将event post到DAGSchedulerEventLoop中的eventQueue。这个对象是在SparkContext创建的时候实例化的。这个属于Spark Core的内容了。后续给出Spark Core的流程源码解析，请关注。为了延续上下文，简单介绍下。

实例化SparkContext时，再构造中也同时构造了DAGScheduler

// SparkContext.scala line 525
_dagScheduler = new DAGScheduler(this)

DAGScheduler在实例化时，实例化了DAGSchedulerEventProcessLoop

// DAGScheduler.scala line 184
private[scheduler] val eventProcessLoop = new DAGSchedulerEventProcessLoop(this)

看下DAGSchedulerEventProcessLoop的实例化过程。DAGSchedulerEventProcessLoop继承自EventLoop

// DAGScheduler.scala line 1588
private[scheduler] class DAGSchedulerEventProcessLoop(dagScheduler: DAGScheduler)
  extends EventLoop[DAGSchedulerEvent]("dag-scheduler-event-loop") with Logging

父类EventLoop是一个抽象类，构造很关键。

实例化一个LinkedBlockingDeque的阻塞队列
有一个，只有一个线程，不停的串行的从队列中的取出一个事件，具体如何处理。有兴趣的读者可以看DAGScheduler.scala line 1605 doOnReceive
定义了onStart方法，供子类重写，以便在start前被调用
定义了往队列中加入内容的post方法

DAGSchedulerEventProcessLoop实例化完成后，EventLoop中的线程并没有启动。

// EventLoop.scala line 34
/**
 * An event loop to receive events from the caller and process all events in the event thread. It
 * will start an exclusive event thread to process all events.
 *
 * Note: The event queue will grow indefinitely. So subclasses should make sure `onReceive` can
 * handle events in time to avoid the potential OOM.
 */
private[spark] abstract class EventLoop[E](name: String) extends Logging {

  private val eventQueue: BlockingQueue[E] = new LinkedBlockingDeque[E]() // 有一个阻塞的队列，实现是LinkedBlockingDeque

  private val stopped = new AtomicBoolean(false)

  private val eventThread = new Thread(name) {
    setDaemon(true)

    override def run(): Unit = {
      try {
        while (!stopped.get) {
          val event = eventQueue.take()
          try {
            onReceive(event)
          } catch {
            case NonFatal(e) => {
              try {
                onError(e)
              } catch {
                case NonFatal(e) => logError("Unexpected error in " + name, e)
              }
            }
          }
        }
      } catch {
        case ie: InterruptedException => // exit even if eventQueue is not empty
        case NonFatal(e) => logError("Unexpected error in " + name, e)
      }
    }

  }

  def start(): Unit = {
    if (stopped.get) {
      throw new IllegalStateException(name + " has already been stopped")
    }
    // Call onStart before starting the event thread to make sure it happens before onReceive
    onStart()
    eventThread.start()
  }

  def stop(): Unit = {
    if (stopped.compareAndSet(false, true)) {
      eventThread.interrupt()
      var onStopCalled = false
      try {
        eventThread.join()
        // Call onStop after the event thread exits to make sure onReceive happens before onStop
        onStopCalled = true
        onStop()
      } catch {
        case ie: InterruptedException =>
          Thread.currentThread().interrupt()
          if (!onStopCalled) {
            // ie is thrown from `eventThread.join()`. Otherwise, we should not call `onStop` since
            // it's already called.
            onStop()
          }
      }
    } else {
      // Keep quiet to allow calling `stop` multiple times.
    }
  }
  /**
   * Put the event into the event queue. The event thread will process it later.
   */
  def post(event: E): Unit = {
    eventQueue.put(event)
  }
  /**
   * Return if the event thread has already been started but not yet stopped.
   */
  def isActive: Boolean = eventThread.isAlive
  ...
  // 其他方法
  /**
 * Invoked when `start()` is called but before the event thread starts.
 */
  protected def onStart(): Unit = {}  
  // 其他方法
}

真正启动线程是在DAGScheduler的构造中。隐藏的很深。

// DAGScheduler.scala line 1585
eventProcessLoop.start()

至此，DAGScheduler中的事件消费线程启动了。

让我们再回到提交任务至Spark的场景。任务提交时，已经将JobWaiter的句柄也传递过去了。此时，直接返回JobWaiter的对象。

当处理到JobSubmitted类型的任务时，

// EventLoop.scala line 43
override def run(): Unit = {
  try {
    while (!stopped.get) {
      val event = eventQueue.take() // 取到的是JobSubmitted case class
      try {
        onReceive(event)
      } catch {
        case NonFatal(e) => {
          try {
            onError(e)
          } catch {
            case NonFatal(e) => logError("Unexpected error in " + name, e)
          }
        }
      }
    }
  } catch {
    case ie: InterruptedException => // exit even if eventQueue is not empty
    case NonFatal(e) => logError("Unexpected error in " + name, e)
  }
}

追踪

// DAGScheduler.scala line 1596
/**
 * The main event loop of the DAG scheduler.
 */
override def onReceive(event: DAGSchedulerEvent): Unit = {
  val timerContext = timer.time()
  try {
    doOnReceive(event)
  } finally {
    timerContext.stop()
  }
}

深入

// DAGScheduler.scala line 1605
private def doOnReceive(event: DAGSchedulerEvent): Unit = event match {
  case JobSubmitted(jobId, rdd, func, partitions, callSite, listener, properties) =>
    dagScheduler.handleJobSubmitted(jobId, rdd, func, partitions, callSite, listener, properties)
  ...
  // 其他 case class 的处理
}

按照常理，此处应该有广告！

且听下回分解。

王家林老师名片：

中国Spark第一人

感谢王家林老师的知识分享

新浪微博：http://weibo.com/ilovepains

微信公众号：DT_Spark

YY课堂：每天20:00免费现场授课频道68917580

0基础学Python第八天 RUIOU_ python 机器学习 0基础开发语言
1.程序报错：程序在哪一行报错之后，后面的程序都不会被执行。（1）异常类型：IndexError——索引错误，ZeroDivisionError——除零错误FileNotFoundError——找不到文件错误，TypeError——类型错误等2.捕捉异常：格式——try，except语句：try:可能会产生报错的代码except你想捕捉错误的名字（异常类型）：错误发生后你想相应执行的操作excep
MCU与SOC的区别 winds～ ADAS相关单片机嵌入式硬件
自动驾驶中MCU与SoC的区别在自动驾驶系统中，**MCU（微控制单元，MicrocontrollerUnit）和SoC（系统级芯片，SystemonChip）**都是关键的电子元件，但它们在性能、功能和应用领域等方面存在显著区别。一、定义与基本概念1.MCU（微控制单元）组成：MCU是一种集成了处理器核心（通常为微型处理器）、内存（如闪存和RAM）以及输入/输出（I/O）接口的单片集成电路。特点
WPF中Grid自动布局 Now喔 WPF wpf
控件功能根据自定义行和列，快速进行排列，能够进行自定义控件间距离，减少元素进行定义间距，同时能更好的维护界面排序。代码部分usingSystem.ComponentModel;usingSystem.Windows;usingSystem.Windows.Controls;namespaceWPFApp{publicclassAutoGrid:Grid{//////列定义例如："100,*,100
Vue3-导出导入excel Now喔 Vue excel
功能主要实现excel导入导出功能，同时具有合并单元格，美化单元格等功能，引用依赖包exceljs、file-saver，好像也没有什么要介绍的，可以看看官网文档然后直接使用了导入依赖包pnpminstallexceljsfile-saver@types/file-saver封装Excel帮助类（excelHelper.js）importExcelJSfrom'exceljs'importFile
WPF学习笔记04-控件Control_Part1 一只只对技术感兴趣的程序员 WPF学习 wpf 学习 ui
之前我们已经学习过WPF布局了，这节我们开始简单介绍下控件。熟悉Winform的应该对控件并不陌生。WPF和Winform的渲染也是不一样的一个是基于DirectX一个是基于GDI+。在WPF中，打交道最多的控件无非就那么几种。1）布局控件。之前介绍过的，可以容纳多个控件或嵌套其他布局控件，用于在UI上组织和排列控件。比如StackPanel、Grid等控件都属于此类控件，他们都拥有共同父类---
并发编程--僵尸进程 k要开心进程并发编程开发语言 c语言
僵尸进程文章目录僵尸进程1.概念2.产生的原因3.释放僵尸进程3.1方法一：父进程直接退出3.2方法二：子进程等待父进程对其执行wait()/waitpid()3.3方法三：子进程主动告知父进程前来收尸1.概念僵尸进程指的是处于僵尸态的进程，这种进程无法进行调度，但其所占用的系统资源并未被释放。僵尸态是进程生命周期的必经阶段，是无法避免的，但为了节约系统资源，应尽快清理腾出僵尸态进程所占用的内存资
并发编程--进程间通信（IPC）概览以及匿名管道 k要开心进程并发编程 c语言开发语言
进程间通信（IPC）概览以及匿名管道1.进程间通信（IPC）概览2.匿名管道PIPE2.1基本逻辑2.2函数接口2.3管道的读写特性2.4管道的阻塞特性1.进程间通信（IPC）概览在Linux/Unix系统中，进程间通信方式（Inter-ProcessComunication）通常有如下若干中方式：管道匿名管道pipe：适用于亲缘关系进程间的、一对一的通信具名管道fifo：适用于任何进程间的一对一
神经网络中常用语言特性（python）（待完善）邪恶的贝利亚 python 开发语言
1.元类在Python中，abc模块（AbstractBaseClasses，抽象基类）提供了创建抽象基类的机制，这些抽象基类可以用来定义接口，强制子类实现特定的方法，有助于实现多态性和代码的可维护性。下面从多个方面详细介绍abc元类相关内容。ABCMeta是abc模块中的元类，ABC类实际上就是使用ABCMeta作为元类创建的。你也可以直接使用ABCMeta来创建抽象基类。classShape(
prompt工程起步邪恶的贝利亚 prompt python 开发语言
1.手工提示词有关CLIP和ActionClip的手工特征,也是一个进步。通过给标签填入不同的修饰语当中，组成一段话来,来增强语义理解deftext_prompt(data):text_aug=[f"aphotoofaction{{}}",f"apictureofaction{{}}",f"Humanactionof{{}}",f"{{}},anaction",f"{{}}thisisanacti
前端面试：React hooks 调用是可以写在 if 语句里面吗？ returnShitBoy 前端 react.js javascript
在React中，Hooks是一种新的特性，允许你在函数组件中使用状态（state）和其他React特性。非常重要的一点是，ReactHooks必须遵循特定的规则，以确保组件的行为一致。ReactHooks使用规则只能在函数组件中调用Hook：你只能在React的函数组件或自定义Hooks中调用Hook，而不能在普通JavaScript函数中调用它们。不能在条件语句中调用Hook：Hooks不能放在
2025年渗透测试面试题总结-安恒（题目+回答）独行soc 2025年渗透测试面试指南面试职场和发展安全 web安全红蓝攻防
网络安全领域各种资源，学习文档，以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具，欢迎关注。目录安恒1.sqlmap爆出当前数据库库名的参数是什么？2.nmap探测系统类型的参数是？3.nmap的小写-o和-A是做啥的？4.布尔盲注的具体语句是啥？5.宽字节原理6.Python是否存在反序列化漏洞？7.GET与POST传参的区别8.HTTP请求方式9.如何判断C
嵌入式软件工程师为什么要撰写博客？——开启技术进阶与职业发展的双重大门 Electron-er 软件需求嵌入式硬件架构单片机人工智能
目录一、技术沉淀：构建嵌入式知识复利系统知识沉淀的三层架构二、职业发展：量化个人技术品牌价值职业价值评估模型三、社区贡献：推动嵌入式技术生态演进知识传播的涟漪效应四、写作方法论：打造专业级技术博客内容开发五步法可视化增强技术五、数据验证：博客投资回报率分析六、实践指南：从入门到专家的路径规划博客运营路线图关键成功要素结语一、技术沉淀：构建嵌入式知识复利系统在嵌入式开发领域，寄存器操作、RTOS调度
WPF的五种绑定模式 WangPride wpf
WPF的五种绑定模式WPF的绑定模式(mode)是枚举的，枚举值共有5个：1、OneWay(源变就更新目标属性)2、TwoWay(源变就更新目标并且目标变就更新源)3、OneTime(只根据源来设置目标，以后都不会变)4、OneWayToSource(与OneWay相反)5、Default(可以单向或双向，是靠被值定的源或目标是否有get过set来指定的)WPF的逻辑树与视觉树基本概念：与ASP.
C# BlockingCollection 卷纸要用清风的 C#c#java linux
什么是`BlockingCollection`主要特点构造函数常用方法生产者操作消费者操作示例代码注意事项串口接收底层存储的类型线程安全和并发访问串口数据接收的顺序性关键点BlockingCollection是C#中一个非常有用的线程安全集合类，位于System.Collections.Concurrent命名空间中。它主要用于在多线程环境中实现线程安全的生产者-消费者模式。以下是关于Blocki
深入解析ADC寄存器：从原理到实战配置 Electron-er 嵌入式硬件单片机架构 stm32
目录引言一、ADC寄存器核心作用与分类1.寄存器在ADC中的角色2.寄存器典型分类二、STM32ADC寄存器深度解析1.关键寄存器映射表2.寄存器级ADC配置实战三、TIADS1115配置寄存器详解1.16位配置寄存器结构（I2C从地址0x48）2.**I2C配置代码示例（Arduino平台）**四、寄存器操作中的常见陷阱与解决方案1.典型问题排查表2.**调试技巧**五、寄存器优化设计趋势1.自
深入解析STM32时钟树：从原理到实战配置 Electron-er stm32 单片机嵌入式硬件
目录引言一、STM32时钟树体系架构解析1.1时钟树全景图1.2核心时钟源详解二、时钟信号流向与控制逻辑2.1主时钟路径2.2关键分频系数2.3时钟门控机制三、CubeMX实战配置3.1配置步骤演示3.2代码生成分析四、调试技巧与常见问题4.1时钟诊断方法4.2典型故障排查五、高级应用技巧5.1动态时钟切换5.2时钟安全系统(CSS)5.3超频实践（风险提示）结语引言在嵌入式系统开发中，时钟系统堪
深入解析模拟/数字转换（ADC）：从原理到应用实践 Electron-er 单片机 stm32 嵌入式硬件
目录引言一、ADC的核心概念与技术指标1.ADC的定义与基本原理2.关键性能指标二、主流ADC架构及适用场景1.逐次逼近型（SARADC）2.积分型（双斜ADC）3.流水线型（PipelineADC）4.Σ-Δ型ADC三、ADC在嵌入式开发中的实践1.STM32的ADC配置实例2.抗干扰设计技巧四、ADC的行业应用与前沿趋势1.核心应用领域2.技术发展趋势五、开发避坑指南结语标签：模数转换、嵌入式
PHP火山引擎API签名方法蚊子爱喝水 PHP 火山引擎
一、前置准备在开始签名之前，需要准备以下信息：AccessKeyID（AK）：请求火山引擎OpenAPI的安全凭证之一。SecretAccessKey（SK）：与AK成对使用，用于签名计算。请求参数：包括HTTP请求方法、URI、查询参数、请求头等。二、签名流程(文档地址)火山引擎API签名流程大致分为以下几个步骤：创建规范请求：将请求参数进行规范化处理，形成CanonicalRequest。创建
以STM32为例-通俗语言理解SPI通信协议 Electron-er STM32 stm32 单片机 51单片机物联网嵌入式硬件 iot
文章目录SPI是什么四条“车道”的作用工作模式就像“舞蹈的节奏”通信过程是“一场对话”SPI通信的“厉害之处和用途”SPI是什么想象SPI是一个小小的数据高速公路，专门用于让STM32芯片和其他设备（比如传感器或者存储卡）之间快速地传递信息。这条高速公路有四条“车道”，分别有不同的用途。四条“车道”的作用1.主设备输出/从设备输入线（MOSI）：这就好比是主设备（STM32）的一个“说话通道”。主
阿里云国际站代理商：怎样量化虚拟世界的QoE体验指标？ linglideman 阿里云
1.沉浸体验质量（QImE）沉浸体验质量主要衡量虚拟世界中视觉和听觉的沉浸感，包括以下几个关键指标：视频质量（QP）：考虑视频的平均码率（Brv）、帧率（FR）、分辨率（Rh、Rv）、视场角（FoVh）以及编码标准（Codecv）等因素。音频质量（QA）：涉及音频的平均码率（Bra）、声道数（NAC）、采样率（Sra）和编码标准（Codeca）。音视频同步时延（Tasyn）：衡量音视频的同步性，影
今天项目中出现了一个xss漏洞 hello_simon php html hacker
代码是这样的：xxxx.com/en/index?siteId=">alert(document.cookie)smartyget没做过滤的，有点坑
strtr和str_replace效率探索 hello_simon php
今天写代码用到字符串规制，就上网查了下strtr与str_replace的效率如何，网上一些地方说strtr比str_replace快四倍。半信半疑，自己就做了下测试。strtr比较怪异，用法这里不提。只做两种这两个函数可以替换用的测试例子。第一种list($usec,$sec)=explode('',microtime());$star=$usec+$sec;$string='paocaiasd
pdf怎么转换成word？解锁 PDF 转 Word 的高效转换方法，轻松搞定的实用指南 hello_simon 在线工具 php 工具效率 pdf word PDF转word pdf转换
PDF转换成Word的简易指南在日常的工作和学习中，我们经常需要将PDF文件转换为Word文档，以便于编辑和修改。今天，我将为大家介绍一个简单的方法，利用小白工具网站，轻松实现PDF到Word的转换。一、访问小白工具网站首先，打开你的浏览器，输入网址：https://www.xiaobaitool.net/files/pdf-word/，进入小白工具的PDF转Word页面。这个网站提供了一个在线转
Linux 让PHP支持MSSQL hello_simon php linux
FreeTDS官方网站：http://www.freetds.org当前版本0.82wgethttp://mirrors.xmu.edu.cn/ubuntu/archive/pool/main/f/freetds/freetds_0.82.orig.tar.gz1.编译FreeTDS#tarzxvffreetds-0.82.tar.gz#cdfreetds-0.82//--with-tdsver=
2025版最新如何参加护网行动？零基础入门到精通，收藏这篇就够了！程序媛西米网络安全 web安全网络安全 HVV 护网行动网络安全计算机
1.什么是护网行动护网行动是以公安部牵头的，用以评估企事业单位的网络安全的活动。具体实践中，公安部会组织攻防两方，进攻方会在一个月内对防守方发动网络攻击，检测出防守方（企事业单位）存在的安全漏洞。通过与进攻方的对抗，企事业单位网络、系统以及设备等的安全能力会大大提高。“护网行动”是国家应对网络安全问题所做的重要布局之一。“护网行动”从2016年开始，随着我国对网络安全的重视，涉及单位不断扩大，越来
CES Asia2025新机制引关注，科技创新奖申报火热赛逸展张胜科技
随着2025第七届亚洲消费电子技术贸易展（赛逸展）“展位即门票”机制的推出，科技创新奖的申报工作也正式拉开帷幕。截至目前，已有数十家企业提交了申报材料，涵盖人工智能、物联网、智能硬件等多个热门领域。据了解，CESAsia2025科技创新奖旨在表彰在科技研发和产品创新方面取得卓越成就的企业。此次申报面向所有预订展位的参展企业，评审过程将由行业专家、院士，协会，学者和媒体代表共同参与，确保评选结果的公
【大模型LLM面试合集】分布式训练_总结 X.AI666 大模型LLM面试合集面试分布式人工智能语言模型
9.总结1.数据并行数据并行，由于其原理相对比较简单，是目前使用最广泛的分布式并行技术。数据并行不仅仅指对训练的数据并行操作，还可以对网络模型梯度、权重参数、优化器状态等数据进行并行。我们首先以PyTorch数据并行的发展（DataParallel、DistributedDataParallel、FullyShardedDataParallel）为主线进行讲述了数据并行的技术原理。同时，也简述了D
输电线路参数测试：参数解读及运用指南武汉凯迪正大电缆线路测试系统经验分享笔记其他百度生活交友学习
在智能电网建设中，输电线路的工频参数（如正序电容、零序阻抗等）直接影响电力系统的稳定性和继电保护装置的整定精度。传统测试方法面临强电场干扰、接线复杂等难题，本文将以KDGXG-I型测试仪为例，从工作原理、参数解读到实操指南，带您全面了解这一电力测试领域的黑科技。一、工作原理：如何突破强电场干扰？KDGXG-I采用双频智能变频技术，如同为仪器配备了"降噪耳机"：变频电源模块：输出47.5Hz/52.
三分钟掌握音视频信息查询 | 在 Rust 中优雅地集成 FFmpeg Yeauty 音视频 rust ffmpeg
前言在音视频处理领域，开发者常常需要获取媒体文件的详细信息，如时长、格式、元数据，以及音视频流的编码参数等。这些信息对于媒体管理、转码调度、播放控制等场景至关重要。然而，直接使用FFmpeg命令行工具或其原生API存在以下挑战：命令行工具的复杂性：FFmpeg的命令行参数众多且复杂，使用不当可能导致错误。例如，处理包含空格的文件名时，需要特别注意正确的转义和引用方式，否则可能导致无法识别文件名的问
《react》前端面试题微光面试题 react.js 前端 javascript
说说你对reacthook的理解ReactHooks是React16.8版本引入的一种新的特性，它允许在不编写class的情况下使用state和其他React特性。我的理解主要集中在以下几个方面：函数组件的状态管理：Hooks提供了useState这样的钩子函数，使得我们可以在函数组件中使用状态（state），而不需要将组件转换为class组件。这简化了代码，并使组件的逻辑更易于理解和维护。副作用
如何用ruby来写hadoop的mapreduce并生成jar包 wudixiaotie mapreduce
ruby来写hadoop的mapreduce，我用的方法是rubydoop。怎么配置环境呢： 1.安装rvm：不说了网上有 2.安装ruby：由于我以前是做ruby的，所以习惯性的先安装了ruby，起码调试起来比jruby快多了。 3.安装jruby： rvm install jruby然后等待安
java编程思想 -- 访问控制权限百合不是茶 java 访问控制权限单例模式
访问权限是java中一个比较中要的知识点,它规定者什么方法可以访问,什么不可以访问一:包访问权限; 自定义包: package com.wj.control; //包 public class Demo { //定义一个无参的方法 public void DemoPackage(){ System.out.println("调用
[生物与医学]请审慎食用小龙虾 comsci 生物
现在的餐馆里面出售的小龙虾,有一些是在野外捕捉的,这些小龙虾身体里面可能带有某些病毒和细菌,人食用以后可能会导致一些疾病,严重的甚至会死亡..... 所以,参加聚餐的时候,最好不要点小龙虾...就吃养殖的猪肉,牛肉,羊肉和鱼,等动物蛋白质
org.apache.jasper.JasperException: Unable to compile class for JSP: 商人shang maven 2.2 jdk1.8
环境： jdk1.8 maven tomcat7-maven-plugin 2.0 原因： tomcat7-maven-plugin 2.0 不知吃 jdk 1.8，换成 tomcat7-maven-plugin 2.2就行，即 <plugin>
你的垃圾你处理掉了吗?GC oloz GC
前序:本人菜鸟，此文研究学习来自网络，各位牛牛多指教　 1.垃圾收集算法的核心思想　　Java语言建立了垃圾收集机制，用以跟踪正在使用的对象和发现并回收不再使用(引用)的对象。该机制可以有效防范动态内存分配中可能发生的两个危险：因内存垃圾过多而引发的内存耗尽，以及不恰当的内存释放所造成的内存非法引用。　　垃圾收集算法的核心思想是：对虚拟机可用内存空间，即堆空间中的对象进行识别
shiro 和 SESSSION 杨白白 shiro
shiro 在web项目里默认使用的是web容器提供的session，也就是说shiro使用的session是web容器产生的，并不是自己产生的，在用于非web环境时可用其他来源代替。在web工程启动的时候它就和容器绑定在了一起，这是通过web.xml里面的shiroFilter实现的。通过session.getSession()方法会在浏览器cokkice产生JESSIONID，当关闭浏览器，此
移动互联网终端淘宝客如何实现盈利小桔子移動客戶端淘客淘寶App
2012年淘宝联盟平台为站长和淘宝客带来的分成收入突破30亿元，同比增长100%。而来自移动端的分成达1亿元，其中美丽说、蘑菇街、果库、口袋购物等App运营商分成近5000万元。可以看出，虽然目前阶段PC端对于淘客而言仍旧是盈利的大头，但移动端已经呈现出爆发之势。而且这个势头将随着智能终端(手机，平板)的加速普及而更加迅猛
wordpress小工具制作 aichenglong wordpress 小工具
wordpress 使用侧边栏的小工具，很方便调整页面结构小工具的制作过程 1 在自己的主题文件中新建一个文件夹(如widget)，在文件夹中创建一个php(AWP_posts-category.php) 小工具是一个类,想侧边栏一样，还得使用代码注册，他才可以再后台使用，基本的代码一层不变 <?php class AWP_Post_Category extends WP_Wi
JS微信分享 AILIKES js
// 所有功能必须包含在 WeixinApi.ready 中进行 WeixinApi.ready(function(Api) { // 微信分享的数据 var wxData = { &nb
封装探讨百合不是茶 JAVA面向对象封装
//封装属性方法将某些东西包装在一起，通过创建对象或使用静态的方法来调用，称为封装；封装其实就是有选择性地公开或隐藏某些信息，它解决了数据的安全性问题，增加代码的可读性和可维护性在 Aname类中申明三个属性，将其封装在一个类中：通过对象来调用例如 1： //属性将其设为私有姓名 name 可以公开
jquery radio/checkbox change事件不能触发的问题 bijian1013 JavaScript jquery
我想让radio来控制当前我选择的是机动车还是特种车，如下所示： <html> <head> <script src="http://ajax.googleapis.com/ajax/libs/jquery/1.7.1/jquery.min.js" type="text/javascript"><
AngularJS中安全性措施 bijian1013 JavaScript AngularJS 安全性 XSRF JSON漏洞
在使用web应用中，安全性是应该首要考虑的一个问题。AngularJS提供了一些辅助机制，用来防护来自两个常见攻击方向的网络攻击。一.JSON漏洞当使用一个GET请求获取JSON数组信息的时候（尤其是当这一信息非常敏感，
[Maven学习笔记九]Maven发布web项目 bit1129 maven
基于Maven的web项目的标准项目结构 user-project user-core user-service user-web src
【Hive七】Hive用户自定义聚合函数(UDAF) bit1129 hive
用户自定义聚合函数，用户提供的多个入参通过聚合计算(求和、求最大值、求最小值)得到一个聚合计算结果的函数。问题：UDF也可以提供输入多个参数然后输出一个结果的运算，比如加法运算add(3，5)，add这个UDF需要实现UDF的evaluate方法,那么UDF和UDAF的实质分别究竟是什么？ Double evaluate(Double a, Double b)
通过 nginx-lua 给 Nginx 增加 OAuth 支持 ronin47
前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGeek 在过去几年中取得了发展，我们已经积累了不少针对各种任务的不同管理接口。我们通常为新的展示需求创建新模块，比如我们自己的博客、图表等。我们还定期开发内部工具来处理诸如部署、可视化操作及事件处理等事务。在处理这些事务中，我们使用了几个不同的接口来认证： &n
利用tomcat-redis-session-manager做session同步时自定义类对象属性保存不上的解决方法 bsr1983 session
在利用tomcat-redis-session-manager做session同步时，遇到了在session保存一个自定义对象时，修改该对象中的某个属性，session未进行序列化，属性没有被存储到redis中。在 tomcat-redis-session-manager的github上有如下说明： Session Change Tracking As noted in the &qu
《代码大全》表驱动法-Table Driven Approach-1 bylijinnan java 算法
关于Table Driven Approach的一篇非常好的文章： http://www.codeproject.com/Articles/42732/Table-driven-Approach package com.ljn.base; import java.util.Random; public class TableDriven { public
Sybase封锁原理 chicony Sybase
昨天在操作Sybase IQ12.7时意外操作造成了数据库表锁定，不能删除被锁定表数据也不能往其中写入数据。由于着急往该表抽入数据，因此立马着手解决该表的解锁问题。无奈此前没有接触过Sybase IQ12.7这套数据库产品，加之当时已属于下班时间无法求助于支持人员支持，因此只有借助搜索引擎强大的
java异常处理机制 CrazyMizzz java
java异常关键字有以下几个，分别为 try catch final throw throws 他们的定义分别为 try： Opening exception-handling statement. catch： Captures the exception. finally： Runs its code before terminating
hive 数据插入DML语法汇总 daizj hive DML 数据插入
Hive的数据插入DML语法汇总1、Loading files into tables语法：1) LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]解释：1)、上面命令执行环境为hive客户端环境下： hive>l
工厂设计模式 dcj3sjt126com 设计模式
使用设计模式是促进最佳实践和良好设计的好办法。设计模式可以提供针对常见的编程问题的灵活的解决方案。工厂模式工厂模式（Factory）允许你在代码执行时实例化对象。它之所以被称为工厂模式是因为它负责“生产”对象。工厂方法的参数是你要生成的对象对应的类名称。 Example #1 调用工厂方法（带参数） <?phpclass Example{
mysql字符串查找函数 dcj3sjt126com mysql
FIND_IN_SET(str,strlist) 假如字符串str 在由N 子链组成的字符串列表strlist 中，则返回值的范围在1到 N 之间。一个字符串列表就是一个由一些被‘,’符号分开的自链组成的字符串。如果第一个参数是一个常数字符串，而第二个是type SET列，则 FIND_IN_SET() 函数被优化，使用比特计算。如果str不在strlist 或st
jvm内存管理 easterfly jvm
一、JVM堆内存的划分分为年轻代和年老代。年轻代又分为三部分：一个eden,两个survivor。工作过程是这样的：e区空间满了后，执行minor gc，存活下来的对象放入s0, 对s0仍会进行minor gc，存活下来的的对象放入s1中，对s1同样执行minor gc，依旧存活的对象就放入年老代中；年老代满了之后会执行major gc，这个是stop the word模式，执行
CentOS-6.3安装配置JDK-8 gengzg centos
JAVA_HOME=/usr/java/jdk1.8.0_45 JRE_HOME=/usr/java/jdk1.8.0_45/jre PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib export JAVA_HOME
【转】关于web路径的获取方法 huangyc1210 Web 路径
假定你的web application 名称为news,你在浏览器中输入请求路径： http://localhost:8080/news/main/list.jsp 则执行下面向行代码后打印出如下结果： 1、 System.out.println(request.getContextPath()); //可返回站点的根路径。也就是项
php里获取第一个中文首字母并排序远去的渡口数据结构 PHP
很久没来更新博客了，还是觉得工作需要多总结的好。今天来更新一个自己认为比较有成就的问题吧。最近在做储值结算，需求里结算首页需要按门店的首字母A-Z排序。我的数据结构原本是这样的： Array ( [0] => Array ( [sid] => 2885842 [recetcstoredpay] =&g
java内部类 hm4123660 java 内部类匿名内部类成员内部类方法内部类
　在Java中，可以将一个类定义在另一个类里面或者一个方法里面，这样的类称为内部类。内部类仍然是一个独立的类，在编译之后内部类会被编译成独立的.class文件，但是前面冠以外部类的类名和$符号。内部类可以间接解决多继承问题,可以使用内部类继承一个类，外部类继承一个类，实现多继承。 &nb
Caused by: java.lang.IncompatibleClassChangeError: class org.hibernate.cfg.Exten zhb8015
maven pom.xml关于hibernate的配置和异常信息如下，查了好多资料，问题还是没有解决。只知道是包冲突，就是不知道是哪个包....遇到这个问题的分享下是怎么解决的。。 maven pom: <dependency> <groupId>org.hibernate</groupId> <ar
Spark 性能相关参数配置详解－任务调度篇 Stark_Summer spark cache cpu 任务调度 yarn
随着Spark的逐渐成熟完善, 越来越多的可配置参数被添加到Spark中来, 本文试图通过阐述这其中部分参数的工作原理和配置思路, 和大家一起探讨一下如何根据实际场合对Spark进行配置优化。由于篇幅较长，所以在这里分篇组织，如果要看最新完整的网页版内容，可以戳这里：http://spark-config.readthedocs.org/，主要是便
css3滤镜 wangkeheng html css
经常看到一些网站的底部有一些灰色的图标，鼠标移入的时候会变亮，开始以为是js操作src或者bg呢，搜索了一下，发现了一个更好的方法：通过css3的滤镜方法。 html代码： <a href='' class='icon'><img src='utv.jpg' /></a> css代码： .icon{-webkit-filter: graysc

spark 版本定制 第5课：基于案例一节课贯通Spark Streaming流计算框架的运行源码6

你可能感兴趣的:(spark 版本定制 第5课：基于案例一节课贯通Spark Streaming流计算框架的运行源码6)

spark 版本定制第5课：基于案例一节课贯通Spark Streaming流计算框架的运行源码6

你可能感兴趣的:(spark 版本定制第5课：基于案例一节课贯通Spark Streaming流计算框架的运行源码6)