大数据技术与架构

Spark Core源码精读计划3 | SparkContext辅助属性及后初始化

推荐阅读

前言
SparkContext中的辅助属性
- creationSite
- allowMultipleContexts
- startTime & stopped
- addedFiles/addedJars & _files/_jars
- persistentRdds
- executorEnvs & _executorMemory & _sparkUser
- checkpointDir
- localProperties
- _eventLogDir & _eventLogCodec
- _applicationId & _applicationAttemptId
- _shutdownHookRef
- nextShuffleId & nextRddId
SparkContext后初始化
- setupAndStartListenerBus()方法
- postEnvironmentUpdate()方法
- postApplicationStart()方法
- 其他事项
总结

前言

在文章#2中，我们了解了SparkContext的主体部分，即组件初始化。除了它之外，SparkContext中还有一些与其内部机制紧密相关的属性，下文为了简单，就将它们称为“辅助属性”。另外，在组件初始化完成后，还有一些善后工作，即后初始化（Post-init）。本文就来研究这两块内容。

SparkContext中的辅助属性

仿照文章#2中的方式，仍然先将我们要关注的这些属性整理出来。 代码#3.1 - SparkContext中的辅助属性

 private val creationSite: CallSite = Utils.getCallSite()  private val allowMultipleContexts: Boolean = config.getBoolean("spark.driver.allowMultipleContexts", false)  val startTime = System.currentTimeMillis()  private[spark] val stopped: AtomicBoolean = new AtomicBoolean(false)  private[spark] val addedFiles = new ConcurrentHashMap[String, Long]().asScala  private[spark] val addedJars = new ConcurrentHashMap[String, Long]().asScala  private[spark] val persistentRdds = {    val map: ConcurrentMap[Int, RDD[_]] = new MapMaker().weakValues().makeMap[Int, RDD[_]]()    map.asScala  }  private[spark] val executorEnvs = HashMap[String, String]()  val sparkUser = Utils.getCurrentUserName()  private[spark] var checkpointDir: Option[String] = None  protected[spark] val localProperties = new InheritableThreadLocal[Properties] {    override protected def childValue(parent: Properties): Properties = {      SerializationUtils.clone(parent)    }    override protected def initialValue(): Properties = new Properties()  }  private val nextShuffleId = new AtomicInteger(0)  private val nextRddId = new AtomicInteger(0)
  private var _eventLogDir: Option[URI] = None  private var _eventLogCodec: Option[String] = None  private var _executorMemory: Int = _  private var _applicationId: String = _  private var _applicationAttemptId: Option[String] = None  private var _jars: Seq[String] = _  private var _files: Seq[String] = _  private var _shutdownHookRef: AnyRef = _

以下划线开头的字段如同代码#2.2中一样，也有对应的Getter方法。为了节省篇幅，就不列出来了。下面按照它们初始化的顺序和相关性来介绍，必要时仍然会附上一些源码。

creationSite

creationSite指示SparkContext是在哪里创建的。 CallSite是个简单的数据结构，只有shortForm与longForm两个属性，用来描述代码的位置。 Utils.getCallSite()方法遍历当前线程的线程栈，并找到最后一个（即最靠近栈顶的）Spark方法调用，与最先一个（即最靠近栈底的）用户方法调用，将它们的短形式和长形式包装在CallSite中返回。有兴趣的看官可以自行去看这个方法的源代码，不难。以代码#0.1的WordCount为例，运行时打上断点，观察creationSite的内容如下图。

allowMultipleContexts

allowMultipleContexts指示是否允许一个JVM（即一个Application）内存在多个活动的SparkContext实例。它由spark.driver.allowMultipleContexts参数控制，默认为false，即只允许存在一个活动的SparkContext实例，如果有多个就会抛出异常。设为true的话，在有多个活动的SparkContext时只会输出警告。关于它在下一篇文章中还会涉及到，这里就不多说了。

startTime & stopped

startTime指示SparkContext启动时的时间戳。 stopped则指示SparkContext是否停止，它采用AtomicBoolean类型。

addedFiles/addedJars & _files/_jars

Spark支持在提交应用时，附带用户自定义的其他文件与JAR包。 addedFiles和addedJars是两个ConcurrentHashMap，用来维护自定义文件及JAR包的URL路径，及它们被加入ConcurrentHashMap当时的时间戳。 _files与_jars则接受Spark配置中定义的文件或JAR包路径。由于它们的逻辑基本相同，下面以JAR包为例来看一下代码。 代码#3.2 - 构造方法中自定义JAR包的初始化

    _jars = Utils.getUserJars(_conf)    if (jars != null) {      jars.foreach(addJar)    }

首先用Utils.getUserJars()方法从SparkConf的spark.jars配置项中取出路径组成的序列，然后分别调用addJar()方法。 代码#3.3 - o.a.s.SparkContext.addJar()方法

  def addJar(path: String) {    def addJarFile(file: File): String = {      try {        if (!file.exists()) {          throw new FileNotFoundException(s"Jar ${file.getAbsolutePath} not found")        }        if (file.isDirectory) {          throw new IllegalArgumentException(            s"Directory ${file.getAbsoluteFile} is not allowed for addJar")        }        env.rpcEnv.fileServer.addJar(file)      } catch {        case NonFatal(e) =>          logError(s"Failed to add $path to Spark environment", e)          null      }    }
    if (path == null) {      logWarning("null specified as parameter to addJar")    } else {      val key = if (path.contains("\\")) {        addJarFile(new File(path))      } else {        val uri = new URI(path)        Utils.validateURL(uri)        uri.getScheme match {          case null =>            addJarFile(new File(uri.getRawPath))          case "file" => addJarFile(new File(uri.getPath))          case "local" => "file:" + uri.getPath          case _ => path        }      }      if (key != null) {        val timestamp = System.currentTimeMillis        if (addedJars.putIfAbsent(key, timestamp).isEmpty) {          logInfo(s"Added JAR $path at $key with timestamp $timestamp")          postEnvironmentUpdate()        }      }    }  }

‍

addJar()方法检查JAR包路径的合法性和类型，然后调用RpcEnv中的RpcEnvFileServer.addJar()方法，将JAR包加进RPC环境中。在该方法的最后还调用了postEnvironmentUpdate()，用来更新执行环境，这属于后初始化逻辑的一部分，下一节会讲到。

persistentRdds

Spark支持RDD的持久化，可以持久化到内存或磁盘。 persistentRdds维护的是持久化RDD的ID与其弱引用的映射关系。通过RDD内自带的cache()/persist()/unpersist()方法可以持久化与反持久化一个RDD，它们最终调用的是SparkContext.persistRDD()/unpersistRDD()内部方法。 代码#3.4 - o.a.s.SparkContext.persistRDD()与unpersistRDD()方法

  private[spark] def persistRDD(rdd: RDD[_]) {    persistentRdds(rdd.id) = rdd  }
  private[spark] def unpersistRDD(rddId: Int, blocking: Boolean = true) {    env.blockManager.master.removeRdd(rddId, blocking)    persistentRdds.remove(rddId)    listenerBus.post(SparkListenerUnpersistRDD(rddId))  }

executorEnvs & _executorMemory & _sparkUser

executorEnvs是一个HashMap，用来存储需要传递给Executor的环境变量。 _executorMemory与_sparkUser就是其中之二，分别代表Executor内存大小和当前启动SparkContext的用户名。

代码#3.5 - 构造方法中Executor环境变量的初始化

    _executorMemory = _conf.getOption("spark.executor.memory")      .orElse(Option(System.getenv("SPARK_EXECUTOR_MEMORY")))      .orElse(Option(System.getenv("SPARK_MEM"))      .map(warnSparkMem))      .map(Utils.memoryStringToMb)      .getOrElse(1024)
    for { (envKey, propKey) <- Seq(("SPARK_TESTING", "spark.testing"))      value <- Option(System.getenv(envKey)).orElse(Option(System.getProperty(propKey)))} {      executorEnvs(envKey) = value    }    Option(System.getenv("SPARK_PREPEND_CLASSES")).foreach { v =>      executorEnvs("SPARK_PREPEND_CLASSES") = v    }    executorEnvs("SPARK_EXECUTOR_MEMORY") = executorMemory + "m"    executorEnvs ++= _conf.getExecutorEnv    executorEnvs("SPARK_USER") = sparkUser

可见，Executor内存可以通过spark.executor.memory配置项、SPARK_EXECUTOR_MEMORY环境变量、SPARK_MEM环境变量指定，优先级依次降低，且默认大小是1GB。用户名是通过Utils.getCurrentUserName()方法获得的。

checkpointDir

checkpointDir指定集群状态下，RDD检查点在HDFS上保存的目录。检查点的存在是为了当计算过程出错时，能够快速恢复，而不必从头重新计算。 SparkContext提供了setCheckpointDir()方法用来设定检查点目录，如下。 代码#3.6 - o.a.s.SparkContext.setCheckpointDir()方法

 def setCheckpointDir(directory: String) {    if (!isLocal && Utils.nonLocalPaths(directory).isEmpty) {      logWarning("Spark is not running in local mode, therefore the checkpoint directory " +        s"must not be on the local filesystem. Directory '$directory' " +        "appears to be on the local filesystem.")    }
    checkpointDir = Option(directory).map { dir =>      val path = new Path(dir, UUID.randomUUID().toString)      val fs = path.getFileSystem(hadoopConfiguration)      fs.mkdirs(path)      fs.getFileStatus(path).getPath.toString    }  }

localProperties

localProperties用于维护一个Properties数据类型的线程本地变量。它是InheritableThreadLocal类型，继承自ThreadLocal，在后者的基础上允许本地变量从父线程到子线程的继承，也就是该Properties会沿着线程栈传递下去。

_eventLogDir & _eventLogCodec

这两个属性与EventLoggingListener相关。 EventLoggingListener打开时，事件日志会写入_eventLogDir指定的目录，可以用spark.eventLog.dir参数设置。 _eventLogCodec指定事件日志的压缩算法，当通过spark.eventLog.compress参数启用压缩后，就根据spark.io.compression.codec参数配置压缩算法，目前支持lz4、lzf、snappy、zstd四种。

_applicationId & _applicationAttemptId

这两个ID都是TaskScheduler初始化完毕并启动之后才分配的。 TaskScheduler启动之后，应用代码的逻辑才真正被执行，并且可能会进行多次尝试。在SparkUI、BlockManager和EventLoggingListener初始化时，也会用到它们。 代码#3.7 - 构造方法中_applicationId与_applicationAttemptId的初始化

   _applicationId = _taskScheduler.applicationId()    _applicationAttemptId = taskScheduler.applicationAttemptId()

_shutdownHookRef

它用来定义SparkContext的关闭钩子，主要是在JVM退出时，显式地执行SparkContext.stop()方法，以防止用户忘记而留下烂摊子。这实际上是后初始化逻辑，在下面的代码#3.8中会出现。

nextShuffleId & nextRddId

这两个ID都是AtomicInteger类型。 Shuffle和RDD都需要唯一ID来进行标识，并且它们是递增的。在代码#3.4中已经出现过了RDD ID。

SparkContext后初始化

在文章#2的ContextCleaner初始化之后，还有一小部分后初始化逻辑，其代码如下所示。 代码#3.8 - SparkContext后初始化逻辑

    setupAndStartListenerBus()    postEnvironmentUpdate()    postApplicationStart()
    _taskScheduler.postStartHook()    _env.metricsSystem.registerSource(_dagScheduler.metricsSource)    _env.metricsSystem.registerSource(new BlockManagerSource(_env.blockManager))    _executorAllocationManager.foreach { e =>      _env.metricsSystem.registerSource(e.executorAllocationManagerSource)    }
    logDebug("Adding shutdown hook") // force eager creation of logger    _shutdownHookRef = ShutdownHookManager.addShutdownHook(      ShutdownHookManager.SPARK_CONTEXT_SHUTDOWN_PRIORITY) { () =>      logInfo("Invoking stop() from shutdown hook")      stop()    }
    SparkContext.setActiveContext(this, allowMultipleContexts)

它的主要逻辑在开头的三个方法中，下面来逐一看它们的代码。

setupAndStartListenerBus()方法

代码#3.9 - o.a.s.SparkContext.setupAndStartListenerBus()方法

  private def setupAndStartListenerBus(): Unit = {    try {      conf.get(EXTRA_LISTENERS).foreach { classNames =>        val listeners = Utils.loadExtensions(classOf[SparkListenerInterface], classNames, conf)        listeners.foreach { listener =>          listenerBus.addToSharedQueue(listener)          logInfo(s"Registered listener ${listener.getClass().getName()}")        }      }    } catch {      case e: Exception =>        try {          stop()        } finally {          throw new SparkException(s"Exception when registering SparkListener", e)        }    }
    listenerBus.start(this, _env.metricsSystem)    _listenerBusStarted = true  }

这个方法用于注册自定义的监听器，并最终启动LiveListenerBus。自定义监听器都实现了SparkListener特征，通过spark.extraListeners配置参数来指定。然后调用Utils.loadExtensions()方法，通过反射来构建自定义监听器的实例，并将它们注册到LiveListenerBus。

postEnvironmentUpdate()方法

代码#3.10 - o.a.s.SparkContext.postEnvironmentUpdate()方法

  private def postEnvironmentUpdate() {    if (taskScheduler != null) {      val schedulingMode = getSchedulingMode.toString      val addedJarPaths = addedJars.keys.toSeq      val addedFilePaths = addedFiles.keys.toSeq      val environmentDetails = SparkEnv.environmentDetails(conf, schedulingMode, addedJarPaths,        addedFilePaths)      val environmentUpdate = SparkListenerEnvironmentUpdate(environmentDetails)      listenerBus.post(environmentUpdate)    }  }

该方法在添加自定义文件和JAR包时也都有调用，因为添加的资源会对程序的执行环境造成影响。它会取得当前的自定义文件和JAR包列表，以及Spark配置、调度方式，然后通过SparkEnv.environmentDetails()方法再取得JVM参数、Java系统属性等，一同封装成SparkListenerEnvironmentUpdate事件，并投递给事件总线。

postApplicationStart()方法

代码#3.11 - o.a.s.SparkContext.postApplicationStart()方法

  private def postApplicationStart() {    listenerBus.post(SparkListenerApplicationStart(appName, Some(applicationId),      startTime, sparkUser, applicationAttemptId, schedulerBackend.getDriverLogUrls))  }

这个方法比较简单，就是向事件总线投递SparkListenerApplicationStart事件，表示Application已经启动。

其他事项

在这三个方法之后的其他事项如下。

调用TaskScheduler.postStartHook()方法，等待SchedulerBackend初始化完毕。
在度量系统中注册DAGScheduler、BlockManager、ExecutionAllocationManager的度量源，以收集它们的监控数据。
添加关闭钩子，这个在之前已经提过了，不再赘述。
调用伴生对象中的setActiveContext()方法，将当前SparkContext设为活动的。

总结

本文通过梳理SparkContext中的多个辅助属性，进一步了解了一些细节特性，如外部文件和JAR包的初始化、RDD持久化和检查点等。在SparkContext构造方法的最后，还会执行一些扫尾的工作，如启动事件总线、更新执行环境等。 SparkContext除了初始化之外，还对外提供了不少通用的功能，如生成RDD，产生广播变量与累加器，启动Job等等。另外，SparkContext类也有伴生对象，里面维护了一些常用的逻辑。下一篇文章作为SparkContext概况的收尾，就来研究这些剩下的东西。

— THE END —

你可能感兴趣的:(Spark Core源码精读计划3 | SparkContext辅助属性及后初始化)

安全可靠测评结果公告（2024年第1号） Kunpeng_Ascend小白服务器科技政务
附表一、中央处理器（CPU）（同一等级按产品名称首字笔画为序排列）序号产品名称送测单位安全可靠等级1飞腾腾云S5000C飞腾信息技术有限公司Ⅱ级2飞腾腾珑E2000飞腾信息技术有限公司Ⅱ级3飞腾腾锐D3000飞腾信息技术有限公司Ⅱ级4龙芯3A5000（DA版）龙芯中科技术股份有限公司Ⅱ级5龙芯3A6000龙芯中科技术股份有限公司Ⅱ级6龙芯3C5000龙芯中科技术股份有限公司Ⅱ级7龙芯3D5000龙
不变初心数阿猿收手吧！ #C语言经典题目 c++算法 c语言
不变初心数描述不变初心数是指这样一种特别的数，它分别乘2、3、4、5、6、7、8、9时，所得乘积各位数之和却不变（等于该数的各位数字之和）。例如18就是这样的数：18的2倍是36，3+6=9；18的3倍是54，5+4=9；……18的9倍是162，1+6+2=9。对于18而言，9就是它的初心。编写程序，输出指定范围内[a,b]的所有不变初心数。输入一行中给出2个正整数a和b，且a≤b≤10^5输出按
2013年蓝桥杯第四届C&C++大学B组真题及代码 GR鲸鱼蓝桥杯C&C++真题蓝桥杯 c++数据结构算法 c语言
目录1A：高斯日记（日期计算）2B：马虎的算式（暴力模拟）3C：第39级台阶（dfs或dp）4D：黄金连分数（递推+大数运算）5E：前缀判断（代码填空）（枚举）6F：三部排序（代码填空）7G：错误票据（枚举）8H：翻硬币（找规律）9I：带分数（全排列暴力）10J：连号区间数（找规律）蓝桥杯大赛是从第四届才开始划分ABC组的，因此前三届的题目所有院校都是一样的。所以这里此专栏就从第四届开始刷题了，应
浅谈 redis BigDeng_2014 工作 redis 数据库 java
redis特点：单进程多线程。主线程只有一个，还有两个副线程，用于文件和IO处理。可以集群部署，数据在各个机器上都有备份，挂了一台机器，可以从其他机器上找到数据。集群带来主从节点机制，一般至少需要3个节点来选举出主节点，也可以指定主节点。主从同步问题，会导致数据不一致。保证了分布式P和可用性A，牺牲了一致性C，可以保证最终一致性。比如数据恢复。把数据存放到内存，从内存查找数据比较快一些。有key-
python爬取自如网房源信息 2401_87368790 python 开发语言
本次爬取自如网房源信息所用到的知识点:requestsget请求lxml解析htmlXpathMongoDB存储正文分析目标站点url:http://hz.ziroom.com/z/nl/z3.html?p=2的p参数控制分页get请求获取单页源码--coding:utf-8--importrequestsimporttimefromrequests.exceptionsimportRequest
python的小技巧一 2401_87368790 python 开发语言
print(res)####一个数值的范围比较*常规的写法deftest_judge5(self):“”"判断一个值得的范围大小@return:“”"num=int(input(“请输入一个数字：”))ifnum>=0andnum>在判断字典的某一个key是否为空，可以用try…exception来实现>>>deftest_judge3(self):dict_data={“user_base”:{
Python演奏《起风了》 2401_86461228 python 数据库
代码：importctypesimportthreadingimporttimewinmm=ctypes.windll.winmmclassScale:Rest=0C8=108B7=107A7s=106A7=105G7s=104G7=103F7s=102F7=101E7=100D7s=99D7=98C7s=97C7=96B6=95A6s=94A6=93G6s=92G6=91F6s=90F6=89E
2024.3.26 腾讯魔方工作室—golang后台开发面经 2301_79125642 java
题解|#将两个SELECT语句结合起来（一）#selectprod_id,quantityfromOrderItemswherequanti2024.3.26腾讯魔方工作室—golang后台开发面经全程拷打，深挖项目，几乎不问八股，有些问题想不太清楚了，只是凭着模糊记忆把大体问题写下。做了三个项目题解|#求int型正整数在内存中存储时1的个数#importjava.util.Scanner;//注
9.1 GPTs 应用商店介绍：解锁定制化 AI 的无限潜能少林码僧 AI大模型应用实战专栏人工智能 chatgpt
GPTs应用商店介绍：解锁定制化AI的无限潜能引言：迈入AI应用的新时代随着OpenAI的GPT模型不断进化，GPTs应用商店的推出标志着AI定制化的一个新纪元。它是一个开放平台，允许用户轻松创建、共享和探索各种定制化GPT应用程序。无论是自动化日常任务、提供行业解决方案，还是开发个性化的智能助手，GPTs应用商店都提供了强大的支持，让AI成为每个人触手可及的工具。1.什么是GPTs应用商店？GP
【Python】自动化神器PyAutoGUI —告别手动操作，一键模拟鼠标键盘，玩转微信及各种软件自动化墩墩分墩 Python python 自动化自动化脚本自动化测试 pyautogui
文章目录1.PyAutoGUI简介2.不同操作系统引入模块3.全局延迟和临时休眠4,自动防故障功能5.获取屏幕分辨率—用于定位，这是最关键的，找到要点击的位置（像素坐标）6.获取鼠标位置7.判断坐标是否在屏幕范围内：8.鼠标移动8.1.鼠标移动的基本操作8.2.鼠标移动效果-缓动/渐变（Tween/Easing）9.鼠标点击10.鼠标滚轮控制11.鼠标拖拽12.键盘控制13.消息弹窗函数14.屏幕
java.sql.Date 弃用分析与替代方案蓝田～ java microsoft
引言java.sql.Date是Java标准库中的一个类，它继承自java.util.Date，主要用于在Java应用程序与数据库之间进行日期数据的传输。然而，随着Java语言的发展，java.sql.Date以及其父类java.util.Date逐渐被认为存在设计缺陷，并被新的日期时间API所替代。本文将对java.sql.Date的启用原因进行分析，并探讨其弃用原因及替代方案。启用原因分析SQ
pygame下载 2401_86461228 pygame python
pygame下载先进入pygame官网下载与你python对应的版本，然后解压：https://www.pygame.org/download.shtml然后打开cmd命令输入pipinstallpygame等待执行结束，然后打开python输入代码importpygame再运行，入出现以下情况说明安装成功注：我的python是32位的
24. C语言预处理器：技巧与陷阱涛ing C语言基础 c语言 linux c++开发语言 vscode vim 经验分享
本章目录:前言预处理器概述预处理器指令简介常见的预处理器指令实例1.定义宏常量2.引入头文件3.取消宏定义4.条件编译5.调试代码的条件编译预定义宏示例：使用预定义宏宏运算符1.宏延续运算符(`\`)2.字符串化运算符（`#`）3.标记粘贴运算符（`##`）4.`defined()`运算符宏与函数的区别错误的宏使用正确的宏使用总结前言在C语言的编程过程中，预处理器（Preprocessor，简称C
Maven 在尝试连接到 Maven Central 仓库超时的解决方案和排查步骤天之涯上上 maven java
Maven在尝试连接到MavenCentral仓库时超时。以下是一些可能的解决方案和排查步骤：1.检查网络连接确保你的网络连接正常，并且能够访问外网。Ping测试:pingrepo.maven.apache.orgTelnet测试:telnetrepo.maven.apache.org4432.配置代理如果你在公司网络中使用代理服务器，需要配置Maven使用代理。编辑settings.xml找到或
Python3【字符串】：文本操作的瑞士军刀李智 - 重庆 Python 精讲精练 -从入门到实战 python 开发语言经验分享编程实战趣味编程编程技巧
Python3【字符串】：文本操作的瑞士军刀内容简介本系列文章是为Python3学习者精心设计的一套全面、实用的学习指南，旨在帮助读者从基础入门到项目实战，全面提升编程能力。文章结构由5个版块组成，内容层层递进，逻辑清晰。基础速通：n个浓缩提炼的核心知识点，夯实编程基础；经典范例：10个贴近实际的应用场景，深入理解Python3的编程技巧和应用方法；避坑宝典：10个典型错误解析，提供解决方案，帮助
华为OD机试2024年E卷-分苹果[100分]（ Java | Python3 | C++ | C语言 | JsNode | Go ）实现100%通过率梅花C 华为OD题库华为od
题目描述A、B两个人把苹果分为两堆，A希望按照他的计算规则等分苹果Q，他的计算规则是按照二进制加法计算，并且不计算进位12+5=9(1100+0101=9)，B的计算规则是十进制加法，包括正常进位，B希望在满足A的情况下获取苹果重量最多。输入苹果的数量和每个苹果重量，输出满足A的情况下B获取的苹果总重量。如果无法满足A的要求，输出-1。数据范围1<=总苹果数量<=200001<=每个苹果重量<=1
海康威视ISAPI协议获取全屏温度数据 666先生的救赎 java 图像处理音视频
获取全屏温度接口GEThttp://192.168.3.28/ISAPI/Thermal/channels/2/thermometry/jpegPicWithAppendData?format=json接口返回三部分内容：json结果、全屏温度图片、全屏温度数据；调用全屏测温接口/***下载文件*@paramurl下载地址*@paramheaderMap请求头*@paramfilePath文件路径
MySQL 执行计划：优化查询性能 J老熊 MySQL 实战秘籍 mysql 数据库开发语言后端面试性能优化系统架构
一、什么是MySQL执行计划？MySQL执行计划（ExecutionPlan）是MySQL在执行SQL查询时，所采取的具体执行策略。它描述了查询如何从数据库中获取数据，执行的步骤顺序以及使用的索引等信息。通过执行计划，我们可以直观地看到查询语句的执行路径，从而判断是否可以优化。二、如何查看MySQL执行计划？查看执行计划有几种方式：EXPLAIN语句使用EXPLAIN可以查看单个查询的执行计划。例
JavaFX 实现 Loading 效果的组件与案例详解 J老熊 java 服务器开发语言后端面试系统架构软件工程
JavaFX中的Loading组件概述JavaFX提供了两个用于显示任务进度的核心组件：ProgressIndicator：以圆形动画的形式展示任务进度，适用于未定义进度的任务。ProgressBar：以水平条的形式展示任务进度，适用于可以量化进度的任务。这两个组件可直接绑定到后台任务的progress属性，实时更新界面。1.ProgressBar的常见方法ProgressBar是以水平条的形式显
7. 马科维茨资产组合模型+金融研报AI长文本智能体(Qwen-Long)增强方案（理论+Python实战） AI量金术师金融资产组合模型进化论人工智能金融 python 机器学习算法大数据线性回归
目录0.承前1.深度金融研报准备2.核心AI函数代码讲解2.1函数概述2.2输入参数2.3主要流程2.4异常处理2.5清理工作2.7get_ai_weights函数汇总3.汇总代码4.反思4.1不足之处4.2提升思路5.启后0.承前本篇博文是对前两篇文章，链接:5.马科维茨资产组合模型+政策意图AI金融智能体(Qwen-Max)增强方案（理论+Python实战）6.马科维茨资产组合模型+政策意图A
python字符串写入excel-python 将数据写入excel weixin_37988176
摘要链接：python第三方库——xlrd和xlwt操作Excel文件学习：http://blog.csdn.net/wangkai_123456/article/details/50457284python操作Excel读写(使用xlrd和xlrt)：http://blog.csdn.net/mr__fang/article/details/7089581Python中一般使用xlrd（exce
idea连接mysql weixin_33758863 开发工具
https://blog.csdn.net/Golden_soft/article/details/80952243转载于:https://www.cnblogs.com/jitipaper/p/10784406.html
python并行计算 weixin_30894389
0.基础并行/发：multiprocessing/threading1.concurrent2.并发：asynico3.Ipython下的并行计算：使用ipyparallel库的IPython提供了前所未有的能力，将科学Python的探索能力与几乎即时访问多个计算核心相结合。系统可以直观地与本地或网络的计算节点集群进行交互，而不管集群的实现方式如何。这种易于交互使用帮助IPython和Python
Kafka 消息存储与销毁机制 AI天才研究院大数据AI人工智能计算 kafka wpf 分布式
Kafka消息存储与销毁机制文章目录Kafka消息存储与销毁机制1.背景介绍1.1什么是Kafka1.2Kafka的基本概念解释2.核心概念与联系2.1消息存储机制2.2消息销毁机制2.3分区与副本机制3.核心算法原理具体操作步骤3.1消息存储过程3.2消息消费过程3.3消息销毁过程3.4分区副本同步过程4.数学模型和公式详细讲解举例说明4.1消息存储模型4.2消息销毁模型4.3分区副本同步模型5
总结：IDEA社区版接入AI代码工具小魏的博客机器学习大语言模型 IDE相关软件 intellij-idea java ide
一、介绍本文主要记录下IDEA工具接入通义灵码、deepseek（深度求索）、豆包的方式。idea社区版（我的具体是：IntelliJIDEA2023.2.5(CommunityEdition)）二、deepseek配置1、首先得去deepseek平台创建个apikey；生成key位置：DeepSeek默认会送500万的tokens，查看tokens用量：DeepSeek2、安装AutoDev插件
使用IDEA创建一个SpringBoot项目 web13293720476 面试学习路线阿里巴巴 spring boot intellij-idea java 服务器 linux
文章目录一、SpringBoot是什么？二、使用idea创建SpringBoot项目1.使用idea的SpringInitiallizr创建项目2.初步配置3.编写简单代码及运行4.两个好玩的小东西总结一、SpringBoot是什么？Spring框架是Java平台上的一种开源应用框架，提供具有控制反转特性的容器。SpringBoot基于Spring4.0设计，不仅继承了Spring框架原有的优秀特
PointNet++改进策略：模块改进 | OA-CNNs | ，全自适应3D稀疏卷积神经网络（OA-CNNs），超越基于Transformer的模型，同时显著降低计算和内存成本我是瓦力 PointNet++改进策略 3d transformer 深度学习计算机视觉人工智能神经网络
目录介绍核心思想及其实现引入空间自适应感受野自适应关系卷积（ARConv）网络整体架构设计训练和验证实验与评估如何改进PointNet++引入空间自适应感受野引入自适应关系学习利用自适应聚合器论文题目：OA-CNNs:Omni-AdaptiveSparseCNNsfor3DSemanticSegmentation发布期刊：CVPR2024作者地址：1香港中文大学2香港大学3香港中文大学，深圳4HI
PointNet++改进策略：模块改进 | PointCAT，使用交叉注意力机制来提升3D点云任务中提升模型精度我是瓦力 PointNet++改进策略 3d 深度学习人工智能计算机视觉 transformer
论文题目：PointCAT:Cross-AttentionTransformerforPointCloud通讯地址：南京理工大学代码地址：https://github.com/xincheng-yang/PointCAT.PointCAT架构：PointCAT提出了一种基于交叉注意力机制的Transformer网络，专门用于点云表示。它通过两个不同的多尺度特征分支，利用交叉注意力机制来交换信息。通
redis清空缓存奔跑吧邓邓子高效运维缓存 redis 数据库
提示：“奔跑吧邓邓子”的高效运维专栏聚焦于各类运维场景中的实际操作与问题解决。内容涵盖服务器硬件（如IBMSystem3650M5）、云服务平台（如腾讯云、华为云）、服务器软件（如Nginx、Apache、GitLab、Redis、Elasticsearch、Kubernetes、Docker等）、开发工具（如Git、HBuilder）以及网络安全（如挖矿病毒排查、SSL证书配置）等多个方面。无论
ROS学习（5）可视化和调试工具一敲代码的雪糕 ROS ROS
文章目录前言一、调试ROS节点1、使用gdb调试器调试节点2、在节点启动时调用gdb调试器3、在节点启动时调用valgrind分析节点4、设置ROS节点core文件存储二、日志消息1.输出日志消息2.调试消息级别3.为特定节点配置调试消息级别4.消息命名5.按条件显示消息与过滤消息6.显示消息的方式7.使用rqt_console和rqt_logger_level在运行时修改调试级别总结前言ROS自
java的(PO,VO,TO,BO,DAO,POJO) Cb123456 VO TO BO POJO DAO
转: http://www.cnblogs.com/yxnchinahlj/archive/2012/02/24/2366110.html ------------------------------------------------------------------- O/R Mapping 是 Object Relational Mapping（对象关系映
spring ioc原理（看完后大家可以自己写一个spring） aijuans spring
最近，买了本Spring入门书：spring In Action 。大致浏览了下感觉还不错。就是入门了点。Manning的书还是不错的，我虽然不像哪些只看Manning书的人那样专注于Manning,但怀着崇敬的心情和激情通览了一遍。又一次接受了IOC 、DI、AOP等Spring核心概念。先就IOC和DI谈一点我的看法。IO
MyEclipse 2014中Customize Persperctive设置无效的解决方法 Kai_Ge MyEclipse2014
高高兴兴下载个MyEclipse2014，发现工具条上多了个手机开发的按钮，心生不爽就想弄掉他！结果发现Customize Persperctive失效！！有说更新下就好了，可是国内Myeclipse访问不了，何谈更新... so~这里提供了更新后的一下jar包，给大家使用！ 1、将9个jar复制到myeclipse安装目录\plugins中 2、删除和这9个jar同包名但是版本号较
SpringMvc上传 120153216 springMVC
@RequestMapping(value = WebUrlConstant.UPLOADFILE) @ResponseBody public Map<String, Object> uploadFile(HttpServletRequest request,HttpServletResponse httpresponse) { try { //
Javascript----HTML DOM 事件何必如此 JavaScript html Web
HTML DOM 事件允许Javascript在HTML文档元素中注册不同事件处理程序。事件通常与函数结合使用，函数不会在事件发生前被执行！注：DOM：指明使用的 DOM 属性级别。 1.鼠标事件属性
动态绑定和删除onclick事件 357029540 JavaScript jquery
因为对JQUERY和JS的动态绑定事件的不熟悉，今天花了好久的时间才把动态绑定和删除onclick事件搞定!现在分享下我的过程。在我的查询页面，我将我的onclick事件绑定到了tr标签上同时传入当前行(this值)参数，这样可以在点击行上的任意地方时可以选中checkbox，但是在我的某一列上也有一个onclick事件是用于下载附件的，当
HttpClient|HttpClient请求详解 7454103 apache 应用服务器网络协议网络应用 Security
HttpClient 是 Apache Jakarta Common 下的子项目，可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包，并且它支持 HTTP 协议最新的版本和建议。本文首先介绍 HTTPClient，然后根据作者实际工作经验给出了一些常见问题的解决方法。HTTP 协议可能是现在 Internet 上使用得最多、最重要的协议了，越来越多的 Java 应用程序需
递归逐层统计树形结构数据 darkranger 数据结构
将集合递归获取树形结构: /** * * 递归获取数据 * @param alist:所有分类 * @param subjname:对应统计的项目名称 * @param pk:对应项目主键 * @param reportList: 最后统计的结果集 * @param count:项目级别 */ public void getReportVO(Arr
访问WEB-INF下使用frameset标签页面出错的原因 aijuans struts2
<frameset rows="61,*,24" cols="*" framespacing="0" frameborder="no" border="0">
MAVEN常用命令 avords
Maven库： http://repo2.maven.org/maven2/ Maven依赖查询： http://mvnrepository.com/ Maven常用命令： 1. 创建Maven的普通java项目： mvn archetype:create -DgroupId=packageName
PHP如果自带一个小型的web服务器就好了 houxinyou apache 应用服务器 Web PHP 脚本
最近单位用PHP做网站，感觉PHP挺好的，不过有一些地方不太习惯，比如，环境搭建。PHP本身就是一个网站后台脚本，但用PHP做程序时还要下载apache，配置起来也不太很方便，虽然有好多配置好的apache+php+mysq的环境，但用起来总是心里不太舒服，因为我要的只是一个开发环境，如果是真实的运行环境，下个apahe也无所谓，但只是一个开发环境，总有一种杀鸡用牛刀的感觉。如果php自己的程序中
NoSQL数据库之Redis数据库管理(list类型) bijian1013 redis 数据库 NoSQL
3.list类型及操作 List是一个链表结构，主要功能是push、pop、获取一个范围的所有值等等，操作key理解为链表的名字。Redis的list类型其实就是一个每个子元素都是string类型的双向链表。我们可以通过push、pop操作从链表的头部或者尾部添加删除元素，这样list既可以作为栈，又可以作为队列。 &nbs
谁在用Hadoop？ bingyingao hadoop 数据挖掘公司应用场景
Hadoop技术的应用已经十分广泛了，而我是最近才开始对它有所了解，它在大数据领域的出色表现也让我产生了兴趣。浏览了他的官网，其中有一个页面专门介绍目前世界上有哪些公司在用Hadoop，这些公司涵盖各行各业，不乏一些大公司如alibaba,ebay,amazon,google,facebook,adobe等，主要用于日志分析、数据挖掘、机器学习、构建索引、业务报表等场景,这更加激发了学习它的热情。
【Spark七十六】Spark计算结果存到MySQL bit1129 mysql
package spark.examples.db import java.sql.{PreparedStatement, Connection, DriverManager} import com.mysql.jdbc.Driver import org.apache.spark.{SparkContext, SparkConf} object SparkMySQLInteg
Scala: JVM上的函数编程 bookjovi scala erlang haskell
说Scala是JVM上的函数编程一点也不为过，Scala把面向对象和函数型编程这两种主流编程范式结合了起来，对于熟悉各种编程范式的人而言Scala并没有带来太多革新的编程思想，scala主要的有点在于Java庞大的package优势，这样也就弥补了JVM平台上函数型编程的缺失，MS家.net上已经有了F#，JVM怎么能不跟上呢？对本人而言
jar打成exe bro_feng java jar exe
今天要把jar包打成exe，jsmooth和exe4j都用了。遇见几个问题。记录一下。两个软件都很好使，网上都有图片教程，都挺不错。首先肯定是要用自己的jre的，不然不能通用，其次别忘了把需要的lib放到classPath中。困扰我很久的一个问题是，我自己打包成功后，在一个同事的没有装jdk的电脑上运行，就是不行，报错jvm.dll为无效的windows映像，如截图最后发现
读《研磨设计模式》-代码笔记-策略模式-Strategy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 策略模式定义了一系列的算法，并将每一个算法封装起来，而且使它们还可以相互替换。策略模式让算法独立于使用它的客户而独立变化简单理解： 1、将不同的策略提炼出一个共同接口。这是容易的，因为不同的策略，只是算法不同，需要传递的参数
cmd命令值cvfM命令 chenyu19891124 cmd
cmd命令还真是强大啊。今天发现jar -cvfM aa.rar @aaalist 就这行命令可以根据aaalist取出相应的文件例如：在d：\workspace\prpall\test.java 有这样一个文件，现在想要将这个文件打成一个包。运行如下命令即可比如在d：\wor
OpenJWeb(1.8) Java Web应用快速开发平台 comsci java 框架 Web 项目管理企业应用
OpenJWeb(1.8) Java Web应用快速开发平台的作者是我们技术联盟的成员，他最近推出了新版本的快速应用开发平台 OpenJWeb(1.8)，我帮他做做宣传 OpenJWeb快速开发平台以快速开发为核心，整合先进的java 开源框架，本着自主开发+应用集成相结合的原则，旨在为政府、企事业单位、软件公司等平台用户提供一个架构透
Python 报错：IndentationError: unexpected indent daizj python tab 空格缩进
IndentationError: unexpected indent 是缩进的问题，也有可能是tab和空格混用啦 Python开发者有意让违反了缩进规则的程序不能通过编译，以此来强制程序员养成良好的编程习惯。并且在Python语言里，缩进而非花括号或者某种关键字，被用于表示语句块的开始和退出。增加缩进表示语句块的开
HttpClient 超时设置 dongwei_6688 httpclient
HttpClient中的超时设置包含两个部分： 1. 建立连接超时，是指在httpclient客户端和服务器端建立连接过程中允许的最大等待时间 2. 读取数据超时，是指在建立连接后，等待读取服务器端的响应数据时允许的最大等待时间在HttpClient 4.x中如下设置： HttpClient httpclient = new DefaultHttpC
小鱼与波浪 dcj3sjt126com
一条小鱼游出水面看蓝天，偶然间遇到了波浪。　　小鱼便与波浪在海面上游戏，随着波浪上下起伏、汹涌前进。　　小鱼在波浪里兴奋得大叫：“你每天都过着这么刺激的生活吗？简直太棒了。”　　波浪说：“岂只每天过这样的生活，几乎每一刻都这么刺激！还有更刺激的，要有潮汐变化，或者狂风暴雨，那才是兴奋得心脏都会跳出来。”　　小鱼说：“真希望我也能变成一个波浪，每天随着风雨、潮汐流动，不知道有多么好！”　　很快，小鱼
Error Code: 1175 You are using safe update mode and you tried to update a table dcj3sjt126com mysql
快速高效用：SET SQL_SAFE_UPDATES = 0；下面的就不要看了！今日用MySQL Workbench进行数据库的管理更新时，执行一个更新的语句碰到以下错误提示： Error Code: 1175 You are using safe update mode and you tried to update a table without a WHERE that
枚举类型详细介绍及方法定义 gaomysion enum javaee
转发 http://developer.51cto.com/art/201107/275031.htm 枚举其实就是一种类型，跟int, char 这种差不多，就是定义变量时限制输入的，你只能够赋enum里面规定的值。建议大家可以看看，这两篇文章，《java枚举类型入门》和《C++的中的结构体和枚举》，供大家参考。枚举类型是JDK5.0的新特征。Sun引进了一个全新的关键字enum
Merge Sorted Array hcx2013 array
Given two sorted integer arrays nums1 and nums2, merge nums2 into nums1 as one sorted array. Note:You may assume that nums1 has enough space (size that is
Expression Language 3.0新特性 jinnianshilongnian el 3.0
Expression Language 3.0表达式语言规范最终版从2013-4-29发布到现在已经非常久的时间了；目前如Tomcat 8、Jetty 9、GlasshFish 4已经支持EL 3.0。新特性包括：如字符串拼接操作符、赋值、分号操作符、对象方法调用、Lambda表达式、静态字段/方法调用、构造器调用、Java8集合操作。目前Glassfish 4/Jetty实现最好，对大多数新特性
超越算法来看待个性化推荐 liyonghui160com 超越算法来看待个性化推荐
一提到个性化推荐，大家一般会想到协同过滤、文本相似等推荐算法，或是更高阶的模型推荐算法，百度的张栋说过，推荐40%取决于UI、30%取决于数据、20%取决于背景知识，虽然本人不是很认同这种比例，但推荐系统中，推荐算法起的作用起的作用是非常有限的。就像任何
写给Javascript初学者的小小建议 pda158 JavaScript
　　一般初学JavaScript的时候最头痛的就是浏览器兼容问题。在Firefox下面好好的代码放到IE就不能显示了，又或者是在IE能正常显示的代码在firefox又报错了。　　如果你正初学JavaScript并有着一样的处境的话建议你：初学JavaScript的时候无视DOM和BOM的兼容性，将更多的时间花在了解语言本身（ECMAScript）。只在特定浏览器编写代码（Chrome/Fi
Java 枚举 ShihLei java enum 枚举
注：文章内容大量借鉴使用网上的资料，可惜没有记录参考地址，只能再传对作者说声抱歉并表示感谢！一基础 1）语法枚举类型只能有私有构造器（这样做可以保证客户代码没有办法新建一个enum的实例）枚举实例必须最先定义 2）特性 &nb
Java SE 6 HotSpot虚拟机的垃圾回收机制 uuhorse java HotSpot GC 垃圾回收 VM
官方资料，关于Java SE 6 HotSpot虚拟机的garbage Collection，非常全，英文。 http://www.oracle.com/technetwork/java/javase/gc-tuning-6-140523.html Java SE 6 HotSpot[tm] Virtual Machine Garbage Collection Tuning &