Spark源码系列（一）spark-submit提交作业过程

前言

折腾了很久，终于开始学习Spark的源码了，第一篇我打算讲一下Spark作业的提交过程。

这个是Spark的App运行图，它通过一个Driver来和集群通信，集群负责作业的分配。今天我要讲的是如何创建这个Driver Program的过程。

作业提交方法以及参数

我们先看一下用Spark Submit提交的方法吧，下面是从官方上面摘抄的内容。

# Run on a Spark standalone cluster

./bin/spark-submit \

  --class org.apache.spark.examples.SparkPi \

  --master spark://207.184.161.138:7077 \

  --executor-memory 20G \

  --total-executor-cores 100 \

  /path/to/examples.jar \

  1000

这个是提交到standalone集群的方式，打开spark-submit这文件，我们会发现它最后是调用了org.apache.spark.deploy.SparkSubmit这个类。

我们直接进去看就行了，main函数就几行代码，太节省了。

def main(args: Array[String]) {

    val appArgs = new SparkSubmitArguments(args)

    val (childArgs, classpath, sysProps, mainClass) = createLaunchEnv(appArgs)

    launch(childArgs, classpath, sysProps, mainClass, appArgs.verbose)

}

我们主要看看createLaunchEnv方法就可以了，launch是反射调用mainClass，精华全在createLaunchEnv里面了。

在里面我发现一些有用的信息，可能在官方文档上面都没有的，发出来大家瞅瞅。前面不带--的可以在spark-defaults.conf里面设置，带--的直接在提交的时候指定，具体含义大家一看就懂。

val options = List[OptionAssigner](

      OptionAssigner(args.master, ALL_CLUSTER_MGRS, false, sysProp = "spark.master"),

      OptionAssigner(args.name, ALL_CLUSTER_MGRS, false, sysProp = "spark.app.name"),

      OptionAssigner(args.name, YARN, true, clOption = "--name", sysProp = "spark.app.name"),

      OptionAssigner(args.driverExtraClassPath, STANDALONE | YARN, true,

        sysProp = "spark.driver.extraClassPath"),

      OptionAssigner(args.driverExtraJavaOptions, STANDALONE | YARN, true,

        sysProp = "spark.driver.extraJavaOptions"),

      OptionAssigner(args.driverExtraLibraryPath, STANDALONE | YARN, true,

        sysProp = "spark.driver.extraLibraryPath"),

      OptionAssigner(args.driverMemory, YARN, true, clOption = "--driver-memory"),

      OptionAssigner(args.driverMemory, STANDALONE, true, clOption = "--memory"),

      OptionAssigner(args.driverCores, STANDALONE, true, clOption = "--cores"),

      OptionAssigner(args.queue, YARN, true, clOption = "--queue"),

      OptionAssigner(args.queue, YARN, false, sysProp = "spark.yarn.queue"),

      OptionAssigner(args.numExecutors, YARN, true, clOption = "--num-executors"),

      OptionAssigner(args.numExecutors, YARN, false, sysProp = "spark.executor.instances"),

      OptionAssigner(args.executorMemory, YARN, true, clOption = "--executor-memory"),

      OptionAssigner(args.executorMemory, STANDALONE | MESOS | YARN, false,

        sysProp = "spark.executor.memory"),

      OptionAssigner(args.executorCores, YARN, true, clOption = "--executor-cores"),

      OptionAssigner(args.executorCores, YARN, false, sysProp = "spark.executor.cores"),

      OptionAssigner(args.totalExecutorCores, STANDALONE | MESOS, false,

        sysProp = "spark.cores.max"),

      OptionAssigner(args.files, YARN, false, sysProp = "spark.yarn.dist.files"),

      OptionAssigner(args.files, YARN, true, clOption = "--files"),

      OptionAssigner(args.files, LOCAL | STANDALONE | MESOS, false, sysProp = "spark.files"),

      OptionAssigner(args.files, LOCAL | STANDALONE | MESOS, true, sysProp = "spark.files"),

      OptionAssigner(args.archives, YARN, false, sysProp = "spark.yarn.dist.archives"),

      OptionAssigner(args.archives, YARN, true, clOption = "--archives"),

      OptionAssigner(args.jars, YARN, true, clOption = "--addJars"),

      OptionAssigner(args.jars, ALL_CLUSTER_MGRS, false, sysProp = "spark.jars")

 )

View Code

Driver程序的部署模式有两种，client和cluster，默认是client。client的话默认就是直接在本地运行了Driver程序了，cluster模式还会兜一圈把作业发到集群上面去运行。

指定部署模式需要用参数--deploy-mode来指定，或者在环境变量当中添加DEPLOY_MODE变量来指定。

下面讲的是cluster的部署方式，兜一圈的这种情况。

yarn模式的话mainClass是org.apache.spark.deploy.yarn.Client，standalone的mainClass是org.apache.spark.deploy.Client。

这次我们讲org.apache.spark.deploy.Client，yarn的话单独找一章出来单独讲，目前超哥还是推荐使用standalone的方式部署spark，具体原因不详，据说是因为资源调度方面的问题。

说个快捷键吧，Ctrl+Shift+N，然后输入Client就能找到这个类，这是IDEA的快捷键，相当好使。

我们直接找到它的main函数，发现了它居然使用了Akka框架，我百度了一下，被它震惊了。

Akka

在main函数里面，主要代码就这么三行。

//创建一个ActorSystem

val (actorSystem, _) = AkkaUtils.createActorSystem("driverClient",Utils.localHostName(),0,
　　conf, new SecurityManager(conf))

//执行ClientActor的preStart方法和receive方法

actorSystem.actorOf(Props(classOf[ClientActor], driverArgs, conf))

//等待运行结束

actorSystem.awaitTermination()

看了这里真的有点儿懵啊，这是啥玩意儿，不懂的朋友们，请点击这里Akka。下面是它官方放出来的例子：

//定义一个case class用来传递参数
case class Greeting(who: String)

//定义Actor，比较重要的一个方法是receive方法，用来接收信息的

class GreetingActor extends Actor with ActorLogging {

   def receive = {

       case Greeting(who) ⇒ log.info("Hello " + who)

   }

}

//创建一个ActorSystem

val system = ActorSystem("MySystem")
//给ActorSystem设置Actor

val greeter = system.actorOf(Props[GreetingActor], name = "greeter")
//向greeter发送信息，用Greeting来传递

greeter ! Greeting("Charlie Parker")

简直是无比强大啊，就这么几行代码就搞定了，接下来看你会更加震惊的。

我们回到Client类当中，找到ClientActor，它有两个方法，是之前说的preStart和receive方法，preStart方法用于连接master提交作业请求，receive方法用于接收从master返回的反馈信息。

我们先看preStart方法吧。

override def preStart() = {
    // 这里需要把master的地址转换成akka的地址，然后通过这个akka地址获得指定的actor
 // 它的格式是"akka.tcp://%s@%s:%s/user/%s".format(systemName, host, port, actorName)
    masterActor = context.actorSelection(Master.toAkkaUrl(driverArgs.master))

    // 把自身设置成远程生命周期的事件
    context.system.eventStream.subscribe(self, classOf[RemotingLifecycleEvent])



    driverArgs.cmd match {

      case "launch" =>

        // 此处省略100个字
        val mainClass = "org.apache.spark.deploy.worker.DriverWrapper"

        // 此处省略100个字

        // 向master发送提交Driver的请求，把driverDescription传过去，RequestSubmitDriver前面说过了，是个case class

        masterActor ! RequestSubmitDriver(driverDescription)



      case "kill" =>

        val driverId = driverArgs.driverId

        val killFuture = masterActor ! RequestKillDriver(driverId)

    }

}

从上面的代码看得出来，它需要设置master的连接地址，最后提交了一个RequestSubmitDriver的信息。在receive方法里面，就是等待接受回应了，有两个Response分别对应着这里的launch和kill。

线索貌似到这里就断了，那下一步在哪里了呢？当然是在Master里面啦，怎么知道的，猜的，哈哈。

Master也是继承了Actor，在它的main函数里面找到了以下代码：

val (actorSystem, boundPort) = AkkaUtils.createActorSystem(systemName, host, port, conf = conf, 
　　securityManager = securityMgr)

val actor = actorSystem.actorOf(Props(classOf[Master], host, boundPort, webUiPort, securityMgr), actorName)

val timeout = AkkaUtils.askTimeout(conf)

val respFuture = actor.ask(RequestWebUIPort)(timeout)

val resp = Await.result(respFuture, timeout).asInstanceOf[WebUIPortResponse]

和前面的actor基本一致，多了actor.ask这句话，查了一下官网的文档，这句话的意思的发送消息，并且接受一个Future作为response，和前面的actor ！ message的区别就是它还接受返回值。

具体的Akka的用法，大家还是参照官网吧，Akka确实如它官网所言的那样子，是一个简单、强大、并行的分布式框架。

小结：

Akka的使用确实简单，短短的几行代码即刻完成一个通信功能，比Socket简单很多。但是它也逃不脱我们常说的那些东西，请求、接收请求、传递的消息、注册的地址和端口这些概念。

调度schedule

我们接下来查找Master的receive方法吧，Master是作为接收方的，而不是主动请求，这点和hadoop是一致的。

    case RequestSubmitDriver(description) => {

        val driver = createDriver(description)

        persistenceEngine.addDriver(driver)

        waitingDrivers += driver

        drivers.add(driver)
        // 调度

        schedule()

         // 告诉client，提交成功了，把driver.id告诉它

        sender ! SubmitDriverResponse(true, Some(driver.id), s"Driver successfully submitted as ${driver.id}")

      }

这里我们主要看schedule方法就可以了，它是执行调度的方法。

private def schedule() {

    if (state != RecoveryState.ALIVE) { return }



    // 首先调度Driver程序，从workers里面随机抽一些出来

    val shuffledWorkers = Random.shuffle(workers) 
    for (worker <- shuffledWorkers if worker.state == WorkerState.ALIVE) {

      for (driver <- waitingDrivers) {
        // 判断内存和cpu够不够，够的就执行了哈
        if (worker.memoryFree >= driver.desc.mem && worker.coresFree >= driver.desc.cores) {

          launchDriver(worker, driver)

          waitingDrivers -= driver

        }

      }

    }



    // 这里是按照先进先出的，spreadOutApps是由spark.deploy.spreadOut参数来决定的，默认是true
    if (spreadOutApps) {

      // 遍历一下app
      for (app <- waitingApps if app.coresLeft > 0) {
        // canUse里面判断了worker的内存是否够用，并且该worker是否已经包含了该app的Executor

        val usableWorkers = workers.toArray.filter(_.state == WorkerState.ALIVE)

          .filter(canUse(app, _)).sortBy(_.coresFree).reverse

        val numUsable = usableWorkers.length

        val assigned = new Array[Int](numUsable) 
        // 记录每个节点的核心数

        var toAssign = math.min(app.coresLeft, usableWorkers.map(_.coresFree).sum)

        var pos = 0
        // 遍历直到分配结束

        while (toAssign > 0) {
          // 从0开始遍历可用的work，如果可用的cpu减去已经分配的>0,就可以分配给它
          if (usableWorkers(pos).coresFree - assigned(pos) > 0) {

            toAssign -= 1
            // 这个位置的work的可分配的cpu数+1
            assigned(pos) += 1

          }

          pos = (pos + 1) % numUsable

        }

        // 给刚才标记的worker分配任务
        for (pos <- 0 until numUsable) {

          if (assigned(pos) > 0) {

            val exec = app.addExecutor(usableWorkers(pos), assigned(pos))

            launchExecutor(usableWorkers(pos), exec)

            app.state = ApplicationState.RUNNING

          }

        }

      }

    } else {

      // 这种方式和上面的方式的区别是，这种方式尽可能用少量的节点来完成这个任务

      for (worker <- workers if worker.coresFree > 0 && worker.state == WorkerState.ALIVE) {

        for (app <- waitingApps if app.coresLeft > 0) {
          // 判断条件是worker的内存比app需要的内存多
          if (canUse(app, worker)) {

            val coresToUse = math.min(worker.coresFree, app.coresLeft)

            if (coresToUse > 0) {

              val exec = app.addExecutor(worker, coresToUse)

              launchExecutor(worker, exec)

              app.state = ApplicationState.RUNNING

            }

          }

        }

      }

    }

  }

它的调度器是这样的，先调度Driver程序，然后再调度App，调度App的方式是从各个worker的里面和App进行匹配，看需要分配多少个cpu。

那我们接下来看两个方法launchDriver和launchExecutor即可。

  def launchDriver(worker: WorkerInfo, driver: DriverInfo) {

    logInfo("Launching driver " + driver.id + " on worker " + worker.id)

    worker.addDriver(driver)

    driver.worker = Some(worker)

    worker.actor ! LaunchDriver(driver.id, driver.desc)

    driver.state = DriverState.RUNNING

  }

给worker发送了一个LaunchDriver的消息，下面在看launchExecutor的方法。

  def launchExecutor(worker: WorkerInfo, exec: ExecutorInfo) {

    logInfo("Launching executor " + exec.fullId + " on worker " + worker.id)

    worker.addExecutor(exec)

    worker.actor ! LaunchExecutor(masterUrl,

      exec.application.id, exec.id, exec.application.desc, exec.cores, exec.memory)

    exec.application.driver ! ExecutorAdded(

      exec.id, worker.id, worker.hostPort, exec.cores, exec.memory)

  }

它要做的事情多一点，除了给worker发送LaunchExecutor指令外，还需要给driver发送ExecutorAdded的消息，说你的任务已经有人干了。

在继续Worker讲之前，我们先看看它是怎么注册进来的，每个Worker启动之后，会自动去请求Master去注册自己，具体我们可以看receive的方法里面的RegisterWorker这一段，它需要上报自己的内存、Cpu、地址、端口等信息，注册成功之后返回RegisteredWorker信息给它，说已经注册成功了。

Worker执行

同样的，我们到Worker里面在receive方法找LaunchDriver和LaunchExecutor就可以找到我们要的东西。

case LaunchDriver(driverId, driverDesc) => {

      logInfo(s"Asked to launch driver $driverId")

      val driver = new DriverRunner(driverId, workDir, sparkHome, driverDesc, self, akkaUrl)

      drivers(driverId) = driver

      driver.start()



      coresUsed += driverDesc.cores

      memoryUsed += driverDesc.mem

}

看一下start方法吧，start方法里面，其实是new Thread().start()，run方法里面是通过传过来的DriverDescription构造的一个命令，丢给ProcessBuilder去执行命令，结束之后调用。

worker ！DriverStateChanged通知worker，worker再通过master ! DriverStateChanged通知master，释放掉worker的cpu和内存。

同理，LaunchExecutor执行完毕了，通过worker ! ExecutorStateChanged通知worker，然后worker通过master ! ExecutorStateChanged通知master，释放掉worker的cpu和内存。

下面我们再梳理一下这个过程，只包括Driver注册，Driver运行之后的过程在之后的文章再说，比较复杂。

1、Client通过获得Url地址获得ActorSelection（master的actor引用）,然后通过ActorSelection给Master发送注册Driver请求（RequestSubmitDriver）

2、Master接收到请求之后就开始调度了，从workers列表里面找出可以用的Worker

3、通过Worker的actor引用ActorRef给可用的Worker发送启动Driver请求（LaunchDriver）

4、调度完毕之后，给Client回复注册成功消息(SubmitDriverResponse)

5、Worker接收到LaunchDriver请求之后，通过传过来的DriverDescription的信息构造出命令来，通过ProcessBuilder执行

6、ProcessBuilder执行完命令之后，通过DriverStateChanged通过Worker

7、Worker最后把DriverStateChanged汇报给Master

后记：听超哥说，org.apache.spark.deploy.Client这个类快要被删除了，不知道cluster的这种模式是不是也被放弃了，官方给出来的例子推荐的是client模式->直接运行程序。难怪在作业调度的时候，看到别的actor叫driverActor。

不过这篇文章还有存在的意义, Akka和调度这块，和我现在正在写的第三篇以及第四篇关系很密切。

岑玉海

转载请注明出处，谢谢！

PHAS0008 - Experimental Methods 后端
PHAS0008-ExperimentalMethodsCoursework(2024-25)TobesubmittedviaMoodle/Turnitinby17:00onMonday24thFebruary2025.Answerstoquestions1-3shouldbetype-writtenandsubmittedasasinglepdffile.Pleasebecarefultoexp
arXiv每日推荐-3.4：语音/音频每日论文速递 sapienst 语音识别语音识别
同步公众号(arXiv每日学术速递)【1】SELD-TCN:SoundEventLocalization&DetectionviaTemporalConvolutionalNetworks标题：SELD-TCN：基于时间卷积网络的声音事件定位与检测作者：KarimGuirguis,BinYang备注：5pages,3tables,2figures.SubmittedtoEUSIPCO2020链接：
CE339 “Pacman” video game 后端
CE339Assignment2:“Pacman”videogameAssignmentobjectivesThisdocumentspecifiesthesecondcourseworkassignmenttobesubmittedbystudentstakingCE339.Thisassignmentismorechallengingthanthefirstoneanditismeanttop
并发编程利器 - Future 接口小马不敲代码 Java 并发编程
一、背景介绍对于线程池来说，任务执行类只需要实现Runnable接口，然后交给线程池，就可以轻松的实现异步执行多个任务的目标，提升程序的执行效率，比如如下异步执行任务下载。//创建一个线程池ExecutorServiceexecutor=Executors.newFixedThreadPool(2);//提交任务executor.submit(newRunnable(){@Overridepubl
Flink提交pyflink任务 Leo_Hu666 flink 大数据 python pyflink
1.官方文档：flink1.14:https://nightlies.apache.org/flink/flink-docs-release-1.14/docs/deployment/cli/#submitting-pyflink-jobsflink1.18:https://nightlies.apache.org/flink/flink-docs-release-1.18/docs/deploy
对于简单的HTML、CSS、JavaScript前端，我们可以通过几种方式连接后端昨今前端 html css
1.使用FetchAPI发送HTTP请求（最简单的方式）：//home.html//示例：提交表单数据到后端constsubmitForm=async(formData)=>{try{constresponse=awaitfetch('http://your-backend-url/api/submit',{method:'POST',headers:{'Content-Type':'applic
web前端面试问什么，【前端，2024华为前端高级面试题及答案 uiuuyy67 2024年程序员学习前端面试华为
效果截图：用户名是只读的，所以无法在text文本框里输入值；账号是禁用的，直接变成灰色了。2.input标签常用的type属性值讲解text文本框password密码框radio单选框checkbox复选框file文件选择hidden隐藏域hidden是用户看不见的东西，给管理员（写网页的）操作保存信息的！submit提交reset重置（2）select下拉框option：下拉选项（下拉框的基本标
android sensorhub框架,sensorhub-cloud-iot Jack遇见冰山 android sensorhub框架
HowtobecomeacontributorandsubmityourowncodeContributorLicenseAgreementsWe'dlovetoacceptyoursampleappsandpatches!Beforewecantakethem,wehavetojumpacoupleoflegalhurdles.Pleasefillouteithertheindividualor
专题练习图论还是太年轻
【图论01】最短路StartTime:2018-01-0212:45:00EndTime:2018-01-2312:45:00ContestStatus:RunningCurrentSystemTime:2018-01-1214:39:34SolvedProblemIDTitleRatio(Accepted/Submitted)1001最短路51.85%(70/135)1002King46.67%
GENDER AND SEX IN THE MEDIA 后端
Assignment#1–GENDERANDSEXINTHEMEDIA(worth25%)DUEFEB.24by11:59p.m.toA2LDropBox(under“Assignments”)ASSIGNMENTQUESTIONSPleaseselectoneofthethreequestionsbelow.DUE:SubmittoAvenueassignmentdropboxonorbefor
PS931 Bayesian Approaches to Behavioural Science 后端
DataAnalysisAssignmentPS931-BayesianApproachestoBehaviouralScienceSpringTerm2025(updated:2024-11-27)•Thisassessmentcountsfor42%ofyouroverallgrade.•SubmissionInstructions:Submityoursolutionasonehtmlorp
海南大学--学习资料--网络应用开发java web(胡祝华)-第3次作业解析（学长整理）创创大帝(水印很浅-下载的文档) 海南大学--学习资料--PHP HTML java web 前端 java html
海南大学–学习资料–网络应用开发javaweb(胡祝华)-第3次作业解析（学长整理）海南大学–学习资料–网络应用开发javaweb(胡祝华)-第3次作业解析（学长整理）海南大学–学习资料–网络应用开发javaweb(胡祝华)-第3次作业解析（学长整理）表单验证：1.在表单的源码中head部分用script导入了script/regcheckdata.js文件2.当点击提交按钮时，onSubmit=
【React】表单校验：从基础到集成库开开Kathy React 开发疑难解答（面试大全）前端 react.js
React表单验证是开发中非常常见的需求，良好的表单验证可以提高用户体验并减少错误输入。以下是React表单验证的最佳实践，分为三个层次：基础实现、自定义封装和使用集成库。一、基础表单验证1.受控组件React表单验证的基础是使用受控组件，通过状态(state)来管理表单数据。实现步骤：使用useState管理表单字段。在onChange中更新状态。在onSubmit中验证数据。示例代码：impo
python回车键绑定按钮_python tkinter 绑定回车键 weixin_39929254 python回车键绑定按钮
#_*_coding:utf-8_*_fromTkinterimport*defsubmit(ev=None):p.set(u.get())root=Tk()root.title("测试")frame=Frame(root)frame.pack(padx=8,pady=8,ipadx=4)lab1=Label(frame,text="获取:")lab1.grid(row=0,column=0,pa
Ubuntu下Tkinter绑定数字小键盘上的回车键（PySide6类似）中医是一种语言艺术 ubuntu 数字小键盘回车键
设计了一个tkinter程序，在Win下绑定回车键，直接绑定""就可以使用主键盘和小键盘的回车键直接“提交”，到了ubuntu下就不行了。经过搜索，发现ubuntu下主键盘和数字小键盘的回车键，名称不一样。增加绑定""就行了。作一个笔记。defsubmit_result_enter(event=None):submit_result()e.bind("",submit_result_enter)#
Flink执行jar报错：java.io.IOException: Error opening the Input Split file 或者 java.io.FileNotFoundExceptio 故明所以 Flink jar flink 大数据
一、报错内容Flink执行jar时，报如下错误：org.apache.flink.client.program.ProgramInvocationException:Jobfailed.(JobID:80bbed7b2180c6fd5904c29e7e8af447)atorg.apache.flink.client.program.rest.RestClusterClient.submitJob(
select标签下option标签的value属性的作用；form表单的注意事项 2301_旺仔前端开发语言
当标签只有name属性的时候，这个标签就会获得用户的输入，在表单提交的时候，会提交信息在form表单中，有submit按钮，其value值默认为“提交”，即按钮的名字默认是提交。因此对submit按钮，你可以不写value属性，或者是通过书写value属性来给按钮起别的名字。一般标签，我们也写了value属性，那么就会展示value属性的值，后期用户再输入内容的时候，value的初始值就会被替代。
#Python 用Sqlite3做模拟银行系统（4） Flash The Dash 前端数据库 javascript python sqlite 开发语言
今天的时间略短，就不做讲解了，直接上干货：defdeposit_submit(account_entry,amount_entry,note_entry):account_name=account_entry.get()amount=float(amount_entry.get())note=note_entry.get()deposit(account_name,amount,note)mess
submit和execute，以及区别 Buring_learn 线程池 java 数据库前端
submit和execute，以及区别submitsubmit方式适用于任务有返回结果方法名返回值类型描述submit(Runnale)Future提交Runnable任务submit(Runnable,T)Future提交Runnable任务并指定执行结果submit(Callable)Future提交Callable任务他们的返回值结果都是Future对象里面，并且都带有泛型。我们来看下Fut
ubuntu18.04 交换区扩容 Oliver-H 环境搭建 C_C++ubuntu c++
Ubuntu18.04运行程序时，报以下错误：g++:internalcompilererror:Killed(programcc1plus)g++:internalcompilererror:Killed(programcc1plus)Pleasesubmitafullbugreport搞了老半天，终于解决了，记录一下，免得忘记！！！出现以上问题原因是内存不足，使用交换分区来解决：1、查看交换分
cve-2024-53376：CyberPanel RCE 已发布PoC 棉花糖网络安全圈漏洞复现网络安全
安全研究员Thanatos发现流行的虚拟主机控制面板CyberPanel存在一个严重漏洞(CVE-2024-53376)，攻击者可利用该漏洞完全控制服务器。2.3.8之前的CyberPanel版本易受此安全漏洞影响，通过验证的用户可注入并执行操作系统(OS)命令。该漏洞位于/websites/submitWebsiteCreation，可通过简单的HTTPOPTIONS请求加以利用。攻击者可借此绕
SpringBoot之远程调用的三大方式码农~明哥网络 websocket
为什么要使用远程调用？SpringBoot不仅继承了Spring框架原有的优秀特性，而且还通过简化配置来进一步简化了Spring应用的整个搭建和开发过程。在Spring-Boot项目开发中，存在着本模块的代码需要访问外面模块接口，或外部url链接的需求,比如在apaas开发过程中需要封装接口在接口中调用apaas提供的接口（像发起流程接口submit等等）下面也是提供了三种方式（不使用dubbo的
Selenium学习笔记--Webdriver API 2--常用方法 jiang_guo 自动化测试笔记 selenium
Webdriver重用方法浏览器控制控制浏览器窗口大小控制浏览器后退、前进切换标签页（窗口切换）switch方法获取url使用get方法模拟浏览器刷新关闭浏览器常用方法clearsend_keysclicksubmitsizetextget_attributeis_displayedtitlecurrent_url鼠标操作键盘操作元素等待显示等待隐式等待切换iframe单表单切换嵌套表单切换平行表
vue前端下载某一区域为照片格式答题卡上的情书 vue.js 前端 javascript
1.需求背景项目中，需要对某一区域进行下载，要求已照片格式去下载（例如一个div盒子，里面有以上的字，以照片文件格式下载到本地）2.代码constdownloadView=ref();constimgName=ref('小程序码');importhtml2canvasfrom'html2canvas';import{saveAs}from'file-saver';constsubmitDownLo
vue2在线生成二维码家里有只小肥猫 javascript 前端开发语言
亲情提示：如果可以让后端生成就让后端生成实在不行再前端解决（分享方法只是为了让你快点下班不是为了让你能者多劳）创建npminstallqrcodejs2pnpminstallqrcodejs2importQRCodefrom'qrcodejs2'data:{qrcode:'',}submitCode(){if(this.$refs.qrcode){this.qrcode='';this.$refs
无@RequestBody获取数据为null 爱恰鸡米花学习 java
知识点参考：https://blog.csdn.net/justry_deng/article/details/80972817/今天在做一个post提交数据时，发现后台接收到的数据总为null，这是vue前端代码submitForm(formName){this.ruleForm.pic='/img/singerPic/666.jpg';const_this=this;this.$refs[fo
SQLmap 自动注入 -02 shenghuiping2001 网络安全 sqlmap sql注入 web mysql
1:如果想获得SQL数据库的信息，可以加入参数:-dbssqlmap-u"http://192.168.56.133/mutillidae/index.php?page=user-info.php&username=xiaosheng&password=abc&user-info-php-submit-button=View+Account+Details"--batch-pusername-db
大数据学习（五）：如何使用 Livy提交spark批量任务--转载 zuoseve01 livy
Livy是一个开源的REST接口，用于与Spark进行交互，它同时支持提交执行代码段和完整的程序。Livy封装了spark-submit并支持远端执行。启动服务器执行以下命令，启动livy服务器。./bin/livy-server这里假设spark使用yarn模式，所以所有文件路径都默认位于HDFS中。如果是本地开发模式的话，直接使用本地文件即可（注意必须配置livy.conf文件，设置livy.
Spark Livy 指南及livy部署访问实践 house.zhang 大数据-Spark 大数据
背景：ApacheSpark是一个比较流行的大数据框架、广泛运用于数据处理、数据分析、机器学习中，它提供了两种方式进行数据处理，一是交互式处理：比如用户使用spark-shell，编写交互式代码编译成spark作业提交到集群上去执行；二是批处理，通过spark-submit提交打包好的spark应用jar到集群中进行执行。这两种运行方式都需要安装spark客户端配置好yarn集群信息，并打通集群网
线程池创建及参数设置运筹帷幄小红花 java 开发语言后端
一、创建线程池以及线程池的各种参数分析：//不指定最大线程数，默认是Int的最大值ExecutorServiceexecutorService=Executors.newCachedThreadPool();executorService.submit(()->{System.out.println("新建线程池对象，执行第一个默认线程");});executorService.shutdown(
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D

Spark源码系列（一）spark-submit提交作业过程

前言

作业提交方法以及参数

Akka

调度schedule

Worker执行

你可能感兴趣的:(submit)