Spark Yarn Cluster模式运行流程

以wordCount功能实现为例:
命令行:
bin/spark-submit
–class WordCount
–master yarn
–deploy-mode cluster
./WordCount.jar
./input ./output

Spark Yarn Cluster模式运行流程

命令行-脚本执行- SparkSubmit- 内部调用Client类里面的main方法并执行- 封装并发送指令bin/java ApplicationMaster-RM(ResourceManager)- 选择一台NM启动AM(ApplicationManager)- AM启动Driver线程 (执行代码-初始化SC-任务切分)- 申请资源-启动ExecutorBackend(bin/java CoarseGrainedExecutorBackend)- 在EB内部创建Executor对象- 接受Dirver分配的任务
Spark Yarn Cluster模式运行流程_第1张图片

你可能感兴趣的:(大数据,scala)