121、Spark核心编程进阶之Spark Standalone集群架构

121、Spark核心编程进阶之Spark Standalone集群架构_第1张图片

Standalone集群架构.png

 

Spark Standalone集群
集群管理器,cluster manager:Master进程
工作节点:Worker进程

Spark Standalone集群模式与YARN集群模式不同之处就在于:
如果是Spark Standalone模式,甚至你根本不需要YARN集群,甚至连HDFS集群都可以不需要
Spark,Master+Worker集群架构,就足够了,然后就可以编写spark作业,提交作业到Master+Worker集群架构中去运行

两种deploy mode:

  1. client:你在哪台机器上,用spark-submit提交spark作业,就会在那台机器上启动driver进程
  2. cluster:作业是提交给master,master找一台worker进程,启动driver

你可能感兴趣的:(Spark入坑)