spark on yarn 两种运行模式(client 、cluster)对比

机器:

  • master1 : ResourceManager Master

  • node2 : NodeManager Worker

  • node3: NodeManager Worker

  • node4: NodeManager Worker

此时同时开启了 Yarn 和 Spark Standalone

Spark on Yarn 模式不需要打开Spark集群.

图片

spark on yarn 两种运行模式(client 、cluster)对比_第1张图片

点击查看原图

对比(文字):

模式 提交模式 driver(main方法,用户程序) ApplicationMaster ResourceManager NodeManager Master Worker Container Executor
standalone –master spark://master1:7077 在Master上 在Master上 用户程序通过与Master节点交互,申请所需资源 Worker节点负责具体Executor的启动运行 运行在Work上,里面运行Task上,CoarseGrainedExecutorBackend进程
spark on yarn(client) –master yarn –deploy-mode client driver运行在提交作业的机器上(可以看到程序打印日志) 运行在某一台机器上,向RM申请资源(container),杀死任务 管理资源,接受任务 根据RM命令,分配container Container里面运行着Spark Executor 运行在Container里里面运行Task
spark on yarn(cluster) –master yarn –deploy-mode cluster driver运行在集群上某个机器上(看不到日志,只可以看到running状态),Driver在AppMaster执行 运行在集群某一台机器上,申请资源(container),杀死任务. 管理资源,接受任务 根据RM命令,分配container Container里面运行着Spark Executor 运行在Container里,里面运行Task

你可能感兴趣的:(-----Spark)