Spark任务执行流程

Spark任务执行流程_第1张图片

  1. Driver启动,创建SparkContext
  2. SparkContext 向资源管理器注册,并向资源管理器申请运行 Executor
  3. 资源管理器分配资源,然后资源管理器启动 Executor
  4. Executor 发送心跳至资源管理器
  5. Executor 向 Driver注册自己
  6. SparkContext 构建 DAG 有向无环图
  7. DAGScheduler 将 DAG 分解成 Stage(TaskSet)
  8. 把 Stage 发送给 TaskScheduler
  9. Executor 向 SparkContext 申请 Task
  10. TaskScheduler 将 Task 发送给 Executor 运行
  11. 同时 SparkContext 将应用程序代码发放给 Executor
  12. Task 在 Executor 上运行,运行完毕释放所有资源

下篇:Spark任务提交流程

你可能感兴趣的:(Spark,spark)