Oozie 介绍

Hadoop 调度框架

  • Linux Crontab
  • Azkaban
    https://azkaban.github.io/
  • Oozie
    http://oozie.apache.org/
  • Zeus
    https://github.com/michael8335/zeus2

Azkaban, Open-source Workflow Manager

Oozie 介绍_第1张图片

Oozie, Workflow Engine for Apache Hadoop

Oozie 介绍_第2张图片

Zeus2, Hadoop job work flow schedule

Oozie 介绍_第3张图片

Apache Oozie Workflow Scheduler for Hadoop

  • 一个基于工作流引擎的开源框架,是由Cloudera公司贡献给Apache的,它能够提供对Hadoop MapReduce和Pig Jobs的任务调度与协调。Oozie需要部署到Java Servlet容器中运行。
  • Oozie工作流定义,同JBoss jBPM提供的jPDL一样,也提供了类似的流程定义语言hPDL,通过XML文件格式来实现流程的定义。对于工作流系统,一般都会有很多不同功能的节点,比如分支、并发、汇合等等。
  • Oozie定义了控制流节点(Control Flow Nodes)和动作节点(Action Nodes),其中控制流节点定义了流程的开始和结束,以及控制流程的执行路径(Execution Path),如decision、fork、join等;而动作节点包括Hadoop map-reduce、Hadoop文件系统、Pig、SSH、HTTP、eMail和Oozie子流程。

WordCount Workflow Example

Oozie 介绍_第4张图片

Oozie 介绍_第5张图片

Oozie, Workflow Engine for Apache Hadoop

Oozie 介绍_第6张图片
  • Oozie Workflow


    Oozie 介绍_第7张图片
  • Lifecycle of an Oozie coordinator


    Oozie 介绍_第8张图片
  • Oozie Bundle


    Oozie 介绍_第9张图片
    image.png

Oozie Server Architecture架构图

Oozie 介绍_第10张图片

Oozie server components 服务组件

Oozie 介绍_第11张图片

你可能感兴趣的:(Oozie 介绍)