Hadoop:处理工作流的方法

1、串行的运行多个MR Job

2、使用JobControl类

3、使用ChainMapper、ChainReducer

4、使用Oozie

参考:

MapReduce,组合式,迭代式,链式: http://www.cnblogs.com/liqizhou/archive/2012/05/14/2499653.html

Hadoop使用JobControl设置job之间的依赖关系: http://blog.csdn.net/yongjian_luo/article/details/9424431

使用JobControl管理mapreduce多job依赖: http://zhenghangcx.iteye.com/blog/1834889

Oozie简介 : http://www.infoq.com/cn/articles/introductionOozie

你可能感兴趣的:(Hadoop:处理工作流的方法)