mapreduce流程理解

自定义的mapper和reduce类作为两个阶段的任务处理类

mapper类:

setup();     map();     cleanup();       run();  

setup是用类似进行map前的一些准备工作;map承担主要的处理工作;cleanup则是收尾工作如关闭文件或者执行map后的k-v分发等;

run提供了setup到map到cleanup的执行模板。

reducer类

reduce;     configure;     close;

主要使用reduce方法


job类使用

先实例化

Job job = new Job(config);

需要设置job执行作业的输入和输出文件的路径

设置任务处理类

设置输出的key和value的类型

执行job     job.waitForCompletion(true);

你可能感兴趣的:(mapreduce流程理解)