reducer多输出

这几天用同事修改的multipleoutputs做了reducer多输出的工作,备忘一下,由于公司用的hadoop是0.20版本的,所以需要自己重新override multipleTextoutputs函数,这个也是用的同事的代码。但是现在有个问题就是,每一个类型的输出都是那么多reducer,必然会造成有些文件过小。我同事说可以用另外一种方法,好像要在multipleoutput中使用另外一种方式,具体我回头再看看。


这部分代码我打包到网盘了,等具体要用时再回头看,现在我在想不分开生成了,所以就用不上了。

你可能感兴趣的:(reducer多输出)