hadoop MultipleOutputs规定多文件名

在map或reduce中

1.初始化在configure或setup方法中

MultipleOutputs.addMultiNamedOutput(conf, "prefix", TextOutputFormat.class, Text.class, Text.class);
multipleOutputs = new MultipleOutputs(conf);

 2.在mapper或reducer中

OutputCollector<NullWritable,Text> collector = multipleOutputs.getCollector("prefix-", "partition1", reporter);
		

 3.在close方法中

multipleOutputs.close();

 

 

这样这个reduce输出的文件名为prefix-partition1-00000

 

 

你可能感兴趣的:(hadoop,MultipleOutputs)