MapReducer面试题:编写MapReduce作业时,如何做到在Reduce阶段,先对key排序,再对value排序?

该问题通常称为“二次排序”,最常用的方法是将value放到key中,实现一个组合Key,然后自定义key排序规则(为key实现一个WritableComparable)。

你可能感兴趣的:(MapReducer面试题:编写MapReduce作业时,如何做到在Reduce阶段,先对key排序,再对value排序?)