《MapReduce 4》--自定义分区、shuffle技术、环形缓冲区(MapOutputBuffer源码解析)、Maptask源码解析
如何自定义分区:原理:intgetPartition(LongWritablekey,Textvalue,intnumPartitions)此方法的返回值为分区的索引(分区就是由索引作为唯一标识符),该方法确定当前key/value属于哪个索引对应的分区。由于if(partition=partitions){thrownewIOException("Illegalpartitionfor"+key