map-reduce 、map、reduce


map-reduce 、map、reduce_第1张图片

                                           map-reduce 过程

中间绿线区域就是shuffle(“洗牌”)过程:map之后,reduce之前的过程

可以这样理解:一个map 产生的数据,结果通过hash过程分区却分配给了不同的reduce任务,就相当于对数据洗牌的过程。


map-reduce 、map、reduce_第2张图片

                                                                             map端过程



map-reduce 、map、reduce_第3张图片

                                                                                               reduce 过程 

你可能感兴趣的:(hadoop,map-reduce,过程图)