MapReduce的分区与分组的区别

MapReduce的分区与分组的区别

看了许多关于这方面的博客,大多在阐述概念,说的不是很让我明白。
我觉得分区就是根据key来决定哪些key-value被分到同一个reduce处理,
分组是根据key来决定同一个reduce中的key-value在同一批次中进行处理
在reduce中,一个key对应着一个迭代器,而这些迭代器中的值就来自于同一组。

你可能感兴趣的:(Hadoop)