MapReduce-海量数据离线处理


MapReduce的数据划分不是物理拆放,是逻辑划分,划分的是区域
数据库以keyvalue的形式存在map中。key叫偏移量。


从头到尾文字的长度叫偏移量

处理的是value

这个key是分类

汇总落地

这个key是字符串,values是数组

合并计算

你可能感兴趣的:(MapReduce-海量数据离线处理)