大数据处理-mapreduce 代码入门实例-多表连接、对单词排序、对数据过滤、统计单词数量并排序、分区统计等
多表连接思路为,通过map阶段将数据按进行map,key为id,则shuffle阶段会自动进行组合,但同时对两个表的内容进行标记,进行笛卡尔积时可以进行区分。代码如下packageorg.apache.hadoop.examples;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.fs.Path;importor