Hadoop_MapReduce实践 (二) => (核心架构、序列化、Inputformat/切片、Shuffile/分区/排序、outputformat、join、ETL、压缩)
目录Hadoop_HDFS、Hadoop_MapReduce、Hadoop_Yarn实践(二)一、Hadoop_HDFS二、Hadoop_MapReduce1、MapReduce概述1.1、MapReduce定义1.2、优缺点1.3、核心编程思想1.4、MapReduce进程1.5、官方wordcount源码1.6、统计文件中单词出现的重复个数(Worldcount)实操1.6.1、配置依赖`po