Hadoop入门——汇总

一.简介

初识hadoop

 

二.环境搭建

配置文件说明

伪分布式环境的搭建

 

三.MapReduce

MapReduce基础概念

序列化与Writable接口

MapReduce的输入与输出

MapReduce中的压缩

程序的几种运行提交模式

自定义分区Partitioner

MapReduce基于CombineFileInputFormat处理海量小文件

MapReduce对于海量小文件的多种解决方案

MapReduce表连接操作之Map端join

MapReduce自定义RecordReader

MapReduce中多个数据源协调处理

链式MapReduce(ChainMapper和ChainReducer)

你可能感兴趣的:(Hadoop,Hadoop入门教程)