Hadoop学习笔记

一.  MapReduce

 

MapReduce是一种用于数据处理的编程模型。

MapReduce本质是并行的,因此可在在一个拥有足够多机器的环境下完成大规模数据分析任务.即MapReduce的优势在于处理大型数据集。

 

图解:见图片附件1

 

单一reduce数据流图

 

二. Hadoop分布式文件系统

 

三. Hadoop的I/O

 

四. Hadoop的应用

 

五. MapReduce工作原理

 

六. MapReduce的类型与格式

 

七. MapReduce特性

 

八. Hadoop集群安装

 

九. Hadoop管理

 

你可能感兴趣的:(hadoop)