hadoop之mapreduce教程+案例学习(一)

第1章 MapReduce概述

目录

第1章 MapReduce概述

1.1 MapReduce定义

MapReduce是一个分布式运算程序的编程框架,是用户开发“基于Hadoop的数据分析应用”的核心框架。

MapReduce核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,并发运行在一个Hadoop集群上。

1.2 MapReduce优缺点

1.2.1 优点

1.2.2 缺点

1.3 MapReduce核心思想

总结:分析WordCount数据流走向深入理解MapReduce核心思想。

1.4 MapReduce进程

1.5 官方WordCount源码

1.6 常用数据序列化类型

1.7 MapReduce编程规范

2.Reducer阶段

3.Driver阶段

1.8 WordCount案例实操

1.需求

 3.环境准备

4.编写程序

第2章 Hadoop序列化

2.1.1 什么是序列化

2.1.2 为什么要序列化

2.1.3 为什么不用Java的序列化

2.2 自定义bean对象实现序列化接口(Writable)

2.3 序列化案例实操

第三章(见hadoop之mapreduce教程+案例学习(二))


1.1 MapReduce定义

MapReduce一个分布式运算程序的编程框架,是用户开发“基于Hadoop的数据分析应用”的核心框架。

MapReduce核心功能是将用户编写的业务逻辑代码自带默认组件整合成一个完整的分布式运算程序,并发运行在一个Hadoop集群上。

1.2 MapReduce优缺点

你可能感兴趣的:(Hadoop,mapreduce,hadoop)