mapreducer 分布式计算框架

mapreducer是经典的计算框架,是学习大数据处理的基础,请带着这句话“化大为小,分而治之” 点击下面连接按笔记顺序进行学习

  1. mapreducer 原理

  2. hadoop 的 Windows 伪分布式环境部署

  3. Windows 开发 wordcount

  4. mapreducer 编程 counter、combiner、压缩、任务配置、MR JOB 配置文件的加载机制

  5. mapper 本地模式执行过程源码分析

  6. mapreducer 编程,排重、全局与分组的最大值最小值词计算、自定义序列化类

  7. mapreducer 编程,多目录输出、innerjoin 实现、多目录输入并指定所用 mapper

  8. mapreducer 編程,semijoin,distributedcache 使用,排序,writableComparator 使用

  9. mapreducer 编程,自定义 partition 实现整体排序、自定义组合 key 实现二次排序、assembly 打包方式、集群运行 mr 程序

  10. mapreducer 编程,任务工作链、生产项目打包方式

  11. mapreducer 编程,任务工作链高级运行方法

你可能感兴趣的:(mapreducer 分布式计算框架)