Hadoop权威指南第2章笔记

MapReduce 是一种可用于数据处理的编程模型. Hadoop 可以运行各种语言版本的 MapReduce 程序. 将看到同一个程序的 Java, Ruby, Python 和 C++ 语言版本. MapReduce 程序本质上是并行运行的, 可以将大规模的数据分析任务分发给任何一个拥有足够多机器的数据中心.

2.3 使用 Hadoop 来分析数据

2.3.1 map 和 reduce

  • map 阶段
  • reduce 阶段


    Hadoop权威指南第2章笔记_第1张图片
    image.png

你可能感兴趣的:(Hadoop权威指南第2章笔记)