Hadoop初步认识

概念理解:

  1. Mapreduce是一种模式。

  2. Hadoop是一种框架,适合大数据的分布式存储与计算平台。

  3. Hadoop是一个实现了mapreduce模式的开源的分布式并行编程框架。

一句话概括:在hadoop的框架上采取mapreduce的模式处理海量数据

HDFS:分布式文件系统

MapReduce:并行计算框架

Hadoop的特点(团队作战)

  1. 扩容能力:可靠存储和处理千兆字节数据(PB)

  2. 成本低

  3. 高效率:并行处理

  4. 可靠性

Hadoop三种模式:

  1. 单机模式:仅限调试

  2. 伪分布模式:模拟分布式节点

  3. 完全分布式模式:正常的hadoop集群,有多个节点构成


你可能感兴趣的:(hadoop)