Hadoop那点事

一、简述

Hadoop是一个开源、高可靠、可扩展的分布式计算框架。


二、解决的问题

海量数据的存储(HDFS),海量数据的分析(MapReduce),分布式资源调度(Yarn)


三、可靠性

Hadoop能自动维护数据的多份副本,并且在任务失败后能自动重新部署


四、Hadoop生态圈

Hadoop那点事_第1张图片


五、Hadoop核心

Hadoop项目主要包括以下四个模块

Hadoop Common:为其他Hadoop模块提供基础设施。

Hadoop HDFS:一个高可靠、高吞吐量的分布式文件系统

Hadoop MapReduce:一个分布式的离线并行计算框架

Hadoop YARN:一个新的MapReduce框架,任务调度与资源管理

你可能感兴趣的:(Hadoop那点事)