1 Hadoop入门

1.Hadoop是什么?

(1)Hadoop是一个由Apache基金会所开发的分布式系统基础架构。
(2)主要解决,海量数据的存储和海量数据的分析计算问题。
(3)广义上来说,Hadoop通常是指一个更广泛的概念——Hadoop生态圈

2.Hadoop的优势

1 Hadoop入门_第1张图片
1 Hadoop入门_第2张图片

3 Hadoop组成

1 Hadoop入门_第3张图片

4 HDFS概述

1 Hadoop入门_第4张图片

5 YARN架构概述

Yet Another Resource Negotiator 简称 YARN ,另一种资源协调者,是 Hadoop 的资源管理器。

yarn主要管理的是整个集群的内存和cpu
1 Hadoop入门_第5张图片
ApplicationManager运行在Container(容器)上,容器是一种虚拟化的技术,类似阿里云的容器虚拟技术,不会是真正的无数台服务器.

6 MapReduce架构概述

负责hadoop中的计算部分
1 Hadoop入门_第6张图片

7 HDFS、YARN、MapReduce 三者关系

1 Hadoop入门_第7张图片

你可能感兴趣的:(Hadoop,hadoop,大数据,分布式)