Hadoop2x的体系架构

(一)存储海量数据的HDFS


Hadoop2x的体系架构_第1张图片
HDFS的体系架构

     1.NameNode和DataNode

            NameNode:

             (a)负责接受客户端的请求

             (b)负责元信息的维护

             (c)HDFS的管理员

            DataNode:

              (a)保存数据

               (b)block数据块:hadoop 1.x的block是64M;hadoop 2.x是128M。

        2.上传和下载过程

               上传:

Hadoop2x的体系架构_第2张图片
HDFS上传过程示例

                       下载:

Hadoop2x的体系架构_第3张图片
HDFS下载过程示例

                   3.SecondaryNameNode:负责元信息的合并

                           (a)FSImage文件:元信息在硬盘上的景象

                           (b)Edits文件:HDFS日志文件,有元信息的最新操作日志。

                           (c)合并过程:合并FSImage文件+Edits文件,形成最新的FSImage文件

Hadoop2x的体系架构_第4张图片
合并过程示例


海量数据的计算模型MapReduce(Yarn)


Hadoop2x的体系架构_第5张图片
Yarn运行过程示例


HBase

   体系结构

Hadoop2x的体系架构_第6张图片
HBase的体系结构

表结构

    体系结构的region=列族

Hadoop2x的体系架构_第7张图片
表结构

你可能感兴趣的:(Hadoop2x的体系架构)