HDFS的组织架构

HDFS 是一个主从 Master/Slave 架构。一个 HDFS 集群包含一个 NameNode,这是一个 Master Server,用来管理文件系统的命名空间,以及调节客户端对文件的访问。一个 HDFS 集群还包括多个 DataNode,用来存储数据。
HDFS的组织架构_第1张图片

  1. namenode: 存储数据的元数据。
    a. 接收用户操作请求
    b. 维护文件系统的目录结构
    c. 管理文件与block之间关系,block与datanode之间关系

  2. datanode:
    a. 文件被分成block存储在磁盘上
    b. 为保证数据安全,文件会有多个副本

  3. client: 分别访问 NameNode 和 DataNode 以获取文件的元信息及内容。

  4. SecondaryNamenode: HA的一个解决方案,用于定期合并fsimage和edits,生成新的fsimage,并推送给Namenode,替换旧的fsimage.

你可能感兴趣的:(大数据面试,hadoop,hadoop)