namenode和Secondary NameNode工作机制

HDFS集群有两类节点,即一个NameNode(管理者)和多个DataNode(工作者)。NameNode(以下简称nn)是master,主要负责管理hdfs文件系统,具体地包括namespace管理(其实就是目录结构),block管理(其中包括 filename->block,block->ddatanode list的对应关系)。DataNode(以下简称dn)主要是用来存储数据文件。

还有一个重要的节点:Secondary NameNode,该部分主要是定时对NameNode进行数据snapshots进行备份,这样尽量降低NameNode崩溃之后,导致数据的丢失,其实所作的工作就是从nn获得fsimage和edits把二者重新合并然后发给nn,这样,既能减轻nn的负担又能保险地备份。  体现了分布式架构中的高可用性。

下图为nn和snn交互的工作机制:

namenode和Secondary NameNode工作机制_第1张图片

 

 

你可能感兴趣的:(Hadoop)