【精】HDFS的HA系列(一)--- 背景、架构

本文作为HDFS HA系列的第一篇文章,主要简单描述一下HDFS HA的产生背景和整体架构。同时也会对后续系列文章要讲解的内容列出一个大致提纲。

一、Hadoop HA背景:

单点故障(英语:single point of failure,缩写SPOF)是指系统中一点失效,就会让整个系统无法运作的部件,换句话说,单点故障即会整体故障。

在Hadoop 2.0.0之前,NameNode是HDFS集群中的单点故障(SPOF)。每个集群都有一个单独的NameNode,如果该机器或进程变得不可用,整个集群将不可用,直到NameNode重新启动或在单独的机器上启动。

因此Hadoop进化出了Hadoop HA方案来解决NameNode的单点故障问题。一句话概括Hadoop HA架构:运行两个或两个以上冗余的NameNode服务作为现有NameNode的热备(hot standby)。当现有的Acitve NameNode服务崩溃时、或者Active NameNode所在节点例行硬件检修时可以进行快速且优雅的failover,让Standby NameNode成为新的Active NameNode,保证HDFS服务正常运行。

二、架构

HDFS HA的架构如下图所示,在Hadoop 3.x之后,支持多个standby namenode和observer namenode,但是Active namenode还是只允许有一个。因此下面的一acitve一stanby的架构图并不过时。

你可能感兴趣的:(HDFS全方位实战,hdfs,架构,hadoop)