HDFS 高可用 和 高扩展 :

 

HDFS 高可用 和 高扩展 :
高可用HA 一个集群中有多个namenode ,分为active(负责所有客户端操作),
JournalNodes cluster: 当ActiveNN(执行任何有关命名空间的修改)更新edits信息时,需要持久化到JN集群一半以上的节点;
(持久化是将程序数据在持久状态和瞬时状态间转换的机制。 通俗的讲,就是瞬时数据(比如内存中的数据,是不能永久保存的)持久化为持久数据(比如持久化至数据库中,能够长久保存)。)
而standby NN 持续监听JN的情况,读取从activeNN发送到JN上的信息,并更新自己内部的namespace
standby节点(负责同步ANN active namenode的信息,以提供故障恢复功能),
当active节点出现故障时,将使用standby节点顶上。
*故aNN和standbyNN需要保持静态(edits) 和动态(block和DN) 的数据同步
动态元数据通过DN们向所有的NN同步数据实现;

 

 

你可能感兴趣的:(hadoop,hdfs,大数据)