Hadoop的备份或迁移

Hadoop的备份或迁移,可以从三个角度进行考虑:

一、Datanode数据备份

Hadoop中的数据,可以通过dfs.replication来设置其备份的数量。具体参见安装部署过程中对hdfs-site.xml文件的配置

二、Namenode元数据备份

通过SecondNameNode进行元数据的备份,当namenode出现异常时,可以从SecondNameNode进行恢复。

三、集群之间的数据备份

    使用 hadoop distcp命令,进行两个集群间的数据备份。考虑到数据规模的问题,一般是将一些旧的历史数据,迁移到另外一个集群中。而不是对两个集群做一致性备份。

你可能感兴趣的:(hadoop)