好的,我们带着问题来具体操作一下;
1.首先在CDH,HDFS中配置找到复制因子(dfs.replication),如下:
将原有dfs.replication的值 3 改为 2。
2.然后所有服务列表会出现如下显示:
3.我们只需要点击随意的一个flume或者hdfs或者其他服务的重启(包含配置分发)均可。
4.等待成功重启后,我们就可以慢慢那么的看到HDFS的存储数量下降:
结论就是,当我们修改HDFS的备份数量时,集群会自适应的修改和删除的多余备份数据。
--
另外,如果没有自动的删除备份数据,我们也可以使用命令,手动清除备份数据
hdfs dfs -setrep -w 2 /hdfs目录路径