Linux Hadoop集群报警,磁盘满了

1)  执行df -h命令

Filesystem            Size  Used Avail Use% Mounted on
/dev/mapper/VolGroup-lv_root
                       30G  9.2G   19G  33% /
tmpfs                 3.9G     0  3.9G   0% /dev/shm
/dev/sda1             477M   64M  389M  14% /boot
/dev/mapper/VolGroup-lv_data
                      130G  101G   23G  82% /xxx
/dev/mapper/VolGroup-lv_var
                       30G  582M   28G   3% /var

可以查看整个磁盘的挂在情况,通过这个命令可以发现 xxx的负载是 82%

2) 执行du -sch * | grep G 查看当前目录下文件大于一个G的文件 或者执行 ll -h 查看某个文件的大小

[[email protected] gomeo2o]# du -sch * |grep G
83G	data
11G	logs
6.3G	software
100G	total
3) 这个时候就可以删除某些大于1G的文件

4) 执行hadoop fs -ls / 查看hdfs集群中都有哪些文件

5) 执行hadoop fs -du -h / 查看hdfs中集群中文件的大小

6) 执行hadoop fs -rmr /tmp/*  比如我们这里删除tmp下的文件

7) 执行hadoop fs -rmr /user/hadoop/.Trash 清空垃圾站 否则 第六步删除的文件会存放在垃圾站中,还是占用磁盘空间

     ---备注:/user/hadoop中hadoop是超级用户

8) 等待大于30s(垃圾站清空需要一定时间) 再次执行 df 可以看到磁盘占用率下降


另外Zookeeper也是需要关注的一点:

正常运行过程中,ZK会不断把快照数据和事务日志输出到两个目录下,并且如果没有认为操作的话,ZK自己是不会清理这些文件的,需要管理员来清理。

清理的方式常用的有三种:

1)直接rm 日志文件和快照文件 (--这种方式比较常用,常用于运维人员写在脚本中)

2)执行zkClieanup.sh -n 3 只保留最新的三份日志文件和快照文件 (--这种方式比较常用,可以防止误删数据)

3)在zoo.cfg配置文件中配置 (--这种方式在对性能要求比较高的场景下,会出现问题)



你可能感兴趣的:(Linux)