故障描述

查看pve管理后台概述,发现有告警,提示ceph健康告警。
Proxmox VE 超融合集群ceph OSD磁盘塞满处理_第1张图片
点这个黄色图标,得到更进一步的信息:有2个OSD磁盘塞满了。
Proxmox VE 超融合集群ceph OSD磁盘塞满处理_第2张图片
再用鼠标点击第一行“2 nearfull osd(?)”右侧的感叹号,可确定序号为5与7的磁盘塞满了。
Proxmox VE 超融合集群ceph OSD磁盘塞满处理_第3张图片

处理过程

确定被数据塞满的OSD位于哪些节点,然后在该节点删除没有运行的虚拟机或者不需要的虚拟机,以释放磁盘空间。

  •  确定磁盘位于哪些节点。 Proxmox VE 超融合集群ceph OSD磁盘塞满处理_第4张图片
    从上图可知,两个塞满了数据的磁盘分别位于两台不同的物理节点。分别登录两节点,使用命令行df –h 来查看磁盘使用情况,以进一步印证问题所在。
  •  Proxmox VE管理界面,删除未运行的虚拟机。
    Proxmox VE 超融合集群ceph OSD磁盘塞满处理_第5张图片
    手工输入欲删除的虚拟机ID。
    Proxmox VE 超融合集群ceph OSD磁盘塞满处理_第6张图片

    效果确认

    登录任意节点,运行指令ceph health,输出为OK即可。也可在web管理界面,查看集群概述,健康状况图标显示为绿色,就算暂时处理好了。

Proxmox VE 超融合集群ceph OSD磁盘塞满处理_第7张图片