Ceph 故障修复记录(持续更新)

目录

文章目录

  • 目录
  • 问题:故障域与副本数导致的 PG 不正常

问题:故障域与副本数导致的 PG 不正常

缘起:执行 rbd snap unprotect 执行卡死。
在这里插入图片描述
调查:Ceph 集群 PG 不正常。

Ceph 故障修复记录(持续更新)_第1张图片
原因:因为该环境是一个 All-in-one 的环境,CRUSH bucket 默认为 Host 级别,与此同时 Pool: default.rgw.control 的 Replication Size: 3,min_size: 2。在这样的前提下就要求 Ceph 集群中至少必须存在 2 个节点,在数据写入的时候写入到 2 个不同的故障域中,以此来保证高可用特性。

Ceph 故障修复记录(持续更新)_第2张图片

解决:将 Pool: default.rgw.control 的 min_size 设置为 1。

ceph osd pool set default.rgw.control min_size 1

你可能感兴趣的:(Ceph 故障修复记录(持续更新))