常用ceph集群故障检查命令

## 显示集群所有的异常状态信息
ceph health detail

## 指定PG ID进行3个副本的数据校验
ceph pg scrub 

## 指定PG ID进行repair
ceph pg repair 

## inactive无法处理读或写,正在等待其他osd的最新副本
## unclean 未达到指定副本,应该被恢复
## stale 当前pg卡住,因为osd primary未在规定时间上报状态给mon
ceph pg dump_stuck {inactive|unclean|stale} {} (ok表示无异常)

## 查看集群osd的结构,可以和lsblk结果对比。
ceph osd tree/dump

## 定位osd在哪台主机
ceph osd find 

## 修改osd权重,weight范围为0.0-1.0.一般用于缩容。
ceph osd reweight  

## 调整pool参数,常用于调整副本数、pg数。pg数见一位2的n次方,向大调整
ceph osd pool set {pool-name} {key} {value}

## 调整集群状态,一般在调整集群时设置
ceph osd set/unset nodown/noout/nobackfill

## 批量开启

cat rgw.txt | xargs -i -P 20 systemctl start/status/stop {} 

你可能感兴趣的:(ceph,运维)