ceph (luminous 版) 故障修复记录

前提:

由于存储掉电, 导致启动后无法启动 OSD
利用 ceph osd tree 可以发现故障 OSD 位置

当前架构

2 sata 磁盘创建 raid1 作为系统盘
10 sata 磁盘,  每个创建独立的 raid0 ,  作为独立 ceph osd 磁盘使用
2 ssd 磁盘 ( 每个 ssd 独立划分 5 分区 ) 每个磁盘分区对应一个 ceph osd 作为 raw journal device 使用( 注, 每个分区都没有文件系统 )

修复思路

1. 尝试启动 ceph osd  
2. 假如无法启动,  则尝试修复系统文件 (xfs filesystem)
3. 假如文件系统修复后也无法启动,  尝试修复 journal data

记录

直接启动 ceph osd

[root@ns-ceph-208191 ~]# systemctl status ceph-osd@104
● [email protected] - Ceph object storage daemon osd.104
   Loaded: loaded (/usr/lib/systemd/system/[email protected]; disabled; vendor preset: disabled)
   Active: activating (auto-restart) (Result: core-dump) since Fri 2018-01-26 22:58:56 CST; 1s ago
  Process: 13464 ExecStart=/usr/bin/ceph-osd -f --cluster ${CLUSTER} --id %i --setuser ceph --setgroup ceph (code=dumped, signal=ABRT)
  Process: 13458 ExecStartPre=/usr/lib/ceph/ceph-osd-prestart.sh --cluster ${CLUSTER} -

你可能感兴趣的:(ceph (luminous 版) 故障修复记录)