P6-570更换rootvg镜像故障硬盘之我和小伙伴都惊呆了

1.故障现象:
            小型机一块硬盘亮黄灯,errpt有硬盘报错。

2.原因分析:
            硬盘故障。

3.解决步骤:

使用lsvg -p查看rootvg的时候,发现hdisk0状态为missing

# lsvg -p rootvg (主要是查看hd5和dump文件所在位置)

3.1 查看系统引导文件的位置,发现在hdisk1


# bootlist -m normal -o(查看系统正常开机的引导顺序,实际上还是确定hd5,同时确定boot引导信息有无备份)

查看roovg的镜像情况,存放系统dumpLV未做镜像(此为正常,dump文件是不做镜像的),不巧的是此LV在损坏的硬盘hdisk0

需重新指定新的dump文件


# lsvg -l rootvg

3.2 查看dump设备


# sysdumpdev -l

# sysdumpdev -L      /*查询系统上次产生dump的详细信息

# sysdumpdev -e      /*预估系统产生dump文件的大小


3.3 重建dump设备

如果dump设备在损坏的磁盘上,则需在好的磁盘上重新创建dump设备,具体步骤如下:

hdisk1上创建和原来相同大小的dump空间

#smit mklv          类型为sysdump

重新指定dump设备,基本参数都是按照之前 sysdumpdev -e 所得结果来的

# sysdumpdev -P -p lv_name      lv_name为上一步创建的lv


3.4解除rootvg镜像,并把hdisk0从中剔除

解除rootvg镜像

# unmirrorvg rootvghdisk0

删除磁盘hdisk0上的lv

# smit rmlv

将磁盘hdisk0rootvg中去除


# reducevg rootvghdisk0

# rmdev -dl hdisk0


3.5确定故障磁盘——hdisk0的物理槽位

# lscfg -vps  | grep hdisk0      

 (此处显示的槽位号跟实际的槽位号对不上,不知道是什么原因,最后使用硬盘序列号进行定位的,这个过程是在机器关机后完成的)

使用diag 标记坏硬盘

1.登陆AIX,执行#diag
2
.回车
3
.选择“TaskSelection”
4
.按PgDn,选择“Hot Plug Task”
5
.选择“SCSIand SCSI RAID Hot Plug Manager”
6
.选择“Identifya Device Attached to a SCSI Hot Swap Enclosure Device”
7
.选择想判定位置的目标DISK,比如:hdisk0
8
.回车,这个时候去观察硬盘,你会发现硬盘的指示灯会显示红色,这个硬盘就是你需要判定的目标盘。
9
.如果想把这个有故障的硬盘从SCSI剔除,返回上一级菜单选择“Replace/Remove a Device Attached to an SCSI Hot Swap EnclosureDevice”


3.6 更换磁盘,并重新识别

插入新的硬盘,识别硬盘并加入卷组

# cfgmgr -v

# extendvg rootvg hdisk0

rootvg 做镜像,报如下错误:

# mirrorvg -m rootvg hdisk0     (此处的-m参数的含义是使新添加的硬盘的物理分区次序和原先副本排序精确保证一致

0516-1115 mirrorvg:Target disks must be equal or larger in size than the   source disks.

0516-1200 mirrorvg:Failed to mirror the volume group.

查看各磁盘的PV数:


P6-570更换rootvg镜像故障硬盘之我和小伙伴都惊呆了_第1张图片
        新加的磁盘hdisk0PV数比原有磁盘PV数少一个,这就是为什么做镜像失败的原因

VG无法做镜像了,尝试使用另一种方法----LV间做镜像

做完发现两个磁盘数据块写的位置不一样(即每个LP在每个磁盘上所对应的PP的位置要相同),无法满足客户要求,如下图所示:

P6-570更换rootvg镜像故障硬盘之我和小伙伴都惊呆了_第2张图片

删除LV镜像:

# rmlvcopy lv_test 1   


具体步骤如下:

查看源磁盘(hdisk1)上各LV存储的位置:

# lslv -m lv_test

lv_test:/mirror

LP    PP1 PV1               PP2  PV2               PP3  PV3

0001  0109 hdisk1                       

0002  0110 hdisk1                       

0003  0105 hdisk1                       

0004  0106 hdisk1                       

0005  0004 hdisk1                       

0006  0006 hdisk1                       

然后创建一个文件(即mapfile,内容及格式如下:

# vi mapfile

hdisk0:109-110

hdisk0:105-106

hdisk0:004-006           /*每个区间都要写

执行以下命令对lv_testLV镜像:

# mklvcopy -m./mapfile lv_test 2

再次查看:

# lslv -m lv_test

lv_test:/mirror

LP    PP1 PV1               PP2  PV2               PP3  PV3

0001  0109 hdisk1            0109 hdisk0           

0002  0110 hdisk1            0110 hdisk0           

0003  0105 hdisk1            0105 hdisk0           

0004  0106 hdisk1            0106 hdisk0           

0005  0004 hdisk1            0004 hdisk0           

0006  0006 hdisk1            0005 hdisk0           

可以看到,每个LP所对应的PP的位置都一样。依此,对其他所有LV做镜像(注:dump设备是不需要做镜像的)。

对所有LV做完镜像后还需做如下操作:


3.7 讲引导信息写到更换的磁盘中

# bosboot -a -d /dev/hdisk0

更新系统引导列表

# bootlist -m normal hdisk0 hdisk1

查看系统引导信息

# bootlist -m normal -o

至此,硬盘更换处理完毕。



4.总结

换个硬盘搞得我和小伙伴都惊呆了呀:

先是无法判断故障硬盘的具体位置,不得已通过关机通过diag来解决;然后发现dump文件位置恰好在故障磁盘上,只能通过重建dump文件;

最后更换玩磁盘后,又发现所换磁盘因pp个数不能满足要求,不得已又得通过lv镜像来完成rootvg上lv的镜像;

眼看就要完成了,竟发现lv镜像在rootvg的两块磁盘上的位置不一致,最终通过写配置文件来解决这个问题!


更换rootvg中的磁盘需要注意哪些问题:


hd5(引导信息)肯定是率先想到的,其次是dump文件,最后别忘了将引导信息的重新写入新的磁盘中!



你可能感兴趣的:(P6-570更换rootvg镜像故障硬盘之我和小伙伴都惊呆了)