使用lsvg -p查看rootvg的时候,发现hdisk0状态为missing
# lsvg -p rootvg (主要是查看hd5和dump文件所在位置)
# bootlist -m normal -o(查看系统正常开机的引导顺序,实际上还是确定hd5,同时确定boot引导信息有无备份)
查看roovg的镜像情况,存放系统dump的LV未做镜像(此为正常,dump文件是不做镜像的),不巧的是此LV在损坏的硬盘hdisk0上
需重新指定新的dump文件
# lsvg -l rootvg
# sysdumpdev -l
# sysdumpdev -L /*查询系统上次产生dump的详细信息
# sysdumpdev -e /*预估系统产生dump文件的大小
如果dump设备在损坏的磁盘上,则需在好的磁盘上重新创建dump设备,具体步骤如下:
在hdisk1上创建和原来相同大小的dump空间
#smit mklv 类型为sysdump
重新指定dump设备,基本参数都是按照之前 sysdumpdev -e 所得结果来的
# sysdumpdev -P -p lv_name lv_name为上一步创建的lv
解除rootvg镜像
# unmirrorvg rootvghdisk0
删除磁盘hdisk0上的lv
# smit rmlv
将磁盘hdisk0从rootvg中去除
# reducevg rootvghdisk0
# rmdev -dl hdisk0
# lscfg -vps | grep hdisk0
(此处显示的槽位号跟实际的槽位号对不上,不知道是什么原因,最后使用硬盘序列号进行定位的,这个过程是在机器关机后完成的)
使用diag 标记坏硬盘
1.登陆AIX,执行#diag
2.回车
3.选择“TaskSelection”
4.按PgDn,选择“Hot Plug Task”
5.选择“SCSIand SCSI RAID Hot Plug Manager”
6.选择“Identifya Device Attached to a SCSI Hot Swap Enclosure Device”
7.选择想判定位置的目标DISK,比如:hdisk0
8.回车,这个时候去观察硬盘,你会发现硬盘的指示灯会显示“红色”,这个硬盘就是你需要判定的目标盘。
9.如果想把这个有故障的硬盘从SCSI剔除,返回上一级菜单选择“Replace/Remove a Device Attached to an SCSI Hot Swap EnclosureDevice”
插入新的硬盘,识别硬盘并加入卷组
# cfgmgr -v
# extendvg rootvg hdisk0
rootvg 做镜像,报如下错误:
# mirrorvg -m rootvg hdisk0 (此处的-m参数的含义是使新添加的硬盘的物理分区次序和原先副本排序精确保证一致)
0516-1115 mirrorvg:Target disks must be equal or larger in size than the source disks.
0516-1200 mirrorvg:Failed to mirror the volume group.
查看各磁盘的PV数:
新加的磁盘hdisk0的PV数比原有磁盘PV数少一个,这就是为什么做镜像失败的原因。
VG无法做镜像了,尝试使用另一种方法----LV间做镜像
做完发现两个磁盘数据块写的位置不一样(即每个LP在每个磁盘上所对应的PP的位置要相同),无法满足客户要求,如下图所示:
删除LV镜像:
# rmlvcopy lv_test 1
具体步骤如下:
查看源磁盘(hdisk1)上各LV存储的位置:
# lslv -m lv_test
lv_test:/mirror
LP PP1 PV1 PP2 PV2 PP3 PV3
0001 0109 hdisk1
0002 0110 hdisk1
0003 0105 hdisk1
0004 0106 hdisk1
0005 0004 hdisk1
0006 0006 hdisk1
然后创建一个文件(即mapfile),内容及格式如下:
# vi mapfile
hdisk0:109-110
hdisk0:105-106
hdisk0:004-006 /*每个区间都要写
执行以下命令对lv_test做LV镜像:
# mklvcopy -m./mapfile lv_test 2
再次查看:
# lslv -m lv_test
lv_test:/mirror
LP PP1 PV1 PP2 PV2 PP3 PV3
0001 0109 hdisk1 0109 hdisk0
0002 0110 hdisk1 0110 hdisk0
0003 0105 hdisk1 0105 hdisk0
0004 0106 hdisk1 0106 hdisk0
0005 0004 hdisk1 0004 hdisk0
0006 0006 hdisk1 0005 hdisk0
可以看到,每个LP所对应的PP的位置都一样。依此,对其他所有LV做镜像(注:dump设备是不需要做镜像的)。
对所有LV做完镜像后还需做如下操作:
# bosboot -a -d /dev/hdisk0
更新系统引导列表
# bootlist -m normal hdisk0 hdisk1
查看系统引导信息
# bootlist -m normal -o
至此,硬盘更换处理完毕。
换个硬盘搞得我和小伙伴都惊呆了呀:
先是无法判断故障硬盘的具体位置,不得已通过关机通过diag来解决;然后发现dump文件位置恰好在故障磁盘上,只能通过重建dump文件;
最后更换玩磁盘后,又发现所换磁盘因pp个数不能满足要求,不得已又得通过lv镜像来完成rootvg上lv的镜像;
眼看就要完成了,竟发现lv镜像在rootvg的两块磁盘上的位置不一致,最终通过写配置文件来解决这个问题!
更换rootvg中的磁盘需要注意哪些问题:
hd5(引导信息)肯定是率先想到的,其次是dump文件,最后别忘了将引导信息的重新写入新的磁盘中!