*******************************************************************************************
版权所有: www.foutime.com 深圳市方泰智能科技有限公司
通道锁 逃生锁 一卡通 楼宇对讲 停车场
*******************************************************************************************
1. 引言
如果你的AIX系统rootvg仅有一块硬盘,当灾难来临的时候,例如硬盘损坏,这就意味着你的系统就再也不能启动了。尽管你可能拥有mksysb的磁带,但你仍然需要花费很多的时间去处理这个原本很小的问题。rootvg镜像能够提供单机bos容错,使得你能够用最短的时间摆脱这种困境,简单到只需要一次重新启动,这就是rootvg镜像的作用。
一般情况下在生产环境中,我门的rootvg大多数是mirror,如果ML升级失败或者一些错误操作,导致无法恢复等,这是就需要我门迅速恢复rootvg,无论是使用磁带mksysb 恢复,还是网络引导恢复,这个速度各方面都不理想。使用alt_disk_copy恢复rootvg时间最快,同样简单到只需一次重新启动,这就是克隆的作用。
2. AIX镜像步骤
制作rootvg的标准步骤大致如下
1. extendvg
2. chvg �CQn
3. mirrorvg �Cs
4. syncvg �Cv
5. bosboot �Ca
6. bootlist
7. shutdown �CFr
8. bootinfo �Cb
2.1 将空闲磁盘加入rootvg,( extendvg)
(1)查看当前还未加入到其它vg的可用PV;
# lspv
hdisk000027c6a0507fe17rootvgactive
hdisk1noneNone
此结果表明hdisk1当前未在任何vg,可以作为镜像的磁盘
同时表明目前rootvg仅有一块磁盘hdisk0
#prtconf |grep disk查看大小是否一致
hdisk0active546376109..49..00..109..109
+ hdisk0U787B.001.DNW5942-P1-T14-L5-L016 Bit LVD SCSI Disk Drive (146800 MB)
+ hdisk1U787B.001.DNW5942-P1-T14-L8-L016 Bit LVD SCSI Disk Drive (146800 MB)
注:如未发现新硬件,执行下面命令进行扫描设备
#cfgmgr-v
发现新硬件后,这是我们要看下物理卷的属***。
# lsdev -Cc disk
hdisk0 Available 09-08-00-5,0 16 Bit LVD SCSI Disk Drive
hdisk1 Available 09-08-00-8,0 16 Bit LVD SCSI Disk Drive
(2)查看hdisk1是否是AIX支持的引导设备
# bootinfo -B hdisk1
1
返回1,说明磁盘可以作为引导设备,其它值说明此盘不是候选
(3)激活hdisk1,给其盘赋值一个pvid,如PVID(00027c6acda7df21)已存在则无需执行该步骤
# chdev -l hdisk1 -a pv=yes
hdisk1 changed
# lspv
hdisk000027c6a0507fe17rootvgactive
hdisk100027c6acda7df21None
在候选盘hdisk1做镜像前,需要被赋值一个PVID,否则无法被加入到rootvg
--如果没***诟持pvid前执行扩展vg会报如下错误
# extendvg rootvg hdisk1
0516-1254 extendvg: Changing the PVID in the ODM.
提示:需要在ODM库里改变PVID
(4)扩展rootvg
# extendvg rootvg hdisk1 如执行失败则表示hdisk1可能有数据可使用-f参数强行扩展即执行:(# extendvg �Cf rootvg hdisk1),注:该步骤将删除hdisk1的所有数据。
# lspv
hdisk000027c6a0507fe17rootvgactive
hdisk100027c6acda7df21rootvgactive
执行rootvg的扩展后,查看结果为hdisk1已经被加入到了rootvg
同时表明要想做为镜像的磁盘必须和目标vg在同一个vg;不可能用vg2中的一块盘
来做rootvg的镜像磁盘(至少在目前有这个限制)
2.2 去掉rootvg的QUORUM属***(chvg �CQn)
所谓Quorum,此处的Quorum可以理解为是vg的一个属***,vg能否被激活根据此属***的值决定的。此属***的取值又是根据vg内所含磁盘的VGDA决定。大意就是如果某个磁盘有问题,此盘上的VGDA就视为有问题(异常盘);当vg里所含的盘有超过半数都异常时,系统就会自动把此vg给varyoff,当然此vg也就无法被访问了。要想对QUORUM有更深入的理解,还是请参考redbook自己去理解吧。
# chvg -Qn rootvg
0516-1804 chvg: The quorum change takes effect immediately.
# lsvg rootvg
# lsvg rootvg
VOLUME GROUP:rootvgVG IDENTIFIER:00c36e6a00004c000000013667dc8e3a
VG STATE:activePP SIZE:256 megabyte(s)
VG PERMISSION:read/writeTOTAL PPs:546 (139776 megabytes)
MAX LVs:256FREE PPs:376 (96256 megabytes)
LVs:13USED PPs:170 (43520 megabytes)
OPEN LVs:12QUORUM:1 (Disable)
TOTAL PVs:1VG DESCRIPTORS: 2
STALE PVs:0STALE PPs:0
ACTIVE PVs:1AUTO ON:yes
MAX PPs per VG:32512
MAX PPs per PV:1016MAX PVs:32
LTG size (Dynamic): 256 kilobyte(s)AUTO SYNC:no
HOT SPARE:noBB POLICY:relocatable
PV RESTRICTION:none
去掉QUORUM后,查看vg可以看到下面的行
QUORUM:1
说明修改已经完成,在只有2个盘的镜像rootvg中,此值应该一致保持为1,即使镜像完成后也不要再修改为2,否则就失去rootvg的镜像作用了。
专业点的说法:此情况称之为简单镜像(single mirroring),一般单镜像的卷组都需要将quorum关闭,否则卷组中拥有2份VGDA的磁盘不可用时,受quorum制约,整个卷组无法激活,从而失去镜像意义。对于rootvg镜像更加需要关闭quorum,否则一旦包含2份VGDA的磁盘不可用时,系统在引导过程中将不能激活rootvg,从而引起启动失败。该命令可在系统正常运行时随时补充执行,但需要重新启动才能生效。如果始终没有执行过,当系统启动失败时,可以使用可引导介质进入维护模式,激活rootvg,获得shell时再执行此命令,然后正常启动即可。
2.3 镜像ROOTVG(mirrorvg �Cs)
当rootvg包含了2块盘后,也就具备了镜像的最小条件了,这步就可以执行实际的镜像操作了,建立rootvg所有lv的镜像有2种方式,你可以使用mklvcopy一个一个去建立,当然更加简单的方法是使用卷组镜像命令。
#mirrorvg -s rootvg(-s参数指定不同步vg,�CS参数指定后台同步vg)
#mirrorvg -c 3 rootvg hdisk1,hdisk2 (-c指定镜像数及硬盘,2块硬盘无需指定)
或者
# mklvcopy hd1 2 hdisk1
# mklvcopy hd2 2 hdisk1
# mklvcopy hd3 2 hdisk1
# mklvcopy hd4 2 hdisk1
# mklvcopy hd5 2 hdisk1
# mklvcopy hd6 2 hdisk1
# mklvcopy hd8 2 hdisk1
# mklvcopy hd9var 2 hdisk1
# mklvcopy hd10opt 2 hdisk1
当镜像完成后,会在屏幕上收到如下信息,表明镜像步骤完成
# 0516-1126 mirrorvg: rootvg successfully mirrored, user should perform
bosboot of system to initialize boot records.Then, user must modify
bootlist to include:hdisk0 hdisk1.
2.4 镜像间的数据同步 (syncvg -v)
#syncvg -v rootvg
2.5 在rootvg的两块盘上创建引导信息
(1) 创建引导信息
#bosboot �Ca 因为hd5已经做了镜像,因此在执行该命令时无需使用-d选项指定磁盘,除非当在其他情况,如迁移hd5至其他磁盘时。
或
# bosboot -ad hdisk0
# bosboot -ad hdisk1
(2)查看引导信息
# lslv -l hd5
hd5:N/A
PVCOPIESIN BANDDISTRIBUTION
hdisk0001:000:000100%001:000:000:000:000
hdisk1001:000:000100%001:000:000:000:000
2.6 更新引导设备顺序,实现单机bos容错 (bootlist)
(1) 设置引导顺序
#bootlist -m normal hdisk0 hdisk1 cd0
(2)验证引导顺序
# bootlist -m normal -o
hdisk0 blv=hd5 pathid=0
hdisk1 blv=hd5 pathid=0
cd0
此例表示在正常情况下,系统从hdisk0进行引导,当hdisk0不可用时将从hdisk1进行引导,以提供单机容错。
2.7 重新系统(shutdown �CFr)
#shutdown �CFr 因quorum关闭的操作必须重启操作系统生效(注:实践中本人未重启过)
2.8 引导过程检查,确认无误
# bootinfo -b
hdisk0
2.9 检查镜像是否成功
#lsvg -l rootvg
rootvg:
LV NAMETYPELPsPPsPVsLV STATEMOUNT POINT
hd5boot122closed/syncdN/A
hd6paging32642open/syncdN/A
hd8jfs2log122open/syncdN/A
hd4jfs216322open/syncd/
hd2jfs216322open/syncd/usr
hd9varjfs28162open/syncd/var
hd3jfs28162open/syncd/tmp
hd1jfs240802open/syncd/home
hd10optjfs220402open/syncd/opt
hd11adminjfs28162open/syncd/admin
fwdumpjfs28162open/syncd/var/adm/ras/platform
lg_dumplvsysdump441open/syncdN/A
livedumpjfs28162open/syncd/var/adm/ras/livedump
说明:LP*2=PP 表示一份镜像,LP=PP表示没做镜像,LP*3=PP表示有二份镜像。LP*2=PP,是指一份LP的数据,对应两份PP的数据,物理上是有2份拷贝的
3. AIX镜像移除
3.1 把rootvg的mirror去掉
# unmirrorvg rootvg hdisk1
0516-1246 rmlvcopy: If hd5 is the boot logical volume, please run 'chpv -c <diskname>'
as root user to clear the boot record and avoid a potential boot
off an old boot image that may reside on the disk from which this
logical volume is moved/removed.
0516-1804 chvg: The quorum change takes effect immediately.
0516-1144 unmirrorvg: rootvg successfully unmirrored, user should perform
bosboot of system to reinitialize boot records.Then, user must modify
bootlist to just include:hdisk0.
3.2 去掉hdisk1的引导信息
#chpv -c hdisk1
3.3 从rootvg中删除hdisk1
#reducevg rootvg hdisk1
3.4 删除硬件设备(加-R表示强制删除)
# chdev -l hdisk1 -a pv=clear 清除PVID
#rmdev -dl hdisk1
hdisk1 deleted
注:如该盘需继续使用无需删除。
3.5 更新引导设备顺序
. (1) 设置引导顺序
#bootlist -m normal hdisk0 cd0
(2)验证引导顺序
# bootlist -m normal -o
hdisk0 blv=hd5 pathid=0
cd0
4. AIX克隆步骤
4.1 系统检查
(1)检查是否存在镜像
#lsvg �Cl rootvg 如存在镜像则执行下面操作移除镜像
#unmirrorvg rootvg hdisk1
#reducevg rootvg hdisk1
(2)查看硬盘分布及引导顺序是否正确
#lspv
#bootlist -m normal -o
hdisk0 blv=hd5 pathid=0
4.2 克隆rootvg
(1)克隆rootvg到hdisk1
#alt_disk_copy -d hdisk1耗时稍长,约
(2)更新引导设备顺序,
#bootlist -m normal -o查看引导顺序,克隆完成后已改变
Hdisk1blv=hd5 pathid=0
将启动列表改回hdisk0
#bootlist -m normal hdisk0
#bootlist -m normal �Co
Hdisk0 blv=hd5 pathid=0
(注意:克隆完成之后,系统启动列表改回原来的设置,因为系统自动把引导设置为hdisk1了)
4.3 升级操作
此时可进行操作系统升级或打补丁操作,如果升级失败只需制作第三方支持所需的快照,然后从原来的rootvg 引导。对于登录的用户来说,没有什么影响。
4.4 删除/使用克隆盘
(1) 如果系统启动没问题。就可以考虑删除克隆盘了。
#alt_rootvg_op -X altinst_rootvg删除克隆VG
# lsvg检查删除结果
rootvg
# bootlist -m normal -o 检查引导顺序
hdisk0 blv=hd5 pathid=0
如果不能正常启动,则使用克隆盘,执行以下命令:
#bootlist �Cm normal �Co hdisk1
#bootlist �Cm normal �Co
Hdis1 blv=hd5 pathid=0
#shutdown �CFr
删除原来的rootvg
#lsvg
#alt_rootvg_op �CX old_rootvg 删除原来VG
(2) 然后再做mirror,确保系统安全,见“AIX镜像步骤”。