*******************************************************************************************

版权所有: www.foutime.com  深圳市方泰智能科技有限公司   

通道锁 逃生锁 一卡通 楼宇对讲 停车场

*******************************************************************************************

1. 引言

如果你的AIX系统rootvg仅有一块硬盘,当灾难来临的时候,例如硬盘损坏,这就意味着你的系统就再也不能启动了。尽管你可能拥有mksysb的磁带,但你仍然需要花费很多的时间去处理这个原本很小的问题。rootvg镜像能够提供单机bos容错,使得你能够用最短的时间摆脱这种困境,简单到只需要一次重新启动,这就是rootvg镜像的作用。

一般情况下在生产环境中,我门的rootvg大多数是mirror,如果ML升级失败或者一些错误操作,导致无法恢复等,这是就需要我门迅速恢复rootvg,无论是使用磁带mksysb 恢复,还是网络引导恢复,这个速度各方面都不理想。使用alt_disk_copy恢复rootvg时间最快,同样简单到只需一次重新启动,这就是克隆的作用。

 

2. AIX镜像步骤

 

制作rootvg的标准步骤大致如下

1. extendvg

2. chvg –Qn

3. mirrorvg –s

4. syncvg –v

5. bosboot –a

6. bootlist

7. shutdown –Fr

8. bootinfo –b

2.1 将空闲磁盘加入rootvg( extendvg)

1)查看当前还未加入到其它vg的可用PV

# lspv

hdisk000027c6a0507fe17rootvgactive

hdisk1noneNone

此结果表明hdisk1当前未在任何vg,可以作为镜像的磁盘

同时表明目前rootvg仅有一块磁盘hdisk0

#prtconf |grep disk查看大小是否一致

hdisk0active546376109..49..00..109..109

+ hdisk0U787B.001.DNW5942-P1-T14-L5-L016 Bit LVD SCSI Disk Drive (146800 MB)

+ hdisk1U787B.001.DNW5942-P1-T14-L8-L016 Bit LVD SCSI Disk Drive (146800 MB)

注:如未发现新硬件,执行下面命令进行扫描设备

#cfgmgr-v

发现新硬件后,这是我们要看下物理卷的属***。

# lsdev -Cc disk

hdisk0 Available 09-08-00-5,0 16 Bit LVD SCSI Disk Drive

hdisk1 Available 09-08-00-8,0 16 Bit LVD SCSI Disk Drive

2)查看hdisk1是否是AIX支持的引导设备

# bootinfo -B hdisk1

1

返回1,说明磁盘可以作为引导设备,其它值说明此盘不是候选

3)激活hdisk1,给其盘赋值一个pvid,如PVID00027c6acda7df21)已存在则无需执行该步骤

# chdev -l hdisk1 -a pv=yes

hdisk1 changed

# lspv

hdisk000027c6a0507fe17rootvgactive

hdisk100027c6acda7df21None

在候选盘hdisk1做镜像前,需要被赋值一个PVID,否则无法被加入到rootvg

--如果没***诟持pvid前执行扩展vg会报如下错误

# extendvg rootvg hdisk1

0516-1254 extendvg: Changing the PVID in the ODM.

提示:需要在ODM库里改变PVID

4)扩展rootvg

# extendvg rootvg hdisk1 如执行失败则表示hdisk1可能有数据可使用-f参数强行扩展即执行:(# extendvg –f rootvg hdisk1),注:该步骤将删除hdisk1的所有数据。

# lspv

hdisk000027c6a0507fe17rootvgactive

hdisk100027c6acda7df21rootvgactive

执行rootvg的扩展后,查看结果为hdisk1已经被加入到了rootvg

同时表明要想做为镜像的磁盘必须和目标vg在同一个vg;不可能用vg2中的一块盘

来做rootvg的镜像磁盘(至少在目前有这个限制)

 

2.2 去掉rootvgQUORUM属***(chvg –Qn

所谓Quorum,此处的Quorum可以理解为是vg的一个属***,vg能否被激活根据此属***的值决定的。此属***的取值又是根据vg内所含磁盘的VGDA决定。大意就是如果某个磁盘有问题,此盘上的VGDA就视为有问题(异常盘);当vg里所含的盘有超过半数都异常时,系统就会自动把此vgvaryoff,当然此vg也就无法被访问了。要想对QUORUM有更深入的理解,还是请参考redbook自己去理解吧。

# chvg -Qn rootvg

0516-1804 chvg: The quorum change takes effect immediately.

# lsvg rootvg

# lsvg rootvg

VOLUME GROUP:rootvgVG IDENTIFIER:00c36e6a00004c000000013667dc8e3a

VG STATE:activePP SIZE:256 megabyte(s)

VG PERMISSION:read/writeTOTAL PPs:546 (139776 megabytes)

MAX LVs:256FREE PPs:376 (96256 megabytes)

LVs:13USED PPs:170 (43520 megabytes)

OPEN LVs:12QUORUM:1 (Disable)

TOTAL PVs:1VG DESCRIPTORS: 2

STALE PVs:0STALE PPs:0

ACTIVE PVs:1AUTO ON:yes

MAX PPs per VG:32512

MAX PPs per PV:1016MAX PVs:32

LTG size (Dynamic): 256 kilobyte(s)AUTO SYNC:no

HOT SPARE:noBB POLICY:relocatable

PV RESTRICTION:none

去掉QUORUM后,查看vg可以看到下面的行

QUORUM:1

说明修改已经完成,在只有2个盘的镜像rootvg中,此值应该一致保持为1,即使镜像完成后也不要再修改为2,否则就失去rootvg的镜像作用了。

专业点的说法:此情况称之为简单镜像(single mirroring),一般单镜像的卷组都需要将quorum关闭,否则卷组中拥有2VGDA的磁盘不可用时,受quorum制约,整个卷组无法激活,从而失去镜像意义。对于rootvg镜像更加需要关闭quorum,否则一旦包含2VGDA的磁盘不可用时,系统在引导过程中将不能激活rootvg,从而引起启动失败。该命令可在系统正常运行时随时补充执行,但需要重新启动才能生效。如果始终没有执行过,当系统启动失败时,可以使用可引导介质进入维护模式,激活rootvg,获得shell时再执行此命令,然后正常启动即可。

 

2.3 镜像ROOTVG(mirrorvg –s)

rootvg包含了2块盘后,也就具备了镜像的最小条件了,这步就可以执行实际的镜像操作了,建立rootvg所有lv的镜像有2种方式,你可以使用mklvcopy一个一个去建立,当然更加简单的方法是使用卷组镜像命令。

#mirrorvg -s rootvg-s参数指定不同步vg–S参数指定后台同步vg

#mirrorvg -c 3 rootvg hdisk1,hdisk2 (-c指定镜像数及硬盘,2块硬盘无需指定)

或者

# mklvcopy hd1 2 hdisk1

# mklvcopy hd2 2 hdisk1

# mklvcopy hd3 2 hdisk1

# mklvcopy hd4 2 hdisk1

# mklvcopy hd5 2 hdisk1

# mklvcopy hd6 2 hdisk1

# mklvcopy hd8 2 hdisk1

# mklvcopy hd9var 2 hdisk1

# mklvcopy hd10opt 2 hdisk1

当镜像完成后,会在屏幕上收到如下信息,表明镜像步骤完成

# 0516-1126 mirrorvg: rootvg successfully mirrored, user should perform

bosboot of system to initialize boot records.Then, user must modify

bootlist to include:hdisk0 hdisk1.

2.4 镜像间的数据同步 (syncvg -v)

#syncvg -v rootvg

2.5 rootvg的两块盘上创建引导信息

(1) 创建引导信息

#bosboot –a 因为hd5已经做了镜像,因此在执行该命令时无需使用-d选项指定磁盘,除非当在其他情况,如迁移hd5至其他磁盘时。

# bosboot -ad hdisk0
# bosboot -ad hdisk1

2)查看引导信息

# lslv -l hd5

hd5:N/A

PVCOPIESIN BANDDISTRIBUTION

hdisk0001:000:000100%001:000:000:000:000

hdisk1001:000:000100%001:000:000:000:000

2.6 更新引导设备顺序,实现单机bos容错 (bootlist)

(1) 设置引导顺序

#bootlist -m normal hdisk0 hdisk1 cd0

2)验证引导顺序

# bootlist -m normal -o

hdisk0 blv=hd5 pathid=0

hdisk1 blv=hd5 pathid=0

cd0

此例表示在正常情况下,系统从hdisk0进行引导,当hdisk0不可用时将从hdisk1进行引导,以提供单机容错。

 

2.7 重新系统(shutdown –Fr

#shutdown –Fr quorum关闭的操作必须重启操作系统生效(注:实践中本人未重启过)

 

2.8 引导过程检查,确认无误

# bootinfo -b

hdisk0

2.9 检查镜像是否成功

lsvg -l rootvg

rootvg:

LV NAMETYPELPsPPsPVsLV STATEMOUNT POINT

hd5boot122closed/syncdN/A

hd6paging32642open/syncdN/A

hd8jfs2log122open/syncdN/A

hd4jfs216322open/syncd/

hd2jfs216322open/syncd/usr

hd9varjfs28162open/syncd/var

hd3jfs28162open/syncd/tmp

hd1jfs240802open/syncd/home

hd10optjfs220402open/syncd/opt

hd11adminjfs28162open/syncd/admin

fwdumpjfs28162open/syncd/var/adm/ras/platform

lg_dumplvsysdump441open/syncdN/A

livedumpjfs28162open/syncd/var/adm/ras/livedump

说明:LP*2=PP 表示一份镜像,LP=PP表示没做镜像,LP*3=PP表示有二份镜像。LP*2=PP,是指一份LP的数据,对应两份PP的数据,物理上是有2份拷贝的

 

3. AIX镜像移除

3.1 rootvgmirror去掉

# unmirrorvg rootvg hdisk1

0516-1246 rmlvcopy: If hd5 is the boot logical volume, please run 'chpv -c '

as root user to clear the boot record and avoid a potential boot

off an old boot p_w_picpath that may reside on the disk from which this

logical volume is moved/removed.

0516-1804 chvg: The quorum change takes effect immediately.

0516-1144 unmirrorvg: rootvg successfully unmirrored, user should perform

bosboot of system to reinitialize boot records.Then, user must modify

bootlist to just include:hdisk0.

3.2 去掉hdisk1的引导信息

#chpv -c hdisk1

3.3 rootvg中删除hdisk1

#reducevg rootvg hdisk1

3.4 删除硬件设备(-R表示强制删除)

# chdev -l hdisk1 -a pv=clear 清除PVID

#rmdev -dl hdisk1

hdisk1 deleted

注:如该盘需继续使用无需删除。

 

3.5 更新引导设备顺序

. (1) 设置引导顺序

#bootlist -m normal hdisk0 cd0

2)验证引导顺序

# bootlist -m normal -o

hdisk0 blv=hd5 pathid=0

cd0

4. AIX克隆步骤

4.1 系统检查

1)检查是否存在镜像

#lsvg –l rootvg 如存在镜像则执行下面操作移除镜像

#unmirrorvg rootvg hdisk1

#reducevg rootvg hdisk1

2)查看硬盘分布及引导顺序是否正确

#lspv

#bootlist -m normal -o

hdisk0 blv=hd5 pathid=0

4.2 克隆rootvg

1)克隆rootvghdisk1

#alt_disk_copy -d hdisk1耗时稍长,约

2)更新引导设备顺序,

#bootlist -m normal -o查看引导顺序,克隆完成后已改变

Hdisk1blv=hd5 pathid=0

将启动列表改回hdisk0

#bootlist -m normal hdisk0

#bootlist -m normal –o

Hdisk0 blv=hd5 pathid=0

(注意:克隆完成之后,系统启动列表改回原来的设置,因为系统自动把引导设置为hdisk1了)

 

4.3 升级操作

此时可进行操作系统升级或打补丁操作,如果升级失败只需制作第三方支持所需的快照,然后从原来的rootvg 引导。对于登录的用户来说,没有什么影响。

 

4.4 删除/使用克隆盘

(1) 如果系统启动没问题。就可以考虑删除克隆盘了。

#alt_rootvg_op -X altinst_rootvg删除克隆VG

# lsvg检查删除结果

rootvg

# bootlist -m normal -o 检查引导顺序

hdisk0 blv=hd5 pathid=0

如果不能正常启动,则使用克隆盘,执行以下命令:

#bootlist –m normal –o hdisk1

#bootlist –m normal –o

Hdis1 blv=hd5 pathid=0

#shutdown –Fr

删除原来的rootvg

#lsvg

#alt_rootvg_op –X old_rootvg 删除原来VG

(2) 然后再做mirror,确保系统安全,见“AIX镜像步骤”。