split job 报错的trouble shooting过程

先说结果,步骤为:


1)由job code查找报错的server name(production server)

2)在backup server上查找这个server备份任务用到的dg成员

3)通过命令查找dg备份任务的log

4)如果是因为pre脚本失败,手动执行分离,执行后其实任务就copy正常了

5)通知chops rerun job。

*********************************************************************************

详细步骤如下:

1)在表格中查找job code所属的server,在邮件中查找这个server,能找到alert的邮件,有报错的内容,或者在下面的第三步中找到。

2)在备份服务器(gdc jdc各两台,装dp的)的/opt/omni/lbin/SHELL/conf/ 路径下:ls |grep [server name ],可以找到和这个server相关的备份任务,如下图:

wKiom1apr7aiZQTVAAANbfqoCEg741.png

包含三个类型的任务,然后more一下任意一个,可以看到实际的dg,如下图:

wKiom1apsBmixIcKAAAHd7ZW_y0136.pngnim80201_vg1_pgmt01就是actual dg.只有一个,有时有很多个。

3)查看dg是pre copy还是copied,通过命令:symclone -g [dg name] que,例如:

gepbkp05:/ # symclone -g gct9d201_vg1_pgmt_01 que

 Device Group (DG) Name: gct9d201_vg1_pgmt_01

DG's Type             : REGULAR

DG's Symmetrix ID     : 000298700592

          Source Device                   Target Device            State     Copy

--------------------------------- ---------------------------- ------------ ----

               Protected Modified                Modified

Logical   Sym  Tracks    Tracks   Logical   Sym  Tracks   CGDP SRC <=> TGT  (%)

--------------------------------- ---------------------------- ------------ ----

gct9d201* 1A49         0        0 gct9d201* 1D0A        0 XXXX PreCopy      100

gct9d201* 1A4A         0        0 gct9d201* 1D0B        0 XXXX PreCopy      100

Total           -------- --------                --------

  Track(s)             0        0                       0

  MB(s)              0.0      0.0                     0.0


4)如果显示是precopy的状态,说明copy还未分离,需要手动分离。命令为:

symclone -g [dg name ] activate -nop

其实执行完毕这个分离命令后,再按照symclone -g [dg name] que查找能发现状态已经改成copy了,但是还是需要通知chops rerun这个job,因为虽然job copy成功了,但是可能不能被系统识别用于restore。

你可能感兴趣的:(copy)