作者将本文同时发布到:EMC中文支持论坛 https://community.emc.com/community/support/chinese/brsw/blog/2013/10/14/avamar-61%E5%A4%87%E4%BB%BD%E5%B8%B8%E8%A7%81%E6%95%85%E9%9A%9C%E5%8E%9F%E5%9B%A0%E5%8F%8Atroubleshooting
1.1 Server Resource Constraint 服务器资源限制;
1) GSAN in Read-only status --- Avamar Server在如下的情况下会处于只读状态,此时有可能会导致备份因Server资源受限而处于Waiting �C Queued状态
1.1) Checkpoint
1.2) Garbage Collection
1.3) Server has been suspended
2) Server is too busy --- Avamar Server过于繁忙
2.1) 当Avamar server在闲时可以支持的最大备份数量为:
30 x Num_of_DataNode �C 1,如一台Avamar server为1个Utility Node+3个Data Node的结构,则可支持最大备份数量为:30x3-1=89. 其中减去的1是为Restore保留的资源。
2.2) 当Avamar Server在运行 HFSCheck时,可以同时进行备份,但因为大部分系统资源需要保留给HFSCHECK,运行备份的数量就会减少,因此每个Data Node只能支持同时进行2个备份。此时每台Avamar Server可支持的最大备份数量为: 2 x Num_of_DataNode - 1
1.2 Client Resource Constraint 客户端资源限制.
造成客户端资源限制的原因常见于一台客户端已经有一个备份正在运行了,因为一台Avamar的客户端同时只能运行一个备份,此时,如果发起一个新的备份,则新发起的备份会显示为Waiting �C Queued。当第一个备份结束时,新发起的备份会开始运行,此时状态会由Waiting-Queued变为:Running。(对于VMware备份,一台Proxy server即一个Avamar 客户端 Client)
2. Waiting �CClient
此故障状态表明Avamar Server已经发起了一个备份的WorkOrder,但客户端还没有来接收这个WorkOrder。
故障原因:
此故障说明在备份运行一段时间后,Avamar Server的MCS无法检测到备份的运行状态消息了;或者由于Client端硬件、软件或网络的故障导致avtar进程无法与Avamar Server进行通信了。
解决办法:
检查该时段Avamar Server是否非常繁忙;是否有网络问题
4. Timeout �C response
The client checked in and was sent backup activity but did not acknowledge
故障原因:
在同一时间发起的备份数量过多,导致Avamar server的MCS无法及时响应Client端的avagent service发给MCS的关于备份已开始的消息。
解决办法:调整备份策略,让多个备份在不同的时间段按期按批发起,避免大量的备份在同一时刻开始运行。
5. Time Out-Start
Timeout before starting
故障原因:
1)备份由于某些故障还没有正常发起,而备份窗口已经结束。通常,waiting client /waiting-queued 的故障如果在备份窗口结束时还没有正常发起变为Running的状态,则会转变为Timeout-Start故障。
解决办法:需要视具体情况而定。
2)由于Avamar Server MCS的28001端口由于TCP连接故障而报Closed_Wait的错误。此时可以在Avamar Server的Utility node上运行指令:netstat -an | grep 28001
解决办法:重启MCS服务
6. Time Out-End
The client did not complete the activity in the allotted time.
故障原因:
备份已经开始运行,但是在备份策略所规定的时间结束时还没有完成,此时备份会报Timeout-End的故障。
解决办法:
1) 调整备份开始时间,让备份提早开始以便能够在备份窗口时间之内完成;
2) 调整备份窗口开始时间,加大备份窗口时长,使备份有足够时间完成;
3) 检查具体的备份日志,分析此故障是否由于备份性能过慢导致。
7. Canceled
The activity was canceled, either by the client or from Avamar Administrator.
故障原因:
1) 备份在 Backup window 开始时还没有结束,而由于Blackout Window的开始而被取消;
2) 备份被手动从Client端或Avamar Administrator端取消
8. No-proxy
The system failed to initiate a backup or restore for a virtual machine because no proxy was found to service the virtual machine.
故障原因:
VMware虚机备份或恢复时,没有可以使用的Proxy对指定的虚机进行备份。
解决办法:
1.1) 编辑Proxy Client,检查是否为这台Proxy选择了相应的Datastore;
Avamar Administrator �C Policy �C Client �C Edit Proxy Client �C VMware �C Datastores:
1.2) 检查Proxy client是否注册成功。从Backup and Restore窗口是否能够浏览Proxy的Linux文件系统。如不能,则需要 重新注册Proxy.
Avamar Administrator �C Backup and Restore �C Select for Backup - Select Proxy Client �C Browse Linux File system
9. No VM
The activity failed because the virtual machine client does not exist in vCenter.
故障原因:虚机在vCenter已经不存在了。
解决办法:登录vCenter vSphere,检查这台虚机是否存在,是否状态正常。重新Import这台虚机。
Avamar Administrator �C Administration �C Account Management �C 选中vCenter Domain- 右键选择Import Multiple Clients
--- 总结 ---
以上是常见的通过Avamar Administrator对备份或恢复工作进行管理的小技巧;以及检查备份故障原因和基本的解决办法总结。具体的故障原因,还需要根据每次故障的详细日志做具体的分析。
欢迎大家多多使用Avamar Administrator- Activity窗口来检查备份和恢复工作的完成情况,积累自己的技巧和经验,让它带给您灵活方便的日常管理和维护,玩转Avamar Administrator!