VCS维护手册

1        常用命令介绍

对VCS的常用命令进行介绍,便于工程师进行日常维护。本手册描述的命令仅供参考,具体描述请以Veritas公司提供的相关资料为准。

VCS的安装和命令都在下列目录下:sbin, /usr/sbin, /opt/VRTS/bin,和/opt/VRTSvcs/bin

,如果没有设置VCS的环境变量,请在/etc/profile文件中增加蓝色信息PATH=/opt/VRTSvcs/bin:/sbin:/usr/sbin:/usr/local/sbin:$PATH

修改完毕后需执行source /etc/profile,或者重新登陆。

1.1       基本命令

使用/etc/rc.d/llt {start|stop|restart|condrestart|status}命令可以启动、停止、重启llt及查看llt状态;

使用/etc/rc.d/gab{start|stop|restart|condrestart|status}命令可以启动、停止、重启gab及查看gab状态;

使用/etc/rc.d/vcs {start|stop|restart|condrestart|status}命令可以启动、停止、重启VCS及查看VCS状态;也可使用hastart [-stale|-force]来启动VCS;

使用下列命令来查看集群状态:hastatus或者hastat -sum

启动单节点集群:hastart –onenode

以时间共享方式启动VCS:hastart –ts

关闭整个集群服务:hastop -all [-force]

关闭集群中一台主机上的集群服务:hastop -local

只关闭VCS相关进程,而不停止VCS所保护的服务进程:hastop -sys system [-force | -evacuate]

使配置文件可读写:haconf –makerw

使配置文件只读:haconf -dump –makero

1.2       VCS的用户管理:

增加用户,用户默认有观察员身份:hauser -add user

将用户提升为集群管理员:haclus -modifyAdministrators -add user

将用户提升为集群操作员:haclus -modify Operators-add user

将用户提升为服务组管理员:hagrp  -modify service_group Adminstrators -add user

将用户提升为服务组操作员:hagrp  -modify service_group Operators -add user

删除用户:hauser -delete user

显示所有用户:hauser -display

查询集群日志:

hamsg-list

hamsg-info [-path path_name] LDF

1.3       对服务组的基本管理操作:

查询service_group状态:hagrp  -state [service_group]-sys [system];

查询节点之间依赖关系:hagrp -dep [service_group]

查询资源表:

hagrp  -resources [service_group] ;

hagrp-display [service_group] [-attribute attribute] [-sys system]

hares-display [resource]

hares-display -attribute [attribute]

hares-display -group [service_group]

hares-display -type [resource_type]

hares-display -sys [system]

启动服务组及使服务联机:hagrp  –online service_group –sys system

关闭服务组及使服务脱机:hagrp  –offline service_group –sys system

将服务组切换到另一个系统上:(只对failover组有效,且当服务组中服务部分或全部联机时):

hagrp  -switch service_group -to system

冻结服务组(disableonlining, offlining, and failover),option -persistent 是使cluster重启时freeze:

hagrp  -freeze service_group [-persistent]

解冻被冻结的服务组(reenable onlining, offlining, and failover)

hagrp  -unfreeze service_group [-persistent]

激活服务组:(服务组激活后才能进行联机操作)hagrp  -enable service_group [-sys system]

禁用服务组:(服务组禁用后不能进行联机或切换操作)hagrp  -disable service_group [-sys system]

激活服务组中资源:hagrp -enableresources service_group

禁用服务组中资源:(如资源为disable时agents不监控资源组)hagrp  -disableresourcesservice_group

清除故障状态:hagrp  -clear [service_group] -sys [system]

1.4       管理资源操作:

查询资源代理列表:

hatype-list

hatype-resources resource_type

hatype-display [resource_type]

haagent-display [agent]

使资源联机:hares -online resource -sys system

使资源脱机:hares -offline resource -sys system

使资源脱机并将命令传播给子节点:hares -offprop resource-sys system

提示资源代理(agent)监控指定系统上的资源:(命令可能立即返回,但监控的进程可能还没结束)hares -probe resource -syssystem

清洗资源,使状态从RESOURCE_FAULTED转为RESOURCE_OFFLINE:

hares-clear resource [-sys system]

1.5       管理主机:

查询主机列表:

hasys-list

hasys-display [system]

haclus-value attribute

haclus–display

在ADMIN_WAIT状态下强制主机加载集群,此命令会覆盖正在使用的集群配置,使用前请确认准备使用的主机的集群配置文件是否有效:

hacf –verify /etc/VRTSvcs/conf/concig

hasys -force system

修改主机的属性,一些属性是VCS的内部属性,不能修改:

hasys -modify modify_options

查询主机ID,主机ID定义在文件/etc/llttab中:hasys –nodeid node_ID

冻结主机 (防止主机进行联机或切换操作):hasys -freeze [-persistent][-evacuate] system

解冻被冻结的主机 (使主机可以进行联机或切换操作):hasys -unfreeze [-persistent] system

1.6       VCS的license的管理操作:

安装VCS的License(root用户下执行):halic <key>或者vxlicinst –k  <key>

查询license:vxlicrep

2        使用图形界面管理VCS

使用图形界面来管理VCS,必须保证VCS已经启动,否则不能访问,如果在本机上使用图形界面管理VCS,必须保证VCS图形界面的rpm包已经安装好了,使用rpm –qa |grep VRTS查询,结果中存在以下两个rpm包则说明可以使用

VRTSjre-1.4-GA1

VRTScscm-4.4.00.10-GA_GENERIC

如果是在window终端上使用图形界面,在光盘中找到/windows/WindowsClusterManager这个目录,点击安装,按照提示完成安装,安装完成之后直接可以使用。

2.1       登录Cluster Manager

2.1.1       启动Cluster Manager

Cluster Manager有两种版本:Windows版本和Linux版本。建议使用Windows版本来远程管理Cluster。Windows版本安装后通过开始菜单或者桌面图标即可启动。

Linux版本启动方式如下:

启动图形界面的VeritasCluster Monitor

# hagui &

启动后将显示ClusterMonitor界面

                                                                                                                                               图1 启动Cluster Monitor界面

第一次登陆,ClusterMonitor界面上可能没有上图中的cluster_HA-test,需要新增一个要管理的Cluster:点击Cluster Monitor的File->New Cluster菜单,会出来如下界面:

                                                                                                                             图2 在cluter monitor中增加cluster的界面

其中Host name使用任一接点的IP即可,Port使用缺省值。

增加要管理的cluster后,Cluster Monitor中就会出现如图1中的cluster列表,显示为未登陆状态,点击Cluster Monitor中的cluster列表区,将弹出登陆界面,如下图所示:

                                                                                                                                                                     图3 登陆界面

输入用户名和密码(默认情况下用户为admin,密码为password),点击OK。

3        常见问题案例

编号

问题描述

解决办法

 

 

 

1

重启机器后,需要重新start llt,gab.机器reboot之后,gab异常:

# lsmod |grep gab

gab  253244   0

llt  139680   0  [gab]

这个是SuSe linux 8操作系统默认不加载网卡驱动导致的问题。解决办法:   在文件 /etc/modules.conf中加入如下内容,ethX对应具体的心跳网卡

       alias  ethX  e1000

 

 

 

2

在/etc/modules.conf文件中添加了“alias eth5 e1000”之后,心跳线使用正常;但如果用户使用yast配置其他网卡的IP,eth5将不可用,系统显示eth5的驱动没有加载

因为yast配置网卡时会将没有配置文件的网卡去激活,要确保yast对心跳线无影响,必须同时给心跳线网卡写配置文件

在/etc/modules.conf文件中添加了“alias eth5 e1000”之后,同时给心跳线的网卡加入配置文件,在/etc/sysconfig/network/中加入ifcfg-ethX文件,内容如下:

BOOTPROTO='static'

STARTMODE='onboot'

 

 

3

备用机与主服务器之间只有一条线跳线时,服务不会FailOver到备用机。有没有参数可以控制?

在集群中只剩下一条心跳线的情况下,如果LLT收不到心跳线信号,VCS将无法判断是主机损坏还是仅是心跳线故障。所以在集群中只剩下一条心跳线的情况下,不会FailOver。

4

在提供服务组的主机上使用yast给其他网卡配置IP后,浮动IP会报错,导致服务发生切换

因为yast配置网卡时会将没有配置文件的网卡去激活,浮动IP是没有配置文件的,所以会被yast干掉,导致浮动IP不可用,引发切换,这是yast的固有bug,只能避免使用yast配置网卡信息,如果需要配置,请直接修改网卡的配置文件

5

使用命令hastatus -sum 查看状态是下面两种状态

STALE_ADMIN_WAIT: ADMIN_WAIT:

在STALE_ADMIN_WAIT 和ADMIN_WAIT状态下强制主机加载集群,此命令会覆盖正在使用的集群配置,使用前请确认准备使用的主机的集群配置文件是否有效:

hacf –verify /etc/VRTSvcs/conf/concig

hasys -force system

 

你可能感兴趣的:(VCS维护手册)