心跳线问题小感悟

公司有一部分数据库使用的是hpux 10 rac,而且安装serviceguard。这部分数据库平时运行的好好的,不过偶然会出现心跳线问题,这个相当困扰,因为问题不明显。出现这个问题的时候好像并不影响数据库的双机运行?往往是巡检的时候才发现问题。不知道各位大神能否指点一二

目前我判断心跳线有问题
1.crs_stat 只有一边可以刷出
2.crs日志可以看到心跳线time-out
3.如果有rman或者arch是通过两边备份,可以看见备份会出现问题。

这个时候只能手动重启crs服务了。

出现问题的时候
重启有问题一边的crs服务,一般就是crs_stat刷不出的一边
一般来说重启都有问题,一般关闭监听,数据库,asm实力,然后关crs服务,关不到就kill进程cssd进程,一般kill掉整个服务器会重启,但是实际中却会不重启,推测是serviceguard截住了,如果没有serviceguard,在测试环境的rac都是会重启的。

rac博大精深,需多加学习。

你可能感兴趣的:(数据库,RAC,心跳,CRS)