关于RHCS中fence设备的讨论


在linux-ha项目中,开始越来越关注io fence设备。
并且在rhes4中ha也支持更多的io fence设备。

1.为什么要用io fence设备:因为纯粹用软件的方式并不能够提供完全意义上的HA。所以需要额外的硬件来进行支持。
2.那些设备能作为io fence:
eg: SCSI/FC 磁盘阵列;
   Power swith;
LAN/FC swith;
Network adapter; 等。
3.io fence设备最根本的作用是防止split-brainRHAS4+RHCS4,拔掉电源会资源不切换
hqonline

其他没什么可说的,fence device 用的是IBM BMC,用的是IPMI LAN,
现在问题是,拔网线什么的都能正常切换,备机会将主机重起并把服务和资源接管过来
但是拔掉一台的电源后,显示:
fence node db2:
然后总显示
fence node db2 failed,
然后服务也不发生切换
什么问题呢,谢谢解答,高手帮忙

hqonline

fence device应该没问题,因为我做拔网线的测试时,拔掉A机的网线,B机会发送fence信号,然后A机会重起,然后B机会正常接管服务的。

hqonline

我用的是主版集成的IPMI设备,可以把fence device选成IPMI LAN,直接用RHAS4。4自带的IPMI服务就能驱起来,并且能工作,2台机器的IPMI网口直连,另一网口接交换机,
测试时,拔掉A机接交换机的网线,B机能够用fence信号将A机重起,返回成功信息,并将服务和资源接管过来;A机起来后,同样拔掉B机接交换机的网线,A机能够用fence信号将B机重起,返回成功信息,并将服务和资源接管过来;
但是,如果拔掉A机电源线的话,切换就会有问题,B机同样会发出fence 信号,但是因为A机的电源已断,不能重起,也不能有成功信号返回,结果备机就会一直显示fence failed,而不去接管服务,这是不是RHCS的一个BUG呢?还是IPMI device就不支持拔电源呢,楼主请指教。

hqonline

附上cluster.conf文件,帮看一下有没问题,谢谢斑竹




































你可能感兴趣的:(网络)