在A客户现场:
1、onmode -ky关闭主用节点(节点1);
2、备机(节点2)自动切换为primary;
3、oninit -v启动节点1;发现状态是fast recovery(sec)的状态,没有IO,不追日志;
思索良久无解。
4、在节点2执行onmode -ky;oninit -v;此时节点2状态是read-only(sec)
不知道问题出在哪里。
在B客户现场:
1、onmode -ky关闭主用节点(节点1);
2、备机(节点2)自动切换为primary;
3、oninit -v启动节点1;发现状态是fast recovery(sec)的状态,没有IO,不追日志;
online.log中有25582的报错,提示网络连接不上;
4、在节点1上反复几次,无果。最后oninit -PHY;onmode -d secondary gbase2成功了;
5、在此期间节点2上用vmstat 1看到idle长期为0
由此联想到A客户现场的问题,应该也是由于CPU性能所致。其实25582之前在PF银行也发生过类似的问题,我还专题分析过。所以以后在遇到25582的问题,不仅仅怀疑是网络问题,也有可能是CPU性能不足,导致poll thread部分处理的有问题所提示。