LVS之问题&总结

文章目录

    • 六、问题
      • 6.1 keepalive脑裂
      • 6.2 vrrp原理

六、问题

总结:https://www.cnblogs.com/wn1m/p/10919372.html
 

6.1 keepalive脑裂

脑裂分析:https://www.jianshu.com/p/35941504a2e8

脑裂原因和解决办法:https://blog.csdn.net/WanJiaBaoBao/article/details/83715748
 
 
脑裂(split-brain):指在一个高可用(HA)系统中,当联系着的两个节点断开联系时,本来为一个整体的系统,分裂为两个独立节点,这时两个节点开始争抢共享资源,结果会导致系统混乱,数据损坏。

对于无状态服务的HA,无所谓脑裂不脑裂;但对有状态服务(比如MySQL)的HA,必须要严格防止脑裂。

 

原因:

出现这种情况,应该是两者之前VRRP失效了,有可能backup主机没有收到master主机的广播,所以自己去争抢了master权限。下面在主机上看看广播情况。

 

其他原因:

高可用服务器对之间心跳线链路发生故障,导致无法正常通信。
因心跳线坏了(包括断了,老化)。
因网卡及相关驱动坏了,ip配置及冲突问题(网卡直连)。
因心跳线间连接的设备故障(网卡及交换机)。
因仲裁的机器出问题(采用仲裁的方案)。
高可用服务器上开启了 iptables防火墙阻挡了心跳消息传输。
高可用服务器上心跳网卡地址等信息配置不正确,导致发送心跳失败。
其他服务配置不当等原因,如心跳方式不同,心跳广插冲突、软件Bug等。
Keepalived配置里同一 VRRP实例如果 virtual_router_id两端参数配置不一致也会导致裂脑问题发生。

 
 

解决:

防火墙将vrrp 广播给过滤掉了,导致backup接受不到master的广播,然后自己去争抢了vip、

关掉防火墙

 
其他解决办法:

同时使用串行电缆和以太网电缆连接,同时用两条心跳线路,这样一条线路坏了,另一个还是好的,依然能传送心跳消息。
当检测到裂脑时强行关闭一个心跳节点(这个功能需特殊设备支持,如Stonith、feyce)。相当于备节点接收不到心跳消患,通过单独的线路发送关机命令关闭主节点的电源。
做好对裂脑的监控报警(如邮件及手机短信等或值班).在问题发生时人为第一时间介入仲裁,降低损失。例如,百度的监控报警短倍就有上行和下行的区别。报警消息发送到管理员手机上,管理员可以通过手机回复对应数字或简单的字符串操作返回给服务器.让服务器根据指令自动处理相应故障,这样解决故障的时间更短.

 
 

6.2 vrrp原理

https://www.cnblogs.com/ananing/p/12803961.html
 
 

为什么存在:终端用户存在被孤立的可能。一旦交换机的三层虚接口故障,局域网用户就被孤立,不能实现与外部网络的通信。

 

虚拟路由器冗余协议

VRRP(Virtual Router Redundancy Protocol)

VRRP决定哪个路由器是Master,Master路由器负责接收发送至用户网关的数据包 并进行转发,以及响应PC对于其网关IP地址的ARP请求。

 
 

VRRP的工作过程

  1. VRRP组中的设备选举出Master。Master设备通过发送免费ARP报文,将虚拟MAC 地址通知给与它连接的设备或者主机,从而承担报文转发任务。
  2. Master设备周期性向备份组内所有Backup设备发送VRRP通告报文。
  3. 如果Master设备出现故障,VRRP备份组中的Backup设备重新选举新的Master。
  4. VRRP组状态切换时,Master设备由一台设备切换为另外一台设备,新的Master设 备会立即发送携带虚拟路由器的虚拟MAC地址和虚拟IP地址信息的免费ARP报文, 刷新与它连接的主机或设备中的MAC表项,从而把用户流量引到新的Master设备 上来,整个过程对用户完全透明。
  5. 原Master设备故障恢复时,若该设备为IP地址拥有者(则其优先级为255),将直 接切换至Master状态。若该设备优先级小于255,将首先切换至Backup状态,且其 优先级恢复为故障前配置的优先级。
  6. Backup设备的优先级高于Master设备时,由Backup设备的工作方式(抢占方式和 非抢占方式)决定是否重新选举Master。

你可能感兴趣的:(#,Linux之LVS)