什么是单点故障与应对措施

什么是单点故障

通常分布式系统采用主从模式,一个主机连接多个处理节点,主节点负责分发任务,而子节点负责处理业务,当主节点发生故障时,会导致整个系统发故障,我们把这种故障叫做单点故障。

应对措施

  1. 加一个备份主节点,间隔一段时间后给主节点发送一个ping包,主节点收到后回应ack字节进行回应,备用主节点通过是否收到ack字节包来判断主节点是否正常运行,没有收到则顶替主节点的位置提供服务。
  2. 分布式锁,分布式协调,例如使用Zookeeper实现服务注册与发现。

你可能感兴趣的:(其它,单点故障)