单点故障的解决方案:高性能集群

提出问题

1、一个服务发生故障,如何解决?
2、备用节点和原服务是什么关系?
3、高性能集群如何检测一台机器发生故障?
4、如何使另一台机器快速上线?
5、高性能集群的应用场景?

高可用性集群用于避免单点故障

高可用性集群常用开源软件包括:Keepalived、Heartbeat 等。

概念:一般是指集群中任意一个节点失效的情况下,该节点上的所有任务会自动转移到其他正常的节点上。此过程不会影响整个集群的运行。

当集群中的一个节点系统发生故障时,运行着的集群服务器会迅速做出反应,将该系统的服务分配到集群中其他正在工作的系统上运行。考虑到计算机硬件和软件的容错性,高可用性集群的主要目的是使局群的整体服务尽可能可用。

如果高可用集群中的主节点发生了故障,那么这段时间内将由备节点代替它。
备节点通常是主节点的镜像。当它代替主节点时,它可以完全接管主节点(包括Ip和其他资源)提供服务,因此,使集群系统环境对系统环境来说是一致的,不会影响用户的访问。

高可用性集群使服务器系统的运行速度和响应速度会尽可能的快。
如何实现:它们经常利用在多台机器上运行的冗余节点和服务来相互跟踪。
如果某个节点失败,它的替补者将在几秒钟或更多时间内接管它的职责。因此,对于用户来说,集群里的任意一台机器宕机,业务都不会受影响。

应用场景:
常用于不易实现负载均衡的应用,如负载均衡器、主数据库、主存储对之间;

参考链接:https://www.zhang21.cn/2018/02/03/计算机集群/

你可能感兴趣的:(分布式理论)