集群的基本概念

集群的定义

集群是一组协同工作的服务集合,一般由两个或者两个以上的服务器组成.在集群中,同样的服务可以由多个服务实体提供.因而当一个节点出现故障时,集群中的另外一个节点就可以自动接管故障节点的资源.

集群需要具备的基本条件

1.两个或者两个以上的服务器
2.集群中的节点是需要互相通信的,通信的方式有两种,一种是基于RS232的心跳监控,另一种是用一块单独的网卡来跑心跳.
3.同时一个集群系统需要拥有共享的数据存储,因为集群对外提供的服务是一致的,任何一个集群节点运行一个应用时,应用的数据都集中存储在节点共享空间内,而每个集群节点仅运行应用的服务,同时存储应用程序文件.

小结:构建一个集群至少需要两台服务器,同时还需要有串口线,集群软件,共享存储设备等.


心跳检测

1.通过心跳线来实现

可以做心跳线的设备有RS232串口线

2.通过单独的网卡来实现

这种方式下每个节点都应该具有两块网卡,一块作为私有网络连接到对方机器相应的网卡,用于心跳检测.另外一块连接到公共网络对外提供服务,同时心跳网卡和服务网卡的IP地址尽量不要在一个网段内.因为心跳检测的效率直接影响故障切换时间的长短


漂移IP

在集群系统中,除了每个服务节点自身的真是IP地址外,还存在一个漂移IP地址。至于为什么叫漂移IP,是因为这个IP地址不是固定的.比如,在两个节点的双机热备中,正常状态下,这个漂移IP地址位于主节点上,当主节点出现故障后,漂移IP地址自动切换到备份节点。此外,对外提供服务的IP一定要是这个漂移IP,因为故障后漂移IP可以转移到另外的机器,其它机器就可以继续提供服务了.


集群中的其它相关概念

节点

运行Heartbeat进程的一个独立主机,称为节点.节点有主次之分,分别称为主节点和备份节点.每个节点拥有唯一的主机名,并且拥有属于自己的一组资源,例如,磁盘,文件系统,网络地址和应用服务等,主节点上一般运行着一个或者多个应用服务.而备份节点一般处于监控状态.

资源

资源时一个节点可以控制的实体,并且当节点宕机发生故障时,这些资源能够被其它节点接管,一般由以下几种
磁盘分区,文件系统,IP地址,应用程序服务,NFS等


事件

表示集群中可能发生的事情。如节点系统故障,网络连通故障,网卡故障,应用程序故障灯,这些事件会导致节点的资源发生转移


动作

即对事件发生时的响应方式,可以由shell脚本控制.如,当某个节点发送故障后,备份节点将通过事先设定好的执行脚本进行服务的关闭或者启动,进而接管故障节点的资源.


集群的基本分类

负载均衡集群
分布式计算集群

你可能感兴趣的:(集群的基本概念)