负载均衡集群实现方法:

1、硬件方式

F5,CITRX,NETSCALER,A10(价格逐渐降低,由于为了防止调度器成为单点故障,所以要配置一台备用设备,所以造价更高了)

2、软件方式

四层:LVS(根据请求的ip和端口来分发),性能好,但对高级特性支持不好。

七层(反向代理):Nginx(http,smtp,pop3,imap),Haproxy(主要是http,tcp(mysql,smtp)),能够精确解码请求的协议,并能做适当修改后向后转发,操作能力强,性能略差于LVS,更适应生产环境。

LVS:Linux virtual server

lvs工作于内核的tcp/ip协议栈的input链,不能和iptables同时工作。当调度器上定义一个集群服务后才会向后进行转发,当请求报文经过prerouting到达input时,经过input上定义的集群策略审查,若是集群服务则请求报文会被送至forward并通过postrouting向后转发。

Lvs也是两段式:ipvsadm(用户空间)和ipvs(内核的input)

内核2.4.23之前并没有ipvs代码,所以需要打补丁。

相关术语:

Lvs的类型:

1、Nat模型

2、DR模型

3、TUN模型

Nat模型:工作机制和DNAT一样

当客户端请求报文到达调度器时ip报文首部是CIP|VIP,从prerouting送至input发现为集群服务后,将报文转发至forward经postrouting向后转发,此时ip首部变为CIP|RIP1,后端realserver发现是目标地址是自己后进行拆解报文、响应报文、封装报文,此时ip首部为RIP1|CIP,然后经过调度器的源地址转换,ip首部变为VIP|CIP,通过路由设备回应给客户端。

NAT模型遵循的法则:

1、集群节点和调度器必须在一个网络中

2、RIP地址为私有地址,仅用于集群节点间的通信

3、调度器位于客户端和realserver之间,复制处理进出的所有通信

4、realserver网关必须指向DIP

5、调度器支持端口映射

6、realserver可以支持使用任何操作系统

较大规模场景中,调度器容易成为瓶颈,理想状况下后端能带10台主机。生产环境一般不用这种模型。

DR模型:(常用)

调度器和realserver都连接在交换机上,并且调度器和RS都配置了VIP,只是RS的VIP被隐藏起来了,不用做通信,只是在响应时修改源地址而已。调度器的VIP配置在网卡上,而DIP配置在网卡别名上,RS的RIP配置在网卡上,VIP配置在网卡别名上。因为在一个网络中,所以调度器和RS的mac地址会通过arp解析得到其他人的mac地址。当请求报文发送至集群网络时ip报文首部为CIP|VIP,这时因为RS的VIP被隐藏起来了,所以只有调度器响应,而位于input链的策略发现是集群服务时,它不会拆解ip首部,而是把mac首部拆了,封装mac(源mac改为调度器的mac,目标mac改为调度器挑选的RS的mac),并向RS转发,报文传至RS时,RS发现目标地址是自己,然后进行响应,封装报文,源地址修改为VIP,目标地址为CIP,然后直接通过路由设备将报文发给客户端。

DR模型遵循的法则:

1、集群节点必须和调度器在同一物理网络中

2、RIP不用为私有地址了,实现了便捷的远程管理和监控

3、调度器只负责进站请求,响应保卫有RS直接发往客户端

4、集群节点不能将网关指向DIP

5、调度器不支持端口映射

6、大多数操作系统能支持RS,因为RS要求隐藏VIP

TUN模型:为了实现异地灾备(不常用)

工作机制和DR模型近似。RS有两个IP:RIP、VIP(隐藏的),且RIP是公网地址,RS和调度器不再同一网络,RS可直接将响应报文发送给客户端。调度器也有两个ip:VIP、DIP(别名)。当请求报文发送到调度器时,ip报文首部为CIP|VIP,调度器发现是集群服务想外转发时在CIP|VIP前面封装一层首部DIP|RIP,RS接受报文并且拆分外面的首部后发现目标地址的确为自己,便开始响应并直接经过路由设备回传给客户端,不需要经过调度器。这种模型需要调度器和RS支持隧道机制。

TUN模型遵循的法则:

1、各集群节点可跨越互联网

2、RIP必须为公网地址

3、调度器仅处理入站请求,响应报文则由RS直接发往客户端

4、RS网关不能指向调度器

5、只有支持隧道功能的os才能用于RS

6、不支持端口映射