负载均衡 建立在现有网络结构之上,它提供了一种廉价有效透明的方法扩展 网络设备 和 服务器 的带宽、增加 吞吐量 、加强网络数据处理能力、提高网络的灵活性和可用性。
主要通过报文中的目标地址和端口,再加上负载均衡设备设置的服务器选择方式,决定最终选择
的内部服务器。
以常见的 TCP 为例,负载均衡设备在接收到第一个来自客户端的 SYN 请求时,即通过上述方选
择一个最佳的服务器,并对报文中目标 IP 地址进行修改(改为后端服务器 IP),直接转发给该服务
器。TCP 的连接建立,即三次握手是客户端和服务器直接建立的,负载均衡设备只是起到一个类
似路由器的转发动作。在某些部署情况下,为保证服务器回包可以正确返回给负载均衡设备,在
转发报文的同时可能还会对报文原来的源地址进行修改。
实现四层负载均衡的软件有:
F5 :硬件负载均衡器,功能很好,但是成本很高。
lvs :重量级的四层负载软件 。
nginx :轻量级的四层负载软件,带缓存功能,正则表达式较灵活 。
haproxy :模拟四层转发,较灵活
所谓七层负载均衡,也称为“内容交换”,也就是主要通过报文中的真正有意义的应用层内容,
再加上负载均衡设备设置的服务器选择方式,决定最终选择的内部服务器。
七层应用负载的好处,是使得整个网络更智能化。例如访问一个网站的用户流量,可以通过七层
的方式,将对图片类的请求转发到特定的图片服务器并可以使用缓存技术;将对文字类的请求可
以转发到特定的文字服务器并可以使用压缩技术。
实现七层负载均衡的软件有:
haproxy :天生负载均衡技能,全面支持七层代理,会话保持,标记,路径转移;
nginx :只在 http 协议和 mail 协议上功能比较好,性能与 haproxy 差不多;
apache :功能较差
Mysql proxy :功能尚可。
每一次来自网络的请求轮流分配给内部中的服务器,从 1 至 N 然后重新开始。此种均衡算法适合
于服务器组中的所有服务器都有相同的软硬件配置并且平均服务请求相对均衡的情况。
根据服务器的不同处理能力,给每个服务器分配不同的权值,使其能够接受相应权值数的服务请
求。例如:服务器 A 的权值被设计成 1,B 的权值是 3,C 的权值是 6,则服务器 A、B、C 将分
别接受到 10%、30%、60%的服务请求。此种均衡算法能确保高性能的服务器得到更多的使用
率,避免低性能的服务器负载过重。
把来自网络的请求随机分配给内部中的多个服务器。
此种均衡算法类似于权重轮循算法,不过在处理请求分担时是个随机选择的过程。
负载均衡设备对内部各服务器发出一个探测请求(例如 Ping),然后根据内部中各服务器对探测
请求的最快响应时间来决定哪一台服务器来响应客户端的服务请求。此种均衡算法能较好的反映
服务器的当前运行状态,但这最快响应时间仅仅指的是负载均衡设备与服务器间的最快响应时
间,而不是客户端与服务器间的最快响应时间。
最少连接数均衡算法对内部中需负载的每一台服务器都有一个数据记录,记录当前该服务器正在
处理的连接数量,当有新的服务连接请求时,将把当前请求分配给连接数最少的服务器,使均衡
更加符合实际情况,负载更加均衡。此种均衡算法适合长时处理的请求服务,如 FTP。
此种均衡算法将把服务请求分配给内部中处理负荷(根据服务器 CPU 型号、CPU 数量、内存大小
及当前连接数等换算而成)最轻的服务器,由于考虑到了内部服务器的处理能力及当前网络运行
状况,所以此种均衡算法相对来说更加精确,尤其适合运用到第七层(应用层)负载均衡的情况
下。
在此均衡算法下,分处在不同地理位置的负载均衡设备收到同一个客户端的域名解析请求,并在
同一时间内把此域名解析成各自相对应服务器的 IP 地址并返回给客户端,则客户端将以最先收到
的域名解析 IP 地址来继续请求服务,而忽略其它的 IP 地址响应。在种均衡策略适合应用在全局负
载均衡的情况下,对本地负载均衡是没有意义的。
一致性哈希一致性 Hash,相同参数的请求总是发到同一提供者。当某一台提供者挂时,原本发往
该提供者的请求,基于虚拟节点,平摊到其它提供者,不会引起剧烈变动。
通过管理发送方 IP 和目的地 IP 地址的散列,将来自同一发送方的分组(或发送至同一目的地的分
组)统一转发到相同服务器的算法。当客户端有一系列业务需要处理而必须和一个服务器反复通信
时,该算法能够以流(会话)为单位,保证来自相同客户端的通信能够一直在同一服务器中进行处
理。
通过管理客户端请求 URL 信息的散列,将发送至相同 URL 的请求转发至同一服务器的算法。
IPVS
LVS 的 IP 负载均衡技术是通过 IPVS 模块来实现的,IPVS 是 LVS 集群系统的核心软件,它的主要作用是:安装在 Director Server 上,同时在 Director Server 上虚拟出一个 IP 地址,用户必须通
过这个虚拟的 IP 地址访问服务器。这个虚拟 IP 一般称为 LVS 的 VIP,即 Virtual IP。访问的请求
首先经过 VIP 到达负载调度器,然后由负载调度器从 Real Server 列表中选取一个服务节点响应用
户的请求。 在用户的请求到达负载调度器后,调度器如何将请求发送到提供服务的 Real Server 节
点,而 Real Server 节点如何返回数据给用户,是 IPVS 实现的重点技术。
ipvs : 工作于内核空间,主要用于使用户定义的策略生效
ipvsadm : 工作于用户空间,主要用于用户定义和管理集群服务的工具
ipvs 工作于内核空间的 INPUT 链上,当收到用户请求某集群服务时,经过 PREROUTING 链,经
检查本机路由表,送往 INPUT 链;在进入 netfilter 的 INPUT 链时,ipvs 强行将请求报文通过
ipvsadm 定义的集群服务策略的路径改为 FORWORD 链,将报文转发至后端真实提供服务的主机。
①.客户端将请求发往前端的负载均衡器,请求报文源地址是 CIP(客户端 IP),后面统称为 CIP),目
标地址为 VIP(负载均衡器前端地址,后面统称为 VIP)。
②.负载均衡器收到报文后,发现请求的是在规则里面存在的地址,那么它将客户端请求报文的目
标地址改为了后端服务器的 RIP 地址并将报文根据算法发送出去。
③.报文送到 Real Server 后,由于报文的目标地址是自己,所以会响应该请求,并将响应报文返还
给 LVS。
④.然后 lvs 将此报文的源地址修改为本机并发送给客户端。
注意:在 NAT 模式中,Real Server 的网关必须指向 LVS,否则报文无法送达客户端
特点:
1、NAT 技术将请求的报文和响应的报文都需要通过 LB 进行地址改写,因此网站访问量比较大的
时候 LB 负载均衡调度器有比较大的瓶颈,一般要求最多之能 10-20 台节点
2、只需要在 LB 上配置一个公网 IP 地址就可以了。
3、每台内部的 realserver 服务器的网关地址必须是调度器 LB 的内网地址。
4、NAT 模式支持对 IP 地址和端口进行转换。即用户请求的端口和真实服务器的端口可以不一致。
优点:
集群中的物理服务器可以使用任何支持 TCP/IP 操作系统,只有负载均衡器需要一个合法的 IP 地
址。
缺点:
扩展性有限。当服务器节点(普通 PC 服务器)增长过多时,负载均衡器将成为整个系统的瓶颈,因为所有的请求包和应答包的流向都经过负载均衡器。当服务器节点过多时,大量的数据包都交汇
在负载均衡器那,速度就会变慢!