负载均衡LVS概念详解

一、负载均衡LVS产生背景

随着Internet的快速发展和业务量的不断提高,基于网络的数据访问流量迅速增长,特别是对数据中心、大型企业以及门户网站等的访问,其访问流量甚至达到了10Gb/s的级别;同时,服务器网站借助HTTP、FTP、SMTP等应用程序,为访问者提供了越来越丰富的内容和信息,服务器逐渐被数据淹没;另外,大部分网站(尤其电子商务等网站)都需要提供不间断24小时服务,任何服务中断或通信中的关键数据丢失都会造成直接的商业损失。所有这些都对应用服务提出了高性能和高可靠性的需求。但是,相对于网络技术的发展,服务器处理速度和内存访问速度的增长却远远低于网络带宽和应用服务的增长,网络带宽增长的同时带来的用户数量的增长,也使得服务器资源消耗严重,因而服务器成为了网络瓶颈传统的单机模式,也往往成为网络故障点。如图1所示,出现的现象。

负载均衡LVS详细讲解_第1张图片

图1 网络不足造成现象

针对以上情况,有以下几种解决方案:

(1)服务器进行硬件升级:采用高性能服务器替换现有低性能服务器。

该方案的弊端:

高成本:高性能服务器价格昂贵,需要高额成本投入,而原有低性能服务器被闲置,造成资源浪费。

可扩展性差:每一次业务量的提升,都将导致再一次硬件升级的高额成本投入,性能再卓越的设备也无法满足当前业务量的发展趋势。

无法完全解决现在网络中面临的问题:如单点故障问题,服务器资源不够用问题等。

(2)组建服务器集群,利用负载均衡技术在服务器集群间进行业务均衡。多台服务器通过网络设备相连组成一个服务器集群,每台服务器都提供相同或相似的网络服务。服务器集群前端部署一台负载均衡设备,负责根据已配置的均衡策略将用户请求在服务器集群中分发,为用户提供服务,并对服务器可用性进行维护。

该方案的优势:

低成本:按照业务量增加服务器个数即可;已有资源不会浪费,新增资源无需选择昂贵的高端设备。

可扩展性:当业务量增长时,系统可通过增加服务器来满足需求,且不影响已有业务,不降低服务质量。

高可靠性:单台服务器故障时,由负载均衡设备将后续业务转向其他服务器,不影响后续业务提供,保证业务不中断。

服务器集群,构成负载均衡,这样就产生了负载均衡技术,如图2所示:

 

负载均衡LVS详细讲解_第2张图片

图2 负载均衡技术

二、负载均衡LVS的优点

负载均衡提供了一种廉价、有效、透明的方法扩展网络设备和服务器的带宽、增加吞吐量、加强网络数据处理能力,提高网络的灵活性和可用性。负载均衡技术具有如下优点:

 高性能:通过调度算法,将客户端请求合理地均衡到后端各台服务器上,消除系统可能存在的瓶颈。

 可扩展性:当服务的负载增长时,系统能被扩展来满足需求,且不降低服务质量。

 高可用性:通过健康性检测功能,能实时监测应用服务器的状态,保证在部分硬件和软件发生故障的情况下,整个系统的服务仍然可用。

 透明性:高效地使由多个独立计算机组成的松耦合的服务系统构成一个虚服务器;客户端应用程序与服务系统交互时,就像与一台高性能、高可用的服务器交互一样,客户端无须作任何修改。部分服务器的切入和切出不会中断服务,而用户觉察不到这些变化。

三、负载均衡LVS的几种模式

负载均衡LVS的几种方式包括NAT模式、DR模式(直接路由模式)和tunnel方式(隧道模式),这几种方式对比区别,如表1所示:

表1 LVS几种模式对比

负载均衡LVS详细讲解_第3张图片 

下面以NAT模式和DR模式为主要,介绍他们的工作原理,以及工作流程,如下:

1、NAT模式

NAT模式负载均衡LVS的组网灵活,后端服务器可以位于不同的物理位置,不同的局域网内。NAT方式下,LB设备分发服务请求时,进行目的IP地址转换(目的IP地址为实服务的IP),通过路由将报文转发给各个实服务。NAT模式负载均衡LVS的组网图,如图3所示:

负载均衡LVS详细讲解_第4张图片

图3 NAT模式负载均衡LVS的组网图

(1) NAT模式实现原理

客户端将到VSIP的请求发送给服务器群前端的负载均衡设备,负载均衡设备上的虚服务接收客户端请求,依次根据持续×××、ACL策略、调度算法,选择真实的服务器,再通过网络地址转换,用真实服务器地址重写请求报文的目标地址后,将请求发送给选定的真实服务器;真实服务器的响应报文通过负载均衡设备时,报文的源地址被还原为虚服务的VSIP,再返回给客户端,完成整个负载调度过程。

(2) NAT模式工作流程

NAT模式负载均衡LVS的工作流程图,如图4所示:

负载均衡LVS详细讲解_第5张图片

图4 NAT模式负载均衡LVS的工作流程图

NAT模式负载均衡LVS的工作流程图的描述如表2所示:

                     表2 NAT模式工作流程图的描述

步骤

说明

备注

(1)

Host发送服务请求报文

IPHost IP、目的IPVSIP

(2)

LB Device接收到请求报文后,借助持续×××或调度算法计算出应该将请求分发给哪台Server

-

(3)

LB Device使用DNAT技术分发报文

IPHost IP、目的IPServer IP

(4)

Server接收并处理请求报文,返回响应报文

IPServer IP、目的IPHost IP

(5)

LB Device接收响应报文,转换源IP后转发

IPVSIP、目的IPHost IP


 

2、DR模式(直接路由模式)

DR模式负载均衡LVS中只有客户端的请求报文通过LB设备,而服务器的响应报文不经过LB,从而减少了LB的负载,有效的避免了LB成为网络瓶颈。在DR模式下,LB设备分发服务请求时,不改变目的IP地址,而将报文的目的MAC替换为实服务的MAC后直接把报文转发给实服务。DR模式负载均衡LVS的典型组网如图5所示。

负载均衡LVS详细讲解_第6张图片

图5 DR模式负载均衡LVS的典型组网

(1) DR模式工作原理

DR模式负载均衡时,除了LB设备上配置了VSIP,真实服务器也都配置了VSIP,配置的VSIP要求不能响应ARP请求,例如在环回接口上配置VSIP。真实服务除了VSIP,还需要配置一个真实IP,用于和LB通信,LB设备和真实服务器在同一个链路域内。发送给VSIP的报文,由LB分发给相应的真实服务器,从真实服务器返回给客户端的报文直接通过交换机返回。

(2) DR模式工作流程

DR模式负载均衡LVS的工作流程图,如图6所示:

负载均衡LVS详细讲解_第7张图片

图6 DR模式负载均衡LVS的工作流程图

DR模式负载均衡LVS的工作流程图的详细描述如表3所示:

表3 DR模式工作流程图的描述

步骤

说明

备注

(1)

Host发送服务请求报文

IPHost IP、目的IPVSIP

(2)

General Device收到请求后转发给LB Device

Server上的VSIP不会响应ARP请求

(3)

LB Device接收到请求报文后,借助持续×××或调度算法计算出应该将请求分发给哪台Server

-

(4)

LB Device分发报文

IPHost IP,目的IPVSIP,目的MACServerMAC地址

(5)

Server接收并处理请求报文,返回响应报文

IPVSIP、目的IPHost IP

(6)

General Device收到响应报文后,直接将报文转发给Host

-

 

四、负载均衡LVS的调度算法

调度算法指对需要负载均衡的流量,按照一定的策略分发到指定的服务器群中的服务器或指定链路组的某条链路上,使得各台服务器或链路尽可能地保持负载均衡。

负载均衡技术持丰富的负载均衡调度算法。不同调度算法所实现的负载均衡效果不同,可以需要根据具体的应用场景,采用不同的算法。负载均衡LVS的调度算法包括静态调度算法和动态调度算法。

1、静态调度算法

静态算法,即按照预先设定策略,进行分发,不考虑当前各实服务或链路的实际负载情况。静态调度算法主要包括轮转调度(RR)、加权轮转调度(WRR)、基于源IP的Hash调度(SHS)、基于目的IP的Hash调度(DHS)。

(1) 轮转调度(Round Robin Scheduling)

依次将请求分发到不同的服务器或链路上,使得各个真实服务器或链路平均分担用户的连接请求。

如:实服务群中包含三个实服务A、B、C,假设各实服务均未达到连接上限,最后分发给A、B、C的连接数之比为1:1:1。

适用场景:服务器集群中各服务器性能或链路群中各链路带宽相当,无优劣之分。

(2) 加权轮转调度(Weighted Round Robin Scheduling)

按照权值大小,依次将请求分发到不同的服务器或链路上,权值大的分配较多请求,权值小的分配较少请求。该算法可以解决服务器间性能或链路间带宽不一的问题,权值标识服务器间性能或链路间带宽差异。

如:实服务组中包含三个实服务A、B、C,其配置权值分别为:4、3、2。假设各实服务均未达到连接上限,最后分发给A、B、C的连接数之比为4:3:2。

适用场景:服务器集群中各服务器性能或链路集群中各链路带宽存在差异。

(3) 基于源IP的Hash调度(Source IP Hashing Scheduling)

通过一个散列(Hash)函数将来自同一个源IP的请求映射到一台服务器或链路上。

适用场景:需要保证来自同一个用户的请求分发到同一个服务器或链路。

(4) 基于目的IP的Hash调度(Destination IP Hashing Scheduling)

通过一个散列函数将去往同一个目的IP的请求映射到一台服务器或链路上。

适用场景:需要保证到达同一个目的地的请求分发到同一台服务器或链路。适用于网关负载均衡和链路负载均衡。

2、动态调度算法

动态算法是根据各实服务或物理链路实际运行中的负载情况进行连接分发,分发效果更均衡。常见的动态算法有最小连接调度算法(LC)、加权最小连接(WLC)、最小期望延迟调度(SED)、永不排队调度(NQ)、基于本地的最小连接(LBLC)、基于本地重复应用的最小连接(LBLCR),具体介绍以前两种为例介绍,具体如下:

(1) 最小连接调度(Least Connection Scheduling)

负载均衡设备根据当前各服务器或链路的连接数来估计服务器或链路的负载情况,把新的连接分配给连接数最小的服务器或链路。该算法能把负载差异较大(连接保持时长差异较大)的请求平滑分发到各个服务器或链路上。

适用场景:服务器集群中各服务器性能或链路群中各链路带宽相当,无优劣之分,不同用户发起的连接保存时长差异较大。

(2) 加权最小连接(Weighted Connection Scheduling)

调度新连接时尽可能使服务器或链路的已建立活动连接数和服务器或链路权值成比例,权值表明了服务器处理性能或链路实际带宽。

适用场景:服务器集群中各服务器性能或链路群中各链路带宽存在差异,不同用户发起的连接保存时长差异较大。