LVS介绍

目录

 

LVS(Linux虚拟服务器)

为什么要用LVS?

术语了解

LVS类型

LVS工作模式

IPVS调度器实现了如下八种负载调度算法


LVS(Linux虚拟服务器)

LVSLinux Virtual Server的简写,意即Linux虚拟服务器,是一个虚拟的服务器集群系统。本项目在1998年5月由章文嵩博士成立,是中国国内最早出现的自由软件项目之一。LVS也就是是多个服务器组成的一个虚拟服务器集群。

为什么要用LVS?

n 工作在网络模型的7层,可以针对http应用做一些分流的策略,比如针对域名、目录结构,Nginx单凭这点可利用的场合就远多于LVS了。

n 最新版本的Nginx也支持4层TCP负载,曾经这是LVS比Nginx好的地方。

n Nginx对网络稳定性的依赖非常小,理论上能ping通就就能进行负载功能,这个也是它的优势之一,相反LVS对网络稳定性依赖比较大。

n Nginx安装和配置比较简单,测试起来比较方便,它基本能把错误用日志打印出来。LVS的配置、测试就要花比较长的时间了,LVS对网络依赖比较大。

那为什么要用lvs呢?

ü 简单一句话,当并发超过了Nginx上限,就可以使用LVS了。

ü 日1000-2000W PV或并发请求1万以下都可以考虑用Nginx。

ü 大型门户网站,电商网站需要用到LVS。

术语了解

首先掌握几个术语,方便下边的理解:

DS:(director server)负载均衡服务器

RS:(real server)真实服务器

DIR:(director server IP)地址

VIP:(外部网络访问的IP地址)虚拟IP地址

RIP:(real server IP)真实服务器IP地址

CIP:客户端IP地址

LVS类型

NAT:地址转换

  1.集群节点(RS)跟DS必须在一个IP网络中;

  2.RIP地址通常是私有地址,仅用于集群节点间的通信;

  3.DS位于client(客户端)和RS之间,并负责进出的所有通信;

  4.RS的网关必须指向DIP;

  5.较大规模应用场景中,DS易成为系统瓶颈;

  6.支持端口映射

DR:直接路由

  1.集群节点跟DS必须在同一个物理网络中

  2.RIP可以使用公网地址,实现远程管理和监控。

  3.DS处理入站请求,响应报文则由RS直接发往客户端

  4.RS不能将网关指向DIP

  5.不支持端口映射

TUN:隧道

  1.集群节点可以跨越网络

  2.RIP必须是公网地址

  3.director处理入站请求,响应报文则由RS直接发往客户端

  4.RS不能将网关指向DIP

  5.不支持端口映射

LVS工作模式

LVS集群的工作模式--DR(直接路由模式)

LVS介绍_第1张图片

DR模式通过修改请求报文的目标MAC地址,将请求发给RS,RS将响应后的处理结果发送给客户端。

DR直接路由工作模式说明:

1.当请求报文到达DS,此时请求报文会先到达内核空间的PREROUTING链,此时,源IP和目标IP没有改变。

2.PREROUTING链发现目标IP是本机,将数据包发送大INPUT链。

3.到达INPIUT链,ipvs会检查请求的服务的IP是否为集群服务,若是,则将源MAC修改为DIP的MAC,目的MAC修改为RIP的MAC,然后在发送到POSTROUTING链。

4.POSTROUTING链检查目的MAC为RIP的MAC地址,会将数据包发送到RS。

5.RS发现目的MAC是自己的MAC,就会接受报文,处理之后,会将响应报文通过lo接口传送给eth0网卡,然后发送到客户端。此时源IP是VIP,目标IP是CIP,源MAC是VIP的MAC,目标MAC是CIP的MAC。

6.响应报文到达客户端。

LVS集群的工作模式--NAT(地址转换模式)

LVS介绍_第2张图片

(a). 当用户请求到达Director Server,此时请求的数据报文会先到内核空间的PREROUTING链。 此时报文的源IP为CIP,目标IP为VIP

(b). PREROUTING检查发现数据包的目标IP是本机,将数据包送至INPUT链

(c). IPVS比对数据包请求的服务是否为集群服务,若是,修改数据包的目标IP地址为后端服务器IP,然后将数据包发至POSTROUTING链。 此时报文的源IP为CIP,目标IP为RIP

(d). POSTROUTING链通过选路,将数据包发送给Real Server

(e). Real Server比对发现目标为自己的IP,开始构建响应报文发回给Director Server。 此时报文的源IP为RIP,目标IP为CIP

(f). Director Server在响应客户端前,此时会将源IP地址修改为自己的VIP地址,然后响应给客户端。 此时报文的源IP为VIP,目标IP为CIP

LVS集群的工作模式--TUN(隧道模式)

LVS介绍_第3张图片

(a) 当用户请求到达Director Server,此时请求的数据报文会先到内核空间的PREROUTING链。 此时报文的源IP为CIP,目标IP为VIP 。

(b) PREROUTING检查发现数据包的目标IP是本机,将数据包送至INPUT链

(c) IPVS比对数据包请求的服务是否为集群服务,若是,在请求报文的首部再次封装一层IP报文,封装源IP为为DIP,目标IP为RIP。然后发至POSTROUTING链。 此时源IP为DIP,目标IP为RIP

(d) POSTROUTING链根据最新封装的IP报文,将数据包发至RS(因为在外层封装多了一层IP首部,所以可以理解为此时通过隧道传输)。 此时源IP为DIP,目标IP为RIP

(e) RS接收到报文后发现是自己的IP地址,就将报文接收下来,拆除掉最外层的IP后,会发现里面还有一层IP首部,而且目标是自己的lo接口VIP,那么此时RS开始处理此请求,处理完成之后,通过lo接口送给eth0网卡,然后向外传递。 此时的源IP地址为VIP,目标IP为CIP

(f) 响应报文最终送达至客户端

LVS集群的工作模式--FULLNAT

LVS的DR和NAT模式要求RS和LVS在同一个vlan中,导致部署成本过高;TUNNEL模式虽然可以跨vlan,但RealServer上需要部署ipip隧道模块等,网络拓扑上需要连通外网,较复杂,不易运维。

为了解决上述问题,开发出FULLNAT,该模式和NAT模式的区别是:数据包进入时,除了做DNAT,还做SNAT(用户ip->内网ip),从而实现LVS-RealServer间可以跨vlan通讯,RealServer只需要连接到内网。

类比地铁站多个闸机。

IPVS调度器实现了如下八种负载调度算法

  a) 轮询(Round Robin)RR

调度器通过"轮叫"调度算法将外部请求按顺序轮流分配到集群中的真实服务器上,它均等地对待每一台服务器,而不管服务器上实际的连接数和系统负载。

 

  b) 加权轮叫(Weighted Round Robin)WRR

调度器通过"加权轮叫"调度算法根据真实服务器的不同处理能力来调度访问请求。这样可以保证处理能力强的服务器处理更多的访问流量。调度器可以自动问询真实服务器的负载情况,并动态地调整其权值。

 

  c) 最少链接(Least Connections) LC

调度器通过"最少连接"调度算法动态地将网络请求调度到已建立的链接数最少的服务器上。如果集群系统的真实服务器具有相近的系统性能,采用"最小连接"调度算法可以较好地均衡负载。

 

  d) 加权最少链接(Weighted Least Connections) Wlc

在集群系统中的服务器性能差异较大的情况下,调度器采用"加权最少链接"调度算法优化负载均衡性能,具有较高权值的服务器将承受较大比例的活动连接负载。调度器可以自动问询真实服务器的负载情况,并动态地调整其权值。

 

  e) 基于局部性的最少链接(Locality-Based Least Connections) Lblc

"基于局部性的最少链接" 调度算法是针对目标IP地址的负载均衡,目前主要用于Cache集群系统。该算法根据请求的目标IP地址找出该目标IP地址最近使用的服务器,若该服务器 是可用的且没有超载,将请求发送到该服务器;若服务器不存在,或者该服务器超载且有服务器处于一半的工作负载,则用"最少链接"的原则选出一个可用的服务 器,将请求发送到该服务器。

 

  f) 带复制的基于局部性最少链接(Locality-Based Least Connections with Replication

"带复制的基于局部性最少链接"调度算法也是针对目标IP地址的负载均衡,目前主要用于Cache集群系统。它与LBLC算法的不同之处是它要维护从一个 目标IP地址到一组服务器的映射,而LBLC算法维护从一个目标IP地址到一台服务器的映射。该算法根据请求的目标IP地址找出该目标IP地址对应的服务 器组,按"最小连接"原则从服务器组中选出一台服务器,若服务器没有超载,将请求发送到该服务器,若服务器超载;则按"最小连接"原则从这个集群中选出一 台服务器,将该服务器加入到服务器组中,将请求发送到该服务器。同时,当该服务器组有一段时间没有被修改,将最忙的服务器从服务器组中删除,以降低复制的 程度。

 

  g) 目标地址散列(Destination Hashing) Dh

"目标地址散列"调度算法根据请求的目标IP地址,作为散列键(Hash Key)从静态分配的散列表找出对应的服务器,若该服务器是可用的且未超载,将请求发送到该服务器,否则返回空。

 

  h) 源地址散列(Source Hashing)SH

"源地址散列"调度算法根据请求的源IP地址,作为散列键(Hash Key)从静态分配的散列表找出对应的服务器,若该服务器是可用的且未超载,将请求发送到该服务器,否则返回空。

本篇内容转载至https://www.cnblogs.com/clsn/p/7920637.html

下一篇将进行LVS/DR,LVS/NAT模型的搭建及相关配置。

你可能感兴趣的:(Linux服务篇)