LVS概述

1、LVS(Linux Virtual Server)Linux虚拟服务器:是一个虚拟的服务器集群系统。本项目在1998年5月有章文嵩博士成立,是中国国内最早出现的自由软件项目之一。通过LVS提供的负载均衡技术和Linux操作系统可实现一个高性能、高可用的服务器集群,从而以低成本实现最优的服务性能。

2、集群简介:集群(Cluster)是一组相互独立的、通过高速网络互联的计算机,它们构成了一个组,并以单一系统的模式加以管理。一个客户与集群相互作用时,集群像是一个独立的服务器。集群配置是用于提高可用性和可缩放性。集群系统的主要优点:高可扩展性、高可用性、高性能、高性价比。

3、集群类型

    LB:Load Balancing 高可拓展,伸缩集群

    HA :High Availability 高可用集群

    HP:High Performance 高性能集群

LVS详解

一、LVS组成:LVS其实由两个组件组成,在用户空间的ipvsadm和内核空间的ipvs,ipvs工作于INPUT链上,如果有请求报文被ipvs事先定义,就会将请求报文直接截取下根据其特定的模型修改请求报文,再转发到POSTROUTING链上送出TCP/IP协议栈。

LVS详解_第1张图片

二、LVS的实现模型:LVS在不同场景中提供了4种实现模型:分别是NAT,DR,TUN,FULLNAT

1、NAT工作模式

实现原理:NAT模型其实就是一个多路的DNAT,客户端对VIP进行请求,Director通过事先指定好的调度算法计算出应该转发到那台RS上,并修改请求报文的目标地址为RIP,通过DIP送往RS。当RS响应客户端报文给CIP,在经过Director时,Director又会修改源地址为VIP并将响应报文发送给客户端,这段过程对于用户来说是透明的。

NAT特性:

1)RS和Director必须要在同一个IP网段中。

2)RS的网关必须指向DIP

3)可以实现端口映射

4)请求报文和响应报文都会经过Director

5)RS可以是任意OS

6)DIP和RIP只能是内网IP

LVS详解_第2张图片

NAT工作流程:

1)客户端将请求发送前端的负载均衡器,请求报文源地址是CIP(客户端IP),目标地址为VIP(负载均衡器前端地址);

2)负载均衡器收到报文后,发现请求的是在规则里面存在的地址,做DNAT,把目标IP转换为任意后端RS的RIP,然后发送到后端服务器。

3)报文送到Real Server,进行响应,响应报文源IP为RIP,目标IP还是CIP,但是网关指向DIP。

4)Dirctor接收到响应报文后,自动进行源地址转换,把RIP转换为VIP,发往互联网,到达客户端。

2、DR工作模式

DR模型是一个比较复杂的模型,因为VIP在Director和每一个RS上都存在,客户端对VIP(Director)请求时,Director接收到请求,会将请求报文的源MAC地址和目标MAC地址修改为本机DIP所在网卡的MAC地址和指定的RS的RIP所在网卡的MAC地址,RS接收到请求报文后直接对CIP发出响应报文,而不需要经过Director。

DR特性:

1)RS和Director可以不在同一IP网段中,但是一定要在同一物理网络中。(最好同一网段)

2)RS可以使用公网地址,此时可以直接通过互联网连入,配置监控RS服务器。

3)RS的网关一定不能指向Director。

4)客户端请求报文必须经过Director,但是响应报文一定不能通过Director。

5)不能实现端口映射。

6)RS可以是大部分操作系统。

DR模型的问题(客户请求VIP怎么到达Director):

1)网络设备(路由器)中设置VIP地址和Director的MAC地址进行绑定。(前提:路由器的配置权限;缺点:Director故障转移,无法更新此绑定;)

2)arptables(前提:在各RS安装arptables程序,并编写arptables规则;缺点:依赖于独特功能的应用程序;)

3)修改Linux内核参数,arp_ignore,arp_announce(前提:RS必须是Linux;缺点:适用性差;)

 两个参数的取值含义:

    arp_announce:定义通告模式

            0:default,只要主机接入网络,则自动通告所有网卡MAC地址。

            1:尽力不通告非直接连入网络的网卡MAC地址。

            2:只通告直接进入网络的网卡MAC地址。

    arp_ignore:定义收到arp请求时的响应模式                        

            0:只有arp广播请求,马上响应,并且响应所有本机网卡的mac地址。

            1:只响应,接受arp广播请求的网卡接口mac地址。

            2:只响应,接受arp广播请求的网卡接口mac地址,并且需要请求广播于接口地址属于同一网段。

            3:主机范围(Scope host)内生效的接口,不予响应,只响应全局生效于外网能通信的网卡接口。

            4-7:保留位

            8:不响应一切arp广播请求。

LVS详解_第3张图片

DR工作流程:

DR模型,当RIP,DIP,VIP全部为公网地址时:

1)客户端对VIP发送请求。

2)Director接收请求,发现是请求后端的集群服务,然后对后端集群RIP发起ARP请求。

3)Director得到后方RS的MAC地址后,选择一个把请求通过MAC地址发送给后端服务器。

4)RS接收到请求后,进行响应,使用隐藏的VIP进行封装报文,但使用RIP所在网卡进行向外发送。

5)RS发出的响应报文由于是使用VIP隐藏网卡封装,因此源IP为VIP,目标IP为CIP,所以报文直接发往互联网路由器,到达客户端。

DR模型,当RIP,DIP,VIP全部为私有地址时:

1)客户端对VIP发送请求。

2)Director接收请求,发现是请求后端集群服务,然后对后端集群RIP发起ARP请求。

3)Director得到后方RS的MAC地址后,现在一个把请求通过MAC地址发送给后端服务器。

4)RS接收到请求后,进行响应,使用隐藏的VIP网卡进行封装报文,但使用RIP所在网卡进行向外发送。

5)RS发出的响应报文由于是使用VIP隐藏网卡封装,因此源IP为VIP,目标IP为CIP。

6)由于RS的通信RIP地址为私有地址,因此网关需要指向并发往转发服务器同网段地址网卡。

7)转发服务器将响应报文发往互联网,最终到达客户端。

3、TUN:IP隧道,IP报文中套IP报文

TUN模型通过隧道的方式在公网中实现请求报文的转发,客户端请求VIP(Director),Director不修改请求报文的源IP和目标IP,而是在IP首部前附加DIP和对应的RIP地址并转发到RIP上,RS收到请求报文,RS的本地接口上也有VIP,遂直接响应报文给CIP。

TUN特性

1)RIP,DIP,VIP都必须是公网地址。

2)RS网关不会指向DIP。

3)请求报文必须经过Director,但响应报文一定不经过Director。

4)不支持端口映射。

5)RS的OS(操作系统)必须得支持隧道功能。

LVS详解_第4张图片

TUN模型,通常为异地容灾策略:

1)客户端对VIP发送请求。

2)Director接收请求,发现是请求后端集群服务,由于和RS在异地网络,因此在原请求报文的基础上,在加上一层,源IP为DIP,目标IP为RIP的层。

3)Director将加了包装的报文发往互联网,互联网路由将TUN报文路由发往响应的RS。

4)RS接收到请求后,拆掉外出IP首部,发现里面还有一层IP首部,并且目标地址为自己的VIP,因此接收报文并响应。

5)RS通过隐藏VIP包装响应报文,目标IP仍然是原CIP。

6)RS将响应报文发往互联网路由器,并最终路由至客户端。

4、FullNAT:NAT的增强版

FULLNAT是最近几年才出现的,客户端请求VIP(Director),Director修改请求报文的源地址(DIP)和目标地址(RIP)并转发给RS,FULLNAT模型一般是Director和RS处于复杂的内网环境中的实现。

FULLNAT特性:

1)VIP是公网地址,DIP和RIP是内网地址,但是无需在同一网络中。

2)请求报文需要经过Director,响应报文也要经过Director。

3)RIP接收到的请求报文的源地址为DIP,目标地址为RIP。

4)支持端口映射。

5)RS可以是任意的OS(操作系统)。

LVS详解_第5张图片

三、LVS的调度算法

静态方法:仅根据调度算法本身进行调度

rr:round robin,轮流,轮训,轮叫,轮调
wrr:weighted round robin,加强轮询
sh:source hashing,session绑定
dh:destination hashing,目标地址hash

动态方法:根据算法及各RS当前的负载状况进行调度

lc:least connection,最少连接
wlc:weighted lc,加权最少连接
sed:shortest expection delay,最少期望延迟
nq:never queue,永不排队
lblc:Locality-Based Least Connection,基于局部性的最少连接
lblcr:Replicated lblc,基于局部性的带复制功能的最少连接

LVS缺陷:不能检查后端服务器的健康情况,总是发送连接到后端。

session持久机制:

1、session绑定:始终将同一个请求者的连接定向至同一个RS(第一次请求时仍由调度方法选择);没有容错能力,有损负载均衡效果。

2、session复制:在RS之间同步session,因此,每个RS中都有集群中所有的session;对于大规模集群环境不适用。

3、session服务器:利用单独部署的服务器来同一管理session。

四、LVS使用方法(ipvsadm)

命令格式:
ipvsadm -A|E -t|u|f service-address [-s scheduler]
              [-p [timeout]] [-M netmask]
      ipvsadm -D -t|u|f service-address
      ipvsadm -C
      ipvsadm -R
      ipvsadm -S [-n]
      ipvsadm -a|e -t|u|f service-address -r server-address
              [-g|i|m] [-w weight] [-x upper] [-y lower]
      ipvsadm -d -t|u|f service-address -r server-address
      ipvsadm -L|l [options]
      ipvsadm -Z [-t|u|f service-address]
      ipvsadm --set tcp tcpfin udp
      ipvsadm --start-daemon state [--mcast-interface interface]
              [--syncid syncid]
      ipvsadm --stop-daemon state
      ipvsadm -h
      
命令详解:
    定义集群服务:
        -A 添加一个集群服务
        -D -t|u|f service-address:删除指定的集群服务 
        -E 修改一个集群服务
        -t VIP:端口 定义集群服务的类型为TCP的某个端口
        -u VIP:端口 定义集群服务的类型为UDP的某个端口
        -f 防火墙标记 定义集群服务的类型为防火墙标记
        -s 调度算法 指定集群服务的调度算法 
        -p timeout:persistent connection,持久连接
    定义集群节点:
        -a 添加一个节点到集群服务
            -t|-u|-f service-address:指明将RS添加至那个Cluster-service中
            -r:指定RS,可包含{IP[:port]},只有支持端口映射的lvs类型才能使用跟集群服务中不同的端口
        -d 从集群服务中删除一个节点
        -e 修改集群服务器中的节点
        -r 节点IP:端口  定义节点的IP及类型
        -m 定义为NAT模型
        -g 定义为DR模型
        -i 定义为TUN模型
        -w 权重 定义服务器的权重
    查看已经定义的集群服务及RS:
        ipvsadm -L [options]
                -c:查看各连接
                -n:数字格式显示IP地址
                --stats: 显示统计数据
                --rate: 速率
                --exact: 显示统计数据的精确值
                --timeout:超时时间
             -Z:计数器清零;
    从集群服务中删除RS:
        ipvsadm -d -t|u|f service-address -r server-address
    删除集群服务:
        ipvsadm -D -t|u|f service-address
    清空所有的集群服务:
        ipvsadm -C 
    保存集群服务定义:
        ipvsadm -S > /path/to/some_rule_file
        ipvsadm-save > /path/to/some_rule_file
    让规则文件中的规则生效:
        ipvsadm -R < /path/from/some_rule_file
        ipvsadm-restore < /path/from/some_rule_file

五、LVS各种模型的实现

1、LVS NAT模型的实现

1、集群环境,一台Director,两台后端Real server RS1,RS2
    Director:两张网卡
        eth0:192.168.120.100/24     #VIP地址
        eth1:172.16.10.1/16
    RS1:   eth1:172.16.10.11/16
    RS2:   eth1:172.16.10.12/16
    Director的eth1和RS1,RS2的eth1模拟在同一网络,使用物理机
    Windows7作为客户端在192.168.120.0/24网段中
2、为RS添加网关指向Director
    RS1:
        # ifconfig eth1 172.16.10.11/16 up
        # route add default gw 172.16.10.1
    RS2:
        # ifconfig eth1  172.16.10.12/16 up
        # route add default gw 172.16.10.1
3、修改内核参数,开启转发功能
    # echo 1 > /proc/sys/net/ipv4/ip_forward
4、在RS1和RS2上分别创建测试页,并在Director验证服务
    [root@node2 ~]# echo node2.bjwf.com > /var/www/html/index.html
    [root@node2 ~]# systemctl start httpd.service
    [root@node3 ~]# echo node3.bjwf.com > /var/www/html/index.html
    [root@node3 ~]# systemctl start httpd.service
    Director上验证:
    [root@node1 ~]# curl http://172.16.10.11
    node2.bjwf.com
    [root@node1 ~]# curl http://172.16.10.12
    node3.bjwf.com
5、在Director添加集群服务
    [root@node1 ~]# yum -y install ipvsadm    #安装集群管理软件
    # ipvsadm -A -t 192.168.120.210:80 -s rr
    # ipvsadm -a -t 192.168.120.210:80 -r 172.16.10.11:80 -m -w 1
    # ipvsadm -a -t 192.168.120.210:80 -r 172.16.10.12:80 -m -w 1

2、LVS DR模型的实现

1、集群环境,一台Director,两台后端Real server RS1,RS2
    Director:    eth0:192.168.120.100/24  
       配置VIP:ifconfig eth0:0 192.168.120.110 netmask 255.255.255.255 broadcast 192.168.120.110
    RS1:       eth0:192.168.120.211/24  
    RS2:       eth0:192.168.120.212/24  
    VIP:          192.168.120.100
2、修改RS1,RS2的内核参数,关闭lo的arp通告和lo的arp响应,并配置隐藏地址
    # echo 2 > /proc/sys/net/ipv4/conf/all/arp_announce
    # echo 2 > /proc/sys/net/ipv4/conf/lo/arp_announce
    # echo 1 > /proc/sys/net/ipv4/conf/all/arp_ignore 
    # echo 1 > /proc/sys/net/ipv4/conf/lo/arp_ignore
    # ifconfig lo:1 192.168.120.100 netmask 255.255.255.255 broadcast 192.168.120.100
3、在RS1和RS2上分别创建测试页,并在Director验证服务
    [root@node2 ~]# echo node2.bjwf.com > /var/www/html/index.html
    [root@node2 ~]# systemctl start httpd.service
    [root@node3 ~]# echo node3.bjwf.com > /var/www/html/index.html
    [root@node3 ~]# systemctl start httpd.service
    Director上验证:
    [root@node1 ~]# curl http://192.168.120.101
    node2.bjwf.com
    [root@node1 ~]# curl http://192.168.120.102
    node3.bjwf.com
4、为RS1和RS2添加路由条目,保证其发出报文经过eth0之前,还要进过lo:0,保证源地址为VIP
    # route add 192.168.120.110 dev lo:1
5、在Director添加集群服务
    # ipvsadm -A -t 192.168.120.110:80 -s rr
    # ipvsadm -a -t 192.168.120.110:80 -r 192.168.120.101:80 -g -w 1
    # ipvsadm -a -t 192.168.120.110:80 -r 192.168.120.102:80 -g -w 1