Linux中级实战专题篇:LVS负载均衡集群部署

LVS负载均衡

一,负载均衡集群相关介绍

1,集群是什么
集群(cluster)技术是一种较新的技术,通过集群技术,可以在付出较低成本的情况下获得在性能、可靠性、灵活性方面的相对较高的收益,其任务调度则是集群系统中的核心技术。

集群组成后,可以利用多个计算机和组合进行海量请求处理(负载均衡),从而获得很高的处理效率,也可以用多个计算机做备份(高可用),使得任何一个机器坏了整个系统还是能正常运行,防止单点故障。

              Real-server  
LVS  ---      Real-server
              Real-server
2,负载均衡集群技术
负载均衡(Load Balance):负载均衡集群为企业需求提供了可解决容量问题的有效方案。负载均衡集群使负载可以在计算机集群中尽可能平均地分摊处理。

负载通常包括应用程序处理负载和网络流量负载,每个节点都可以承担一定的处理负载,并且可以实现处理负载在节点之间的动态分配,以实现负载均衡。
3,负载均衡集群技术的实现
负载均衡(Load Balance)
负载均衡技术类型:基于 4 层负载均衡技术和基于 7 层负载均衡技术
负载均衡实现方式:硬件负载均衡设备或者软件负载均衡
硬件负载均衡产品:F5、深信服 、Radware
软件负载均衡产品: LVS(Linux Virtual Server)、 Haproxy、Nginx、Ats(apache traffic server)
4,负载均衡分类
负载均衡根据所采用的设备对象(软/硬件负载均衡),应用的OSI网络层次(网络层次上的负载均衡),及应用的地理结构(本地/全局负载均衡)等来分类。下面着重介绍的是根据应用的 OSI 网络层次来分类的两个负载均衡类型。

负载均衡可以大概分为以下几类:
• 二层负载均衡(mac)
一般是用虚拟mac地址方式,外部对虚拟MAC地址请求,负载均衡接收后分配后端实际的MAC地址响应。
• 三层负载均衡(ip)
一般采用虚拟IP地址方式,外部对虚拟的ip地址请求,负载均衡接收后分配后端实际的IP地址响应。
• 四层负载均衡(tcp)
在三层负载均衡的基础上,用ip+port接收请求,再转发到对应的机器。
• 七层负载均衡(http)
根据虚拟的url或IP,主机名接收请求,再转向相应的处理服务器。
在实际应用中,比较常见的就是四层负载及七层负载。这里也重点说下这两种负载。
5,四层负载均衡(基于IP+端口的负载均衡)
实现四层负载均衡的软件有:
• F5:硬件负载均衡器,功能很好,但是成本很高。
• lvs:重量级开源的四层负载软件
• nginx:轻量级的四层负载软件,带缓存功能,正则表达式较灵活
• haproxy:模拟四层转发,较灵活
6,七层的负载均衡(基于虚拟的URL或主机IP的负载均衡)
在四层负载均衡的基础上(没有四层是绝对不可能有七层的),再考虑应用层的特征,比如同一个Web服务器的负载均衡,除了根据VIP加80端口辨别是否需要处理的流量,还可根据七层的URL、浏览器类别来决定是否要进行负载均衡。

实现七层负载均衡的软件有:
haproxy:天生负载均衡技能,全面支持七层代理,会话保持,标记,路径转移;
nginx:只在http协议和mail协议上功能比较好,性能与haproxy差不多;

7,

           | 四层负载均衡           | 七层负载均衡                  
    +----------+-------------------------+----------------------------------------------+
    | 基于      | 基于IP+Port的     | 基于虚拟的URL或主机IP等                |
    +----------+-------------------------+----------------------------------------------+
    | 类似于    | 路由器            | 代理服务器                                     |
    +----------+-------------------------+----------------------------------------------+
    | 复杂度    |||
    +----------+-------------------------+----------------------------------------------+
    | 性能     | 高;无需解析内容   | 中;需要算法识别 URL,Cookie 和 HTTP head 等信息 |
    +----------+-------------------------+----------------------------------------------+
    | 安全性   | 低,               | 高,                                        |
    +----------+-------------------------+----------------------------------------------+
    | 额外功能  || 会话保持,图片压缩,等                     |

总结:从上面的对比看来四层负载与七层负载最大的区别就是效率与功能的区别。四层负载架构设计比较简单,无需解析具体的消息内容,在网络吞吐量及处理能力上会相对比较高,而七层负载均衡的优势则体现在功能多,控制灵活强大。在具体业务架构设计时,使用七层负载或者四层负载还得根据具体的情况综合考虑

二,lvs简介

1,lvs介绍
(1)LVS 是Linux Virtual Server的简称,也就是 Linux 虚拟服务器, 是一个由章文嵩博士发起的自由软件项目,它的官方站点是www.linuxvirtualserver.org。现在LVS已经是 Linux标准内核的一部分,因此性能较高。
(2)LVS软件作用:通过LVS提供的负载均衡技术和Linux操作系统实现一个高性能、高可用的服务器群集,它具有良好可靠性、可扩展性和可操作性。从而以低廉的成本实现最优的服务性能。
2,LVS 优势与不足
优势:
高并发连接:LVS基于内核网络层面工作,有超强的承载能力和并发处理能力。单台LVS负载均衡器,可支持上万并发连接。
稳定性强:是工作在网络4层之上仅作分发之用,这个特点也决定了它在负载均衡软件里的性能最强,稳定性最好,对内存和cpu资源消耗极低。
成本低廉:硬件负载均衡器少则十几万,多则几十万上百万,LVS只需一台服务器和就能免费部署使用,性价比极高。
配置简单:LVS配置非常简单,仅需几行命令即可完成配置,也可写成脚本进行管理。
支持多种算法:支持多种轮调算法,可根据业务场景灵活调配进行使用
支持多种工作模型:可根据业务场景,使用不同的工作模式来解决生产环境请求处理问题。
应用范围广:因为LVS工作在4层,所以它几乎可以对所有应用做负载均衡,包括http、数据库、DNS、ftp服务等等

不足:
工作在4层,不支持7层规则修改,机制过于庞大,不适合小规模应用。
3,lvs核心组件和专业术语
1、核心组件
LVS的管理工具和内核模块 ipvsadm/ipvs
ipvsadm:用户空间的命令行工具,用于管理集群服务及集群服务上的RS等;
ipvs:工作于内核上的程序,可根据用户定义的集群实现请求转发;

2、专业术语
VS:Virtual Server            #虚拟服务
DR:Director, Balancer        #负载均衡器、分发器
RS:Real Server               #后端请求处理的服务器 
CIP: Client IP                #客户端IP
VIP:Director Virtual IP      #负载均衡器虚拟IP
DIP:Director IP              #负载均衡器IP
RIP:Real Server IP           #后端请求处理服务器的IP
补充:
SIP   源IP
DIP  目的IP
三,lvs负载均衡的四种工作模式
四种工作模式:
NAT:网络地址转换模式,**进站/出站的数据流量经过分发器**(IP负载均衡,他修改的是IP地址)  --利用三层功能

DR:直接路由模式,**只有进站的数据流量经过分发器(**数据链路层负载均衡,因为他修改的是目的mac地址)--利用二层功能mac地址

TUN:隧道模式,只有进站的数据流量经过分发器

full-nat:双向转换:通过请求报文的源地址为DIP,目标为RIP来实现转发:对于响应报文而言,修改源地址为VIP,目标地址为CIP来实现转发

四种工作模式的原理以及优缺点

1、NAT模式(VS-NAT)
原理:就是把客户端发来的数据包的IP头的目的地址,在负载均衡器上换成其中一台RS的IP地址,并发至此RS来处理,RS处理完成后把数据交给经过负载均衡器,负载均衡器再把数据包的原IP地址改为自己的IP,将目的地址改为客户端IP地址即可。期间,无论是进来的流量,还是出去的流量,都必须经过负载均衡器。

优点:集群中的物理服务器可以使用任何支持TCP/IP操作系统,只有负载均衡器需要一个合法的IP地址。

缺点:扩展性有限。当服务器节点(普通PC服务器)增长过多时,负载均衡器将成为整个系统的瓶颈,因为所有的请求包和应答包的流向都经过负载均衡器。当服务器节点过多时,大量的数据包都交汇在负载均衡器那,速度就会变慢!

Linux中级实战专题篇:LVS负载均衡集群部署_第1张图片

2、直接路由(Direct routing)模式(VS-DR)
原理:负载均衡器和RS后端真实服务器都使用同一个IP对外服务。但只有DR负载均衡器对ARP请求进行响应,所有RS后端真实服务器对本身这个IP的ARP请求保持静默。也就是说,网关会把对这个服务IP的请求全部定向给DR负载均衡器,而DR负载均衡器收到数据包后根据调度算法,找出对应的RS后端真实服务器,把目的MAC地址改为RS后端服务器的MAC(因为IP一致)并将请求分发给这台RS。这时RS收到这个数据包,处理完成之后,由于IP一致,可以直接将数据返给客户,则等于直接从客户端收到这个数据包无异,处理后直接返回给客户端。

优点:和TUN(隧道模式)一样,负载均衡器也只是分发请求,应答包通过单独的路由方法返回给客户端。与VS-TUN相比,VS-DR这种实现方式不需要隧道结构,因此可以使用大多数操作系统做为物理服务器。

缺点:(不能说缺点,只能说是不足)要求负载均衡器的网卡必须与物理网卡在一个物理段上。
mac地址:物理地址,全球唯一性,infonfig /all 在终端可以查看
Linux中级实战专题篇:LVS负载均衡集群部署_第2张图片

3、IP隧道(Tunnel)模式(VS-TUN)
原理:互联网上的大多Internet服务的请求包很短小,而应答包通常很大。那么隧道模式就是,把客户端发来的数据包,封装一个新的IP头标记(仅目的IP)发给RS,RS收到后,先把数据包的头解开,还原数据包,处理后,直接返回给客户端,不需要再经过负载均衡器。注意,由于RS需要对负载均衡器发过来的数据包进行还原,所以说必须支持IPTUNNEL协议。所以,在RS的内核中,必须编译支持IPTUNNEL这个选项
优点:负载均衡器只负责将请求包分发给后端节点服务器,而RS将应答包直接发给用户。所以,减少了负载均衡器的大量数据流动,负载均衡器不再是系统的瓶颈,就能处理很巨大的请求量,这种方式,一台负载均衡器能够为很多RS进行分发。而且跑在公网上就能进行不同地域的分发。

缺点:隧道模式的RS节点需要合法IP,这种方式需要所有的服务器支持”IP Tunneling”(IP Encapsulation)协议,服务器可能只局限在部分Linux系统上。
Linux中级实战专题篇:LVS负载均衡集群部署_第3张图片

4、FULL-NAT模式(了解)
原理客户端对负载均衡虚拟IP也就是VIP发起请求,Director接过请求发现是请求后端服务。Direcrot对请求报文做full-nat,把源ip改为Dip,把目标ip转换为任意后端RS的rip,然后发往后端,rs接到请求后,进行响应,相应源ip为Rip目标ip还是DIP,由内部路由路由到Director,Director接到响应报文,进行full-nat。将源地址为VIP,目标地址改为CIP
请求使用DNAT,响应使用SNAT

四者的区别
lvs-nat与lvs-fullnat:请求和响应报文都经由Director负载均衡器
lvs-nat:后端真实服务器的IP也就是RIP的网关要指向负载均衡的IP也就是DIP
lvs-fullnat:真是服务器IP也就是RIP和负载均衡IP也就是DIP未必在同一IP网络,
但要能通信
     
lvs-dr与lvs-tun:请求报文要经由Director负载均衡器,但响应报文由后端真实
服务器RS直接发往Client
lvs-dr:通过封装新的MAC首部实现,通过MAC网络转发
lvs-tun:通过在原IP报文外封装新IP头实现转发,支持远距离通信 

三,lvs的相关参数解释

1、LVS-server安装lvs管理软件
yum -y install ipvsadm
程序包:ipvsadm(LVS管理工具)
主程序:/usr/sbin/ipvsadm
规则保存工具:/usr/sbin/ipvsadm --save  > /etc/sysconfig/ipvsadm
配置文件:/etc/sysconfig/ipvsadm-config

2、命令选项
-A --add-service #在服务器列表中新添加一条新的虚拟服务器记录
-t #表示为tcp服务
-u #表示为udp服务
-s --scheduler #使用的调度算法, rr | wrr | lc | wlc  默认调度算法是 wlc
例:ipvsadm -A -t 192.168.1.2:80 -s wrr

-a --add-server  #在服务器表中添加一条新的真实主机记录
-t --tcp-service #说明虚拟服务器提供tcp服务
-u --udp-service #说明虚拟服务器提供udp服务
-r --real-server #真实服务器地址
-m --masquerading #指定LVS工作模式为NAT模式
-w --weight #真实服务器的权值
-g --gatewaying #指定LVS工作模式为直接路由器模式(也是LVS默认的模式)
-i --ip #指定LVS的工作模式为隧道模式
-p #会话保持时间,定义流量呗转到同一个realserver的会话存留时间
例:ipvsadm -a -t 192.168.1.2:80 -r 192.168.2.10:80 -m -w 1

-E -edit-service #编辑内核虚拟服务器表中的一条虚拟服务器记录。
-D -delete-service #删除内核虚拟服务器表中的一条虚拟服务器记录。
-C -clear #清除内核虚拟服务器表中的所有记录。
-R -restore #恢复虚拟服务器规则
-S -save #保存虚拟服务器规则到标准输出,输出为-R 选项可读的格式
-d -delete-server #删除一条虚拟服务器记录中的某条真实服务器记录
-L|-l –list #显示内核虚拟服务器表

--numeric, -n:#以数字形式输出地址和端口号

--stats: #统计信息
--rate : #输出速率信息

-Z –zero #虚拟服务表计数器清零(清空当前的连接数量等)

四,lvs负载均衡实战

1,环境准备:
准备 3 台纯净的虚拟机,两台 web 服务器
192.168.182.100/24 (DR)      VIP:192.168.182.10/32
192.168.182.110/24 (SR-1)   VIP:192.168.182.10/32
192.168.182.120/24 (SR-2)   VIP:192.168.182.10/32

网络拓朴

Director:  		 DIP:192.168.182.100(负载均衡IP)
				VIP:192.168.182.10/32(负载均衡虚拟IP)
											
Real Server: 	192.168.182.110  	192.168.182.120
						
Client:测试使用,不做任何配置

[root@lvs-server ~]# yum -y install ipvsadm
2,负载均衡配置虚拟IP地址
[root@lvs-server ~]# ip a a dev ens33 192.168.182.10/32 #创建VIP
[root@lvs-server ~]# ipvsadm --save > /etc/sysconfig/ipvsadm
[root@lvs-server ~]# systemctl start ipvsadm  #启动
3,清除内核虚拟服务器表中的所有记录。
[root@lvs-server ~]# ipvsadm -C
4,创建负载均衡虚拟IP也就是vip
[root@lvs-server ~]# ipvsadm -A  -t  192.168.182.10:80  -s   rr
5,为真实服务器添加虚拟vip
[root@lvs-server ~]# ipvsadm -a -t 192.168.182.10:80 -r 192.168.182.110 -g    

虚拟服务器中添加真实主机记录        第一个是负载均衡虚拟vip        真实服务器IP也就是RIP
[root@lvs-server ~]# ipvsadm -a -t 192.168.182.10:80 -r 192.168.182.120 -g     

虚拟服务器中添加真实主机记录         第一个是负载均衡虚拟vip        真实服务器IP也就是RIP
6,保存虚拟服务器规则到标准输出,输出为-R 选项可读的格式
[root@lvs-server ~]# ipvsadm -S > /etc/sysconfig/ipvsadm  #保存,保存到一个文件中
7,查看负载均衡器相关参数
[root@lvs-server ~]# ipvsadm -ln
IP Virtual Server version 1.2.1 (size=4096)
Prot LocalAddress:Port Scheduler Flags
  -> RemoteAddress:Port           Forward Weight ActiveConn InActConn
TCP  192.168.182.10:80 rr
  -> 192.168.182.110:80           Route   1      0          0         
  -> 192.168.182.120:80           Route   1      0          0       

[root@lvs-server ~]# ipvsadm -L -n --stats    #显示统计信息

[root@lvs-server ~]# ipvsadm -L -n --stats    #显示统计信息
1. Conns    (connections scheduled)  已经转发过的连接数
2. InPkts   (incoming packets)       入包个数
3. OutPkts  (outgoing packets)       出包个数
4. InBytes  (incoming bytes)         入流量(字节)  
5. OutBytes (outgoing bytes)         出流量(字节)

[root@lvs-server ~]# ipvsadm -L -n --rate	#看速率
1. CPS      (current connection rate)   每秒连接数
2. InPPS    (current in packet rate)    每秒的入包个数
3. OutPPS   (current out packet rate)   每秒的出包个数
4. InBPS    (current in byte rate)      每秒入流量(字节)
5. OutBPS   (current out byte rate)      每秒出流量(字节)

8,配置real-server端

注意:配置好网站服务器,测试所有RS#为了测试效果,提供不同的页面(以下两台real-server都操作)

1,下载nginx(两台都操作,注意网站发布内容要区别)
[root@real-server1 ~]# yum install -y nginx
[root@real-server1 ~]# echo "real-server1" >> /usr/share/nginx/html/index.html
2,两台机器都安装,按顺序添加不同的主机名以示区分
[root@real-server1 ~]# ip a  a  dev lo 192.168.182.10/32   #在lo接口上绑定VIP
3,修改内核参数,临时开启忽略arp广播
[root@real-server1 ~]# echo 1 >/proc/sys/net/ipv4/conf/all/arp_ignore  
4,临时开启路由转发,1开启,0关闭
[root@real-server1 ~]# echo 1 > /proc/sys/net/ipv4/ip_forward 
注意:#永久修改

vim   /etc/sysctl.conf   
net.ipv4.ip_forward =1 
net.ipv4.conf.all.arp_ignore=1
执行该命令sysctl  -p   让修改的参数生效
5,匹配精确ip地址回包
[root@real-server1 ~]# echo 2 > /proc/sys/net/ipv4/conf/all/arp_announce
6,启动nginx
[root@real-server1 ~]# systemctl start nginx 
[root@real-server1 ~]# systemctl enable  nginx 

7,客户端测试访问vip

[root@client ~]# elinks -dump [http://192.168.1](http://192.168.246.160)82.10
realServer的vip有了,然后就是同一个网段中拥有两个vip, 客户端在网关发送arp广播需找vip时需要让realServer不接受响应,只响应vip。
解决:
echo 1 >/proc/sys/net/ipv4/conf/eth0/arp_ignore 
arp_ignore 设置为1,意味着当别人的arp请求过来的时候,如果接收的设备没有这个ip,就不做出响应(这个ip在lo上,lo不是接收设备的进口)
echo 2 >/proc/sys/net/ipv4/conf/eth0/arp_announce  
使用最好的ip来回应,什么是最好的ip?同一个网段内子网掩码最长的
我的拓展:
添加临时IP
ifconfig ens33:0 192.168.153.123/32             
等同于ip  a a  dev  ens33  192.168.222.131/32

关闭临时IP
ifconfig ens33:0 192.168.153.123/32   down  
等同于ip  a  d  dev  ens33   192.168.222.131/32

添加永久IP
1,先添加一张网卡,然后再去创建设置网卡配置文件
2,vim  /etc/sysconfig/network-scripts/ifcfg-ens33
修改该网卡配置文件,在原有基础上添加IPADDR NETMASK GATEWAY

五,lvs的调度算法

1、静态算法
只根据算法进行调度 而不考虑后端服务器的实际连接情况和负载情况
①.RR:轮叫调度(Round Robin)
  调度器通过”轮叫”调度算法将外部请求按顺序轮流分配到集群中的真实服务器上,它均等地对待每一台服务器,而不管服务器上实际的连接数和系统负载。
ipvsadm -A -t 192.168.122.10:80 -s  rr          -A创建负载均衡虚拟VIP     -t采用tcp协议  -s算法  rr轮叫调度算法 

ipvsadm -a -t 192.168.122.10 -r 192.168.122.100 -g    -a在虚拟服务器中添加一条新的真实主机记录  -t采用tcp协议   -r真实服务器地址  -g采用LVS默认的模式是直接路由模式
②.WRR:加权轮叫(Weight RR)
  调度器通过“加权轮叫”调度算法根据真实服务器的不同处理能力来调度访问请求。这样可以保证处理能力强的服务器处理更多的访问流量。调度器可以自动问询真实服务器的负载情况,并动态地调整其权值。
ipvsadm -A -t 192.168.122.10:80 -s wrr
ipvsadm -a -t 192.168.122.10 -r 192.168.122.100 -g -w 2


```shell
2、动态算法
前端的调度器会根据后端真实服务器的实际连接情况来分配请求
①.LC:最少链接(Least Connections)
  调度器通过”最少连接”调度算法动态地将网络请求调度到已建立的链接数最少的服务器上。如果集群系统的真实服务器具有相近的系统性能,采用”最小连接”调度算法可以较好地均衡负载。
ipvsadm -A -t 192.168.122.10:80 -s lc
②.WLC:加权最少连接(默认采用的就是这种)(Weighted Least Connections)
  在集群系统中的服务器性能差异较大的情况下,调度器采用“加权最少链接”调度算法优化负载均衡性能,具有较高权值的服务器将承受较大比例的活动连接负载。调度器可以自动问询真实服务器的负载情况,并动态地调整其权值。
ipvsadm -A -t 192.168.122.10:80 -s wlc
③.NQ:永不排队/最少队列调度(Never Queue Scheduling NQ)
  无需队列。如果有台  realserver的连接数=0就直接分配过去,不需要再进行sed运算,保证不会有一个主机很空闲。

ipvsadm -A -t 192.168.122.10:80 -s  nq

面试点:LVS都有哪些调度算法 说一下各自算法的特点  如何选择(根据各自特点和具体的实际情况)

六,拓展思考

lvs默认情况下没有健康检测,当有real-server服务挂掉后,lvs不能及时判断,就可能导致用户访问失败,那么如何通过脚本的方式进行健康检测呢?

LVS服务器健康检查脚本
#!/bin/bash
vip=`ipvsadm -Ln |awk 'NR==4{print $2}'|awk -F ':' '{print $1}'`
rip_1=`ipvsadm -Ln |awk 'NR==5{print $2}'`
rip_2=`ipvsadm -Ln |awk 'NR==6{print $2}'`
ping -c 2  ${rip_1%:*} &>/dev/null
if [ $? -eq 0 ];then
        curl $rip_1
        if [ $? -eq 0 ];then
                /usr/sbin/ipvsadm  -Ln |grep $rip_1 >/dev/null
                if [ $? -eq 0 ];then
                        echo "$rip_1服务器运行正常"
                else
                        echo "$rip_1服务器记录不存在,正在添加中......"
                        sleep 10
                        /usr/sbin/ipvsadm  -a -t $vip -r $rip_1 -g
                fi
        else
                /usr/sbin/ipvsadm -d -t $vip -r $rip_1
        fi
else
        /usr/sbin/ipvsadm -d -t $vip -r $rip_1
fi

ping -c 2  ${rip_2%:*} &>/dev/null
if [ $? -eq 0 ];then
        curl $rip_2
        if [ $? -eq 0 ];then
                /usr/sbin/ipvsadm  -Ln |grep $rip_2 >/dev/null
                if [ $? -eq 0 ];then
                        echo "$rip_2服务器运行正常"
                else
                        echo "$rip_2服务器记录不存在,正在添加中......"
                        sleep 10
                        /usr/sbin/ipvsadm  -a -t $vip -r $rip_2 -g
                fi
        else
                /usr/sbin/ipvsadm -d -t $vip -r $rip_2
        fi
else
        /usr/sbin/ipvsadm -d -t $vip -r $rip_2
fi

你可能感兴趣的:(中级阶段,linux,负载均衡,运维)