Cluster,集群、群集,由多台主机构成,但对外,只表现为一个整体,只提供一个访问入口(域名或 IP),相当于一台大型计算机
存在问题
互联网应用中,随着站点对硬件性能、响应速度、服务稳定性、数据可靠性等要求越来越高,单台服务器无法满足负载均衡及高可用的需求
解决方法
通过整合多台服务器,使用 LVS 来达到服务器高可用和负载均衡,并于同一个 IP 地址对外提供相同服务。
在企业中常用的一种群集技术——LVS(Linux Virtual Server ,Linux 虚拟服务器)
根据集群针对的目标差异,可分为三种
负载均衡群集(Load Balance Cluster)
提高应用系统的响应能力、尽可能处理更多的访问请求、减少延迟为目标,获得高并发、高负载(LB)的整体性能。
LB 的负载分配依赖于主节点的分流算法,将来自客户机的访问请求分担给多个服务器节点,从而缓解整个系统的负载。
例如:“ DNS 轮询”“反向代理”等
高可用群集(High Availability Cluster)
提高应用系统的可靠性、尽可能地减少中断时间为目标,确保服务的连续性,达到高可用(HA) 的容错效果。
HA的工作方式包括双工和主从两种模式,双工即所有节点同时在线;主从则只有主节点在线,但当出现故障时从节点能自动切换为主节点。
例如:“故障切换”、“双机热备” 等。
高性能群集(High Performance Computer Cluster)
以提高应用系统的 CPU 运算速度、扩展硬件资源和分析能力为目标,获得相当于大型、超级计算机的高性能运算(HPC)能力。
高性能依赖于"分布式运算”、“并行计算” , 通过专用硬件和软件将多个服务器的 CPU、内存等资源整合在一起,实现只有大型、超级计算机才具备的计算能力。
例如:“云计算”、“网格计算”等。
第一层,负载调度器(Load Balancer或Director)
访问整个群集系统的唯一入口, 对外使用所有服务器共有的 VIP 地址,也称为群集 IP 地址。通常会配置主、备两台调度器实现热备份,当主调度器失效以后能够平滑替换至备用调度器,确保高可用性。
第二层,服务器池(Server Pool)
群集所提供的应用服务、由服务器池承担,其中每个节点具有独立的 RIP 地址(真实 IP ),只处理调度器分发过来的客户机请求。当某个节点暂时失效时,负载调度器的容错机制会将其隔离,等待错误排除以后再重新纳入服务器池。
第三层,共享存储(Share Storage)
为服务器池中的所有节点提供稳定、一致的文件存取服务, 确保整个群集的统一性共享存储可以使用 NAS 设备,或者提供 NFS 共享服务的专用服务器。
负载均衡群集是目前企业用得最多的群集类型,群集的负载调度技术有3种工作模式:
Linux Virtual Server,针对 Linux 内核开发的负载均衡解决方案,1998 年 5 月,由我国的章文嵩博士创建,官方网站: http://www.linuxvirtualserver.orgl
LVS 实际上相当于基于 IP 地址的虚拟化应用, 为基于 IP 地址和内容请求分发的负载均衡提出了一种高效的解决方法
LVS 现在已成为 Linux 内核的一部分,默认编译为 ip_vs 模块,必要时能够自动调用。在 CentOS 7 系统中,以下操作可以手动加载 ip_vs 模块,并查看当前系统中 ip_vs 模块的版本信息。
modprobe ip_vs #加载ip_vs
cat /proc/net/ip_vs #确认内核对LVS的支持
cd /usr/lib/modules/3.10.0-693.el7.x86_64/kernel/net/netfilter/ipvs/ #ip_vs调度算法的模块
将收到的访问请求按照顺序轮流分配给群集中的各节点(真实服务器) ,均等地对待每一台服务器 ,而不管服务器实际的连接数和系统负载
根据调度器设置的权重值来分发请求,权重值高的节点优先获得任务,分配的请求数越多,保证性能强的服务器承担更多的访问流量
根据真实服务器已建立的连接数进行分配,将收到的访问请求优先分配给连接数最少的节点
在服务器节点的性能差异较大时,可以为真实服务器自动调整权重,性能较高的节点将承担更大比例的活动连接负载
选项 | 功能 |
---|---|
-A | 添加虚拟服务器 |
-D | 删除整个虚拟服务器 |
-s | 指定负载调度算法(轮询:rr、加权轮询:wrr、最少连接:lc、加权最少连接:wlc) |
-a | 表示添加真实服务器(节点服务器) |
-d | 删除某一个节点 |
-t | 指定 VIP 地址及 TCP 端口 |
-r | 指定 RIP 地址及 TCP 端口 |
-m | 表示使用 NAT 群集模式 |
-g | 表示使用 DR 模式 |
-i | 表示使用 TUN 模式 |
-w | 设置权重(权重为 0 时表示暂停节点) |
-p 60 | 表示保持长连接 60 秒 |
-l | 列表查看 LVS 虚拟服务器(默认为查看所有) |
-n | 以数字形式显示地址、端口等信息,常与“-l”选项组合使用。ipvsadm -ln |
Network File System,网络文件系统
使用 NFS 发布共享资源
在客户机中访问 NFS 共享资源
LVS调度器作为Web 服务器池的网关,LVS具有两块网卡,分别连接内外网,使用轮询(rr)调度算法
环境配置
主机 | 操作系统 | IP地址 | 工具/软件/安装包 |
---|---|---|---|
负载均衡器 | CentOS7 | 内网:192.168.16.16、外网:12.0.0.254 | ipvsadm |
NFS服务器 | CentOS7 | 192.168.16.18 | rpcbind、nfs-utils |
Web节点服务器1 | CentOS7 | 192.168.16.20 | rpcbind、nfs-utils、httpd |
Web节点服务器2 | CentOS7 | 192.168.16.22 | rpcbind、nfs-utils、httpd |
客户端 | Windows7 | 12.0.0.200 | —— |
systemctl stop firewalld
systemctl disable firewalld
setenforce 0
yum -y install nfs-utils rpcbind
mkdir /opt/kgc
mkdir /opt/roro
chmod 777 /opt/kgc
chmod 777 /opt/roro
vim /etc/exports
/opt/kgc 192.168.16.0/24(rw,sync,no_root_squash)
/opt/roro 192.168.16.0/24(rw,sync,no_root_squash)
systemctl start rpcbind
systemctl start nfs
systemctl enable nfs
systemctl enable rpcbind
exportfs -rv #发布共享
Web-1 配置节点服务器192.168.16.20
systemctl stop firewalld
systemctl disable firewalld
setenforce 0
yum install httpd -y
yum -y install nfs-utils rpcbind
showmount -e 192.168.16.18
mount 192.168.16.18:/opt/kgc /var/www/html
echo 'this is kgc web!' > /var/www/html/index.html
systemctl start httpd
systemctl enable httpd
systemctl stop firewalld
systemctl disable firewalld
setenforce 0
yum install epel-release -y
yum install -y nginx
showmount -e 192.168.16.18
mount 192.168.16.18:/opt/roro /usr/share/nginx/html/
echo 'this is roro web!' > /usr/share/nginx/html/index.html
systemctl start nginx
systemctl enable nginx
cd /etc/sysconfig/network-scripts/
cp ifcfg-ens33 ifcfg-ens37
vim ifcfg-ens33
vim ifcfg-ens37
systemctl restart network
systemctl stop firewalld.service
systemctl disable firewalld.service
setenforce 0
vim /etc/sysctl.conf
net.ipv4.ip_forward = 1 #开启IP转发功能
或
echo '1' > /proc/sys/net/ipv4/ip_forward
sysctl -p #加载
iptables -nL #查看规则
iptables -t nat -F
iptables -F #清空规则
iptables -t nat -A POSTROUTING -s 192.168.16.0/24 -o ens37 -j SNAT --to-source 12.0.0.254 #添加规则,-t:指定表名 -A:指定链 -s:源IP -o:出口网卡 -j:控制类型
-to:转换为12.0.0.254
iptables -nL -t nat #查看规则
modprobe ip_vs #加载 ip_vs模块
cat /proc/net/ip_vs #查看 ip_vs版本信息
for i in $(ls /usr/lib/modules/$(uname -r)/kernel/net/netfilter/ipvs|grep -o "^[^.]*");do echo $i; /sbin/modinfo -F filename $i >/dev/null 2>&1 && /sbin/modprobe $i;done
yum -y install ipvsadm
#启动服务前须保存负载分配策略
ipvsadm-save > /etc/sysconfig/ipvsadm
或
ipvsadm --save > /etc/sysconfig/ipvsadm
systemctl start ipvsadm
systemctl enable ipvsadm
ipvsadm -C #清除原有策略
#-A添加虚拟服务器 -t:VIP,虚拟ip所用外网网卡 -s:算法 rr:轮询
ipvsadm -A -t 12.0.0.254:80 -s rr [-p 10]
ipvsadm -a -t 12.0.0.254:80 -r 192.168.16.20:80 -m [-w 1]
ipvsadm -a -t 12.0.0.254:80 -r 192.168.16.22:80 -m [-w 1]
ipvsadm #启用策略
ipvsadm -ln #查看节点状态,Masq 代表 NAT 模式
ipvsadm-save > /etc/sysconfig/ipvsadm #保存策略(永久保存)
在两台节点服务器上修改ens33的网关为192.168.16.16
systemctl restart network
开启 ifdown ens33 ; ifup ens33
在一台 IP 为 12.0.0.200 的客户机使用浏览器访问 http://12.0.0.254/ ,不断刷新浏览器测试负载均衡效果,刷新间隔需长点。
1.群集分类
负载均衡群集:提高高并发量的处理能力,减少延迟
高可用群集:提高可靠性,减少中断时间
高性能运算群集:提高应用系统的CPU运算速度、扩展硬件资源和分析能力
2.LVS 群集的负载调度技术有3种工作模式
DR 最好,因为 Nat 模式负载调度器即作为客户机的访问入口,也是各节点回应客户机的访问出口,调度器承载着两个方向的负载压力,所以负载调度器的性能会成为整个集群瓶颈;DR 模式调度器会接收用户的访问请求并且转发给节点服务器,节点服务器处理完直接回复给客户端,不会经过调度器,所以负载调度器的性能不会成为整个集群瓶颈。
3.Nat 和 DR 的区别
NAT的负载均衡器会作为用户的访问请求入口,也会作为节点服务器响应请求的出口,负载均衡器的服务器性能将会成为整个集群系统的瓶颈
DR模式用户的访问请求会经过负载均衡器的转发到节点服务器,但是节点服务器的请求响应报文是直接返回给客户端的不会经过负载均衡器
4.LVS(四层代理)
(1)NAT模式时负载均衡器是作为网关服务器,至少两张网卡
(2)开启 ip 转发功能
vim /etc/sysct1.conf
net.ipv4.ip forward=1,如果需要节点服务器访问外网需要配置SNAT
(3)加载ipvs模块
modprobe ip_vs
(4)下载ipvsadm工具-A -a -t -r -s -m -D -d -ln
面试
1.简述 LVS 三种工作模式,简述他们的区别?
答案:
NAT:通过网络地址转换实现的虚拟服务器,在并发访问时,调度器的性能成为瓶颈
DR:使用路由技术实现虚拟服务器,节点服务器需要配置 VIP,注意 MAC 地址广播
TUN:通过隧道方式实现虚拟服务器。
2.列举你知道的LVS调度算法?
答案:
轮询(Round Robin);
加权轮询(Weighted Round Robin);
最少连接(Least Connections);
加权最少连接(Weighted Least Connections);
源地址哈希值(source hash)
3.LVS调度器常见算法(均衡策略)?
LVS 调度器用的调度方法基本分为两类:固定调度算法:rr,wrr,dh,sh
rr:轮询算法,将请求依次分配给不同的 rs 节点,即 RS 节点中均摊分配。适合于 RS 所有节点处理性能接近的情况。
wrr:加权轮询调度,依据不问 RS 的权值分配任务。权值较高的 RS 将优先获得任务,并且分配到的连接数将比权值低的 RS 更多。相同权值的 RS 得到相同数目的连接数。
dh:目的地址哈希调度(destination hashing)以目的地址为关键字查找一个静态 hash 表来获得所需RS。
sh:源地址哈希调度(source hashing)以源地址为关键字查找一个静态hash表来获得需要的 RS。
动态调度算法:wlc,lc,lblc
wlc:加权最小连接数调度,假设各台 RS 的权值依次为 Wi,当前 tcp 连接数依次为 Ti,依次去 Ti/Wi 为最小的 RS 作为下一个分配的 RS。
lc:最小连接数调度(least-connection),IPVS 表存储了所有活动的连接。LB 会比较将连接请求发送到当前连接最少的 RS。
lblc:基于地址的最小连接数调度(locality-based least-connection):将来自同一个目的地址的请求分配给同一台 RS,此时这台服务器是尚未满负荷的。否则就将这个请求分配给连接数最小的 RS,并以它作为下一次分配的首先考虑。