keepalived通过VRRP(Virtual Router Redundancy Protocl)来实现高可用。
在这个协议里会将多台功能相同的路由器组成一个小组,这个小组里会有1个master角色和N(N>=1)个backup角色。
master会通过组播的形式向各个backup发送VRRP协议的数据包,当backup收不到master发来的VRRP数据包时,就会认为master宕机了。此时就需要根据各个backup的优先级来决定谁成为新的mater。
keepalived要有三个模块,分别是core、check和vrrp。其中core模块为keepalived的核心,负责主进程的启动、维护以及全局配置文件的加载和解析,check模块负责健康检查,vrrp模块是来实现VRRP协议的。
关掉防火墙,关掉seliunx
vrrp_script chk_nginx {
script "/usr/local/sbin/check_ng.sh" #自定义脚本,该脚本为监控Nginx服务的脚本
interval 3 #检测脚本,检测时间3s一次
}
vrrp_instance VI_1
state MASTER
interface ens33 #写自己的网卡
virtual_router_id 52 #主备路由IP必须一致
priority 100 #权重决定谁是master谁是backup
advert_int 1
authentication {
auth_type PASS
auth_pass yyit
}
virtual_ipaddress {
10.255.2.110 #定义VIP
}
track_script {
chk_nginx #定义监控chk_nginx
}
}
特别强调:同一集群的keepalived的主备机的virtual_router_id 必须相同,但是同一内网中不应有相同的virtual_router_id 集群
#vim /usr/local/sbin/check_ng.sh //增加脚本,添加以下内容
#!/bin/bash
#时间变量,用于记录日志
d=`date +%Y%m%d_%H:%M:%S`
#计算nginx进程数量
n=`ps -C nginx --no-heading|wc -l`
#如果进程为0,则启动nginx,并且再次检测nginx进程数量,
#如果进程还为0,说明nginx无法启动,此时需要关闭keepalived
if [ $n -eq "0" ]; then
systemctl start nginx
n2=`ps -C nginx --no-heading|wc -l`
if [ $n2 -eq "0" ]; then
echo "$d nginx down,keepalived will stop" >> /var/log/check_ng.log
systemctl stop keepalived
fi
fi
#chmod 755 /usr/local/sbin/check_ng.sh
#systemctl start keepalived
#systemctl start nginx
#ps aux | grep keep
#ps aux | grep nginx
#ip add
看到VIP表示master配置完成
关掉防火墙,关掉seliunx
修改keepalived配置
vim /etc/keepalived/keepalived.conf //添加以下内容,内容与master基本一直,state和priority有变化
! Configuration File for keepalived
vrrp_script chk_nginx {
script "/usr/local/sbin/check_ng.sh" #自定义脚本,该脚本为监控Nginx服务的脚本
interval 3 #检测脚本,检测时间3s一次
}
vrrp_instance VI_1 {
state BACKUP
interface ens33 #注意网卡
virtual_router_id 52 #注意和主机一致
priority 90 #注意权重
advert_int 1
authentication {
auth_type PASS
auth_pass yyit
}
virtual_ipaddress {
10.255.2.110 # 定义VIP
}
track_script {
chk_nginx #定义监控chk_nginx
}
}
#vim /usr/local/sbin/check_ng.sh //添加以下内容
#!/bin/bash
#时间变量,用于记录日志
d=`date +%Y%m%d_%H:%M:%S`
#计算nginx进程数量
n=`ps -C nginx --no-heading|wc -l`
#如果进程为0,则启动nginx,并且再次检测nginx进程数量,
#如果还为0,说明nginx无法启动,此时需要关闭keepalived
if [ $n -eq "0" ]; then
systemctl start nginx
n2=`ps -C nginx --no-heading|wc -l`
if [ $n2 -eq "0" ]; then
echo "$d nginx down,keepalived will stop" >> /var/log/check_ng.log
systemctl stop keepalived
fi
fi
#chmod 755 /usr/local/sbin/check_ng.sh
#systemctl start keepalived
#systemctl start nginx
测试
为了更直观的表现主备机访问
ng1:
echo “web 10.255.2.97” > /usr/share/nginx/html/index.html
ng2:
echo “web 10.255.2.98” > /usr/share/nginx/html/index.html
#curl -I 192.168.146.100
Master正常情况下的访问
Curl 10.255.2.110 返回 web 10.255.2.97
Master出现问题下的访问
Curl 10.255.2.110 返回 web 10.255.2.98
最后再简单的总结一下流程:
当客户端发起请求到keepalived获取VIP,读取keepalived配置文件中的priority决定优先访问,最终访问到web服务。主备机之间keepalive相互通信,一旦主机挂掉,备机即刻成为新的master,通过keepalived实现web服务的高可用。
配置过程中注意的是:
同一集群的keepalived的主备机的virtual_router_id 必须相同,但是同一内网中不应有相同的virtual_router_id 集群!
在keepalived的配置文件中定义一个监控nignx脚本,第一次检测当前nginx没有进程时,启动nginx。第二次检测nginx没有启动时,则关闭当前的keepalived,启动备机顶上完成访问web的请求。
本次环境搭建仅实现了keepalived的高可用,并未实现负载均衡。
以上为个人学习心得,如果错误欢迎指正。