keepalved是一个高可用软件,一般用来解决集群中调度器的单点出问题的,实现集群高可用。他还又个功能就是能对LVS集群中的节点进行健康状态检测,实现节点故障时移除,节点恢复时自动加入。
下面我们来实现双主模型的LVS高可用集群和双主模式的nginx高可用集群。
LVS双主模型高可用集群
这里我们使用lvs的dr模式来做调度,调度算法使用rr模式方便测试。
1.环境(网卡均为eth0):
保证集群中每台服务器的时间时相同的,用ntpdate可以同步,然后关闭selinux和iptables。
- 虚拟ip为172.16.200.200和172.16.200.222(双主模型,所以需要两个虚拟ip)
- 两台调度器ip地址分别为172.16.200.101和172.16.200.102
- 两台节点ip地址为172.16.200.103和172.16.200.104
2.配置节点服务器,设置arp响应级别和虚拟ip,将这些配置写到一个脚本中,方便管理,如下(注意,这里要实现双主模型,而且是DR模型,所以节点主机和调度器的vip要一致,而双主模型需要两个前端的虚拟IP,所以节点主机也需要配置两个VIP):
在两个节点的/root目录下,创建文件lvs.sh,然后写入脚本
[root@localhost ~]# vim lvs.sh
#!/bin/bash
vip=172.16.200.222
vip2=172.16.200.100
mask=255.255.255.255
iface="lo:0"
iface2="lo:1"
case $1 in
start)
echo 1 > /proc/sys/net/ipv4/conf/all/arp_ignore
echo 1 > /proc/sys/net/ipv4/conf/lo/arp_ignore
echo 2 > /proc/sys/net/ipv4/conf/lo/arp_announce
echo 2 > /proc/sys/net/ipv4/conf/all/arp_announce
ifconfig $iface $vip netmask $mask broadcast $vip up
ifconfig $iface2 $vip2 netmask $mask broadcast $vip2 up
route add -host $vip dev $iface
route add -host $vip2 dev $iface2
;;
stop)
ifconfig $iface down
ifconfig $iface2 down
echo 0 > /proc/sys/net/ipv4/conf/all/arp_ignore
echo 0 > /proc/sys/net/ipv4/conf/lo/arp_ignore
echo 0 > /proc/sys/net/ipv4/conf/lo/arp_announce
echo 0 > /proc/sys/net/ipv4/conf/all/arp_announce
;;
*)
echo "Usage: $(basename $0) start|stop"
;;
esac
[root@localhost ~]# bash lvs.sh start #执行脚本,加上start参数
执行完成后可以用ip a l
命令来查看两个虚拟ip有没有创建成功。
3.在两台调度器上执行如下操作:
[root@localhost ~]# yum -y install keepalived nginx #安装keepalived和nginx
[root@localhost ~]# echo "sorry form 172.16.200.101" > /usr/share/nginx/html/index.html #这里安装nginx是为了实现sorry服务器,当节点都出问题时,调度器的nginx会放回echo的内容。调度器2上echo的是 172.16.200.102,这样方便区分是由哪个调度器工作的
[root@localhost ~]# service nginx start
[root@localhost ~]# ifconfig eth0:0 172.16.200.222 netmask 255
.255.255.255 broadcast 172.16.200.222 up #在eth0上添加vip
我们可以先装个ipvsadm,手动配置lvs来测试以下,合适了再去配置keepalived
[root@localhost ~]# yum -y install ipvsadm
[root@localhost ~]# ipvsadm -A -t 172.16.200.222:80 -s rr
[root@localhost ~]# ipvsadm -a -t 172.16.200.222:80 -r 172.16.200.103 -g
[root@localhost ~]# ipvsadm -a -t 172.16.200.222:80 -r 172.16.200.104 -g
然后访问172.16.200.222就可以调度到后端的两个节点提供服务,使用for i in {1..10};do curl http://172.16.200.222;done,就会发现103和104交替出现。 ,将这个调度器的vip删除,在另一台节点上同样上述操作,验证时候需要在客户端先
arp -d 172.16.200.222`将自己的arp缓存删除,不然还是会去找之前的调度器的。
测试成功后,我们就可以去部署keepalived了:
首先,将ipvsadm手动做的lvs先清空,这样才会不影响keepalived配置,如下:
[root@localhost ~]# ifconfig eth0:0 down
[root@localhost ~]# ipvsadm -C
然后配置keepliaved:
我们先来实现lvs的dr模式,使用主备模式
[root@localhost ~]# vim /etc/keepalived/keepalived.conf
#配置文件中有很多virtual_server段,我们只保留第一个,剩下的给注释了就行
#下面分别为调度器1和调度器2的配置
调度器1的配置文件
! Configuration File for keepalived
global_defs {
notification_email {
[email protected]
}
notification_email_from [email protected]
smtp_server 127.0.0.1
smtp_connect_timeout 30
router_id node1
vrrp_mcast_group4 224.16.120.18
}
vrrp_instance VI_1 {
state MASTER
interface eth0
virtual_router_id 16
priority 100
advert_int 1
authentication {
auth_type PASS
auth_pass 1111
}
virtual_ipaddress {
172.16.200.222
}
}
virtual_server 172.16.200.222 80 {
delay_loop 6
lb_algo rr
lb_kind DR
nat_mask 255.255.0.0
protocol TCP
sorry_server 127.0.0.1 80
real_server 172.16.200.103 80 {
weight 1
HTTP_GET {
url {
path /
status_code 200
}
connect_timeout 3
nb_get_retry 3
delay_before_retry 3
}
}
real_server 172.16.200.104 80 {
weight 1
HTTP_GET {
url {
path /
status_code 200
}
connect_timeout 3
nb_get_retry 3
delay_before_retry 3
}
}
}
vrrp_instance VI_2 {
state BACKUP
interface eth0
virtual_router_id 61
priority 95
advert_int 1
authentication {
auth_type PASS
auth_pass 1111
}
virtual_ipaddress {
172.16.200.100
}
}
virtual_server 172.16.200.100 80 {
delay_loop 6
lb_algo rr
lb_kind DR
nat_mask 255.255.0.0
protocol TCP
sorry_server 127.0.0.1 80
real_server 172.16.200.103 80 {
weight 1
HTTP_GET {
url {
path /
status_code 200
}
connect_timeout 3
nb_get_retry 3
delay_before_retry 3
}
}
real_server 172.16.200.104 80 {
weight 1
HTTP_GET {
url {
path /
status_code 200
}
connect_timeout 3
nb_get_retry 3
delay_before_retry 3
}
}
}
第二台调度器配置如下
! Configuration File for keepalived
global_defs {
notification_email {
[email protected]
}
notification_email_from [email protected]
smtp_server 127.0.0.1
smtp_connect_timeout 30
router_id node2
vrrp_mcast_group4 224.16.120.18
}
vrrp_instance VI_1 {
state BACKUP
interface eth0
virtual_router_id 16
priority 95
advert_int 1
authentication {
auth_type PASS
auth_pass 1111
}
virtual_ipaddress {
172.16.200.222
}
}
virtual_server 172.16.200.222 80 {
delay_loop 6
lb_algo rr
lb_kind DR
nat_mask 255.255.0.0
protocol TCP
sorry_server 127.0.0.1 80
real_server 172.16.200.103 80 {
weight 1
HTTP_GET {
url {
path /
status_code 200
}
connect_timeout 3
nb_get_retry 3
delay_before_retry 1
}
}
real_server 172.16.200.104 80 {
weight 1
HTTP_GET {
url {
path /
status_code 200
}
connect_timeout 3
nb_get_retry 3
delay_before_retry 1
}
}
}
vrrp_instance VI_2 {
state MASTER
interface eth0
virtual_router_id 61
priority 100
advert_int 1
authentication {
auth_type PASS
auth_pass 1111
}
virtual_ipaddress {
172.16.200.100
}
}
virtual_server 172.16.200.100 80 {
delay_loop 6
lb_algo rr
lb_kind DR
nat_mask 255.255.0.0
protocol TCP
sorry_server 127.0.0.1 80
real_server 172.16.200.103 80 {
weight 1
HTTP_GET {
url {
path /
status_code 200
}
connect_timeout 3
nb_get_retry 3
delay_before_retry 1
}
}
real_server 172.16.200.104 80 {
weight 1
HTTP_GET {
url {
path /
status_code 200
}
connect_timeout 3
nb_get_retry 3
delay_before_retry 1
}
}
}
完成后在将两个调度器中的keepalived都启动(注意keepalived不能重启,有时候配置会不生效,所以如果之前已经启动了,那么关闭后在启动)
[root@localhost ~]# service keepalived start
测试:
在测试主机上修改/etc/hosts文件,添加如下内容
172.16.200.100 www.feng.com
172.16.200.222 www.feng.com
然后用一个小循环来测试:
[root@localhost named]# for i in {1..10};do curl www.feng.com ;done
返回结果为172.16.200.103和172.16.200.104交替出现,实验成功
nginx双主模型高可用集群
1.在两台调度器上,设置nginx服务配置文件,这里使用的nginx版本为1.10.2,所以配置文件可能有点细微差别
[root@localhost ~]# vim /etc/nginx/nginx.conf
在http上下文中定义组
upstream webapp {
server 172.16.200.103;
server 172.16.200.104;
}
[root@localhost ~]# vim /etc/nginx/conf.d/test.conf #注意:先将默认的default去掉,要不测试会报错
server {
listen 80 default;
server_name www.feng.com;
location / {
proxy_pass http://webapp;
}
}
[root@localhost ~]# nginx -t
[root@localhost ~]# nginx -s reload
2.在两台调度器上,修改keepalived配置文件:
先将vrrp_instance VI_1和vrrp_instance VI_2这两个上下文中的virtual_server先注释掉(virtual_server就是lvs的配置段,注释掉以防和nginx段冲突)
然后在global段之下(注意,这里一定要放在global段下面,不然不会生效,而且空格一定只是一个,这个对格式的要求很严格的,一个不慎就不能实现了)定义nginx检测功能,这段的意思就是当检测到nginx服务不存在时,就将这个调度器的权重减去10,注意减去的权重不能小于主和备的差,不然减去之后主调度器的权重还是表备用的高,如下:
vrrp_script chk_nginx {
script "killall -0 nginx"
interval 2
weight -10
fall 2
rise 2
}
然后在两个vrrp_instance中,都调用nginx检测功能:
在vrrp_instance VI_1和2中都加入这段内容
track_script {
chk_nginx
}
然后关闭keepalived,再启动,还是用之前的测试主机,使用for i in {1..10};do curl www.feng.com;done
来测试,两个ip交替出现证明实验成功