keepalived

keepalved是一个高可用软件,一般用来解决集群中调度器的单点出问题的,实现集群高可用。他还又个功能就是能对LVS集群中的节点进行健康状态检测,实现节点故障时移除,节点恢复时自动加入。
下面我们来实现双主模型的LVS高可用集群和双主模式的nginx高可用集群。

LVS双主模型高可用集群

这里我们使用lvs的dr模式来做调度,调度算法使用rr模式方便测试。
1.环境(网卡均为eth0):
保证集群中每台服务器的时间时相同的,用ntpdate可以同步,然后关闭selinux和iptables。

  • 虚拟ip为172.16.200.200和172.16.200.222(双主模型,所以需要两个虚拟ip)
  • 两台调度器ip地址分别为172.16.200.101和172.16.200.102
  • 两台节点ip地址为172.16.200.103和172.16.200.104
    2.配置节点服务器,设置arp响应级别和虚拟ip,将这些配置写到一个脚本中,方便管理,如下(注意,这里要实现双主模型,而且是DR模型,所以节点主机和调度器的vip要一致,而双主模型需要两个前端的虚拟IP,所以节点主机也需要配置两个VIP):
    在两个节点的/root目录下,创建文件lvs.sh,然后写入脚本
[root@localhost ~]# vim lvs.sh
#!/bin/bash
vip=172.16.200.222
vip2=172.16.200.100
mask=255.255.255.255
iface="lo:0"
iface2="lo:1"
case $1 in 
start)
    echo 1 > /proc/sys/net/ipv4/conf/all/arp_ignore
    echo 1 > /proc/sys/net/ipv4/conf/lo/arp_ignore
    echo 2 > /proc/sys/net/ipv4/conf/lo/arp_announce
    echo 2 > /proc/sys/net/ipv4/conf/all/arp_announce
    
    ifconfig $iface $vip netmask $mask broadcast $vip up
    ifconfig $iface2 $vip2 netmask $mask broadcast $vip2 up
    route add -host $vip dev $iface 
    route add -host $vip2 dev $iface2 
    ;;
stop)
    ifconfig $iface down
    ifconfig $iface2 down
    echo 0 > /proc/sys/net/ipv4/conf/all/arp_ignore
    echo 0 > /proc/sys/net/ipv4/conf/lo/arp_ignore
    echo 0 > /proc/sys/net/ipv4/conf/lo/arp_announce
    echo 0 > /proc/sys/net/ipv4/conf/all/arp_announce
    ;;
*)
    echo "Usage: $(basename $0) start|stop"
    ;;
esac

[root@localhost ~]# bash lvs.sh start    #执行脚本,加上start参数

执行完成后可以用ip a l命令来查看两个虚拟ip有没有创建成功。
3.在两台调度器上执行如下操作:

[root@localhost ~]# yum -y install keepalived nginx    #安装keepalived和nginx
[root@localhost ~]#  echo "sorry form 172.16.200.101" > /usr/share/nginx/html/index.html    #这里安装nginx是为了实现sorry服务器,当节点都出问题时,调度器的nginx会放回echo的内容。调度器2上echo的是 172.16.200.102,这样方便区分是由哪个调度器工作的
[root@localhost ~]# service nginx start
[root@localhost ~]# ifconfig eth0:0 172.16.200.222 netmask 255
.255.255.255 broadcast 172.16.200.222 up    #在eth0上添加vip

我们可以先装个ipvsadm,手动配置lvs来测试以下,合适了再去配置keepalived

[root@localhost ~]# yum -y install ipvsadm
[root@localhost ~]# ipvsadm -A -t 172.16.200.222:80 -s rr
[root@localhost ~]# ipvsadm -a -t 172.16.200.222:80 -r 172.16.200.103 -g
[root@localhost ~]# ipvsadm -a -t 172.16.200.222:80 -r 172.16.200.104 -g

然后访问172.16.200.222就可以调度到后端的两个节点提供服务,使用for i in {1..10};do curl http://172.16.200.222;done,就会发现103和104交替出现。 ,将这个调度器的vip删除,在另一台节点上同样上述操作,验证时候需要在客户端先arp -d 172.16.200.222`将自己的arp缓存删除,不然还是会去找之前的调度器的。
测试成功后,我们就可以去部署keepalived了:
首先,将ipvsadm手动做的lvs先清空,这样才会不影响keepalived配置,如下:

[root@localhost ~]# ifconfig eth0:0 down
[root@localhost ~]# ipvsadm -C

然后配置keepliaved:
我们先来实现lvs的dr模式,使用主备模式

[root@localhost ~]# vim /etc/keepalived/keepalived.conf
#配置文件中有很多virtual_server段,我们只保留第一个,剩下的给注释了就行
#下面分别为调度器1和调度器2的配置

调度器1的配置文件

! Configuration File for keepalived

global_defs {
   notification_email {
    [email protected]
   }
   notification_email_from [email protected]
   smtp_server 127.0.0.1
   smtp_connect_timeout 30
   router_id node1
   vrrp_mcast_group4 224.16.120.18
}

vrrp_instance VI_1 {
    state MASTER
    interface eth0
    virtual_router_id 16
    priority 100
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass 1111
    }
    virtual_ipaddress {
        172.16.200.222
    }
}

virtual_server 172.16.200.222 80 {
    delay_loop 6
    lb_algo rr
    lb_kind DR
    nat_mask 255.255.0.0
    protocol TCP
    sorry_server 127.0.0.1 80
    real_server 172.16.200.103 80 {
        weight 1
        HTTP_GET {
            url {
              path /
        status_code 200
            }
            connect_timeout 3
            nb_get_retry 3
            delay_before_retry 3
        }
    }
    real_server 172.16.200.104 80 {
            weight 1
        HTTP_GET {
            url {
              path /
        status_code 200
            }
            connect_timeout 3
            nb_get_retry 3
            delay_before_retry 3
        }
    }
}
vrrp_instance VI_2 {
    state BACKUP
    interface eth0
    virtual_router_id 61
    priority 95
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass 1111
    }
    virtual_ipaddress {
        172.16.200.100
    }
}

virtual_server 172.16.200.100 80 {
    delay_loop 6
    lb_algo rr
    lb_kind DR
    nat_mask 255.255.0.0
    protocol TCP
    sorry_server 127.0.0.1 80
    real_server 172.16.200.103 80 {
        weight 1
        HTTP_GET {
            url {
              path /
        status_code 200
            }
            connect_timeout 3
            nb_get_retry 3
            delay_before_retry 3
        }
    }
    real_server 172.16.200.104 80 {
            weight 1
        HTTP_GET {
            url {
              path /
        status_code 200
            }
            connect_timeout 3
            nb_get_retry 3
            delay_before_retry 3
        }
    }
}




第二台调度器配置如下
! Configuration File for keepalived

global_defs {
   notification_email {
    [email protected]
   }
   notification_email_from [email protected]
   smtp_server 127.0.0.1
   smtp_connect_timeout 30
   router_id node2
   vrrp_mcast_group4 224.16.120.18
}

vrrp_instance VI_1 {
    state BACKUP
    interface eth0
    virtual_router_id 16
    priority 95
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass 1111
    }
    virtual_ipaddress {
        172.16.200.222
    }
}

virtual_server 172.16.200.222 80 {
    delay_loop 6
    lb_algo rr
    lb_kind DR
    nat_mask 255.255.0.0
    protocol TCP
    sorry_server 127.0.0.1 80
    real_server 172.16.200.103 80 {
        weight 1
        HTTP_GET {
            url {
              path /
        status_code 200
            }
            connect_timeout 3
            nb_get_retry 3
            delay_before_retry 1
        }
     }
    real_server 172.16.200.104 80 {
        weight 1
        HTTP_GET {
            url {
              path /
        status_code 200
            }
            connect_timeout 3
            nb_get_retry 3
            delay_before_retry 1
        }
    }
}
vrrp_instance VI_2 {
    state MASTER
    interface eth0
    virtual_router_id 61
    priority 100
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass 1111
    }
    virtual_ipaddress {
        172.16.200.100
    }
}

virtual_server 172.16.200.100 80 {
    delay_loop 6
    lb_algo rr
    lb_kind DR
    nat_mask 255.255.0.0
    protocol TCP
    sorry_server 127.0.0.1 80
    real_server 172.16.200.103 80 {
        weight 1
        HTTP_GET {
            url {
              path /
        status_code 200
            }
            connect_timeout 3
            nb_get_retry 3
            delay_before_retry 1
        }
     }
    real_server 172.16.200.104 80 {
        weight 1
        HTTP_GET {
            url {
              path /
        status_code 200
            }
            connect_timeout 3
            nb_get_retry 3
            delay_before_retry 1
        }
    }
}

完成后在将两个调度器中的keepalived都启动(注意keepalived不能重启,有时候配置会不生效,所以如果之前已经启动了,那么关闭后在启动)

[root@localhost ~]# service keepalived start

测试:
在测试主机上修改/etc/hosts文件,添加如下内容

172.16.200.100 www.feng.com
172.16.200.222 www.feng.com

然后用一个小循环来测试:

[root@localhost named]# for i in {1..10};do curl www.feng.com ;done

返回结果为172.16.200.103和172.16.200.104交替出现,实验成功

nginx双主模型高可用集群

1.在两台调度器上,设置nginx服务配置文件,这里使用的nginx版本为1.10.2,所以配置文件可能有点细微差别

[root@localhost ~]# vim /etc/nginx/nginx.conf
在http上下文中定义组
 upstream webapp {
        server 172.16.200.103;
        server 172.16.200.104;
}
[root@localhost ~]# vim /etc/nginx/conf.d/test.conf    #注意:先将默认的default去掉,要不测试会报错
server {
        listen 80 default;
        server_name www.feng.com;
        location / {
                proxy_pass http://webapp;
        }
}
[root@localhost ~]# nginx -t
[root@localhost ~]# nginx -s reload

2.在两台调度器上,修改keepalived配置文件:
先将vrrp_instance VI_1和vrrp_instance VI_2这两个上下文中的virtual_server先注释掉(virtual_server就是lvs的配置段,注释掉以防和nginx段冲突)
然后在global段之下(注意,这里一定要放在global段下面,不然不会生效,而且空格一定只是一个,这个对格式的要求很严格的,一个不慎就不能实现了)定义nginx检测功能,这段的意思就是当检测到nginx服务不存在时,就将这个调度器的权重减去10,注意减去的权重不能小于主和备的差,不然减去之后主调度器的权重还是表备用的高,如下:

vrrp_script chk_nginx {
        script "killall -0 nginx"
        interval 2
        weight -10
        fall 2
        rise 2
       }

然后在两个vrrp_instance中,都调用nginx检测功能:
在vrrp_instance VI_1和2中都加入这段内容

 track_script {
        chk_nginx
        }

然后关闭keepalived,再启动,还是用之前的测试主机,使用for i in {1..10};do curl www.feng.com;done来测试,两个ip交替出现证明实验成功

你可能感兴趣的:(keepalived)