2019-09-26 高可用

1.什么是高可用,为什么要设计高可用?

两台机器启动着相同的业务系统,当有一台机器宕机,另外一台服务器能快速的接管,对于访问的用户是无感知的。减少系统不能提供服务的时间。

2019-09-26 高可用_第1张图片
image.png

2.高可用使用什么工具来实现? 是硬件还是软件?

软件: keepalived

3.keepalived如何实现高可用?

通过vrrp协议实现, 虚拟路由冗余协议.

4.keepalived高可用安装与配置?

10.0.0.5
10.0.0.6

1.安装

yum install keepalived -y

2.配置 ( master backup )

[root@lb01 ~]# cat /etc/keepalived/keepalived.conf 
global_defs {     
    router_id lb01   
}

vrrp_instance VI_1 {
    state MASTER
    interface eth0
    virtual_router_id 50
    priority 150
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass 1111
}
    virtual_ipaddress {
        10.0.0.3
    }
}

[root@lb02 ~]# cat /etc/keepalived/keepalived.conf global_defs {
    router_id lb02
}

vrrp_instance VI_1 {
    state BACKUP
    interface eth0
    virtual_router_id 50
    priority 100
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass 1111
    }
    virtual_ipaddress {
        10.0.0.3
    }
}

3.启动

[root@lb01 ~]# systemctl start keepalived
[root@lb01 ~]# systemctl enable keepalived

4.验证

[root@lb01 ~]# ip addr|grep 10.0.0.3

5.keepalived高可用地址漂移测试?

1.抓包看看

2019-09-26 高可用_第2张图片
image.png

2.10.0.0.3 发送 组播数据包

2019-09-26 高可用_第3张图片
image.png

3.抓包查看arp缓存表 arp -a

2019-09-26 高可用_第4张图片
image.png

2019-09-26 高可用_第5张图片
image.png

6.keepalived高可用抢占式与非抢占式

1.master故障--->backup顶上--->master恢复--->backup               抢占式    默认   
抢占:   硬件配置不一
2.master故障--->backup顶上--->master恢复--->backup继续工作        非抢占式
非抢占: 硬件配置一致,业务不允许多次切换

1、两个节点的state都必须配置为BACKUP(官方建议)
2、两个节点都在vrrp_instance中添加nopreempt参数
3、其中一个节点的优先级必须要高于另外一个节点的优先级。两台服务器都角色状态启用nopreempt后,必须修改角色状态统一为BACKUP,唯一的区分就是优先级。

7.keepalived高可用与Nginx集成

地址漂移实现高可用
nginx和keeplaived没有关系
nginx需要借助keeplaived  VIP  地址漂移实现高可用.

8.如果Nginx宕机

会导致用户请求失败, 但Keepalived并不会进行切换, 所以需要编写一个脚本检测Nginx的存活状态, 如果不存活则kill nginx和keepalived

1.判断nginx进程是否存在                  ps aux|grep nginx|grep -v grep
2.判断nginx的端口是否存在                netstat -lntp|grep :80|wc -l
3.通过curl来模拟访问,判断访问结果是否ok   curl -H Host:url.oldxu.com http://10.0.0.3

1.编写脚本

[root@lb01 ~]# mkdir /scripts
[root@lb01 ~]# vim /scripts/check_web.sh
#!/usr/bin/bash
    nginx_port=$(netstat -lntp|grep :80|wc -l)
    if [ $nginx_port -ne 1 ];then
        systemctl start nginx &>/dev/null
        rc=$?
        sleep 3
        if [ $rc -ne 0 ];then
            systemctl stop  keepalived 
        fi
    fi
[root@lb01 ~]# chmod +x /scripts/check_web.sh 

2.keeplaived调用该脚本

[root@lb01 ~]# cat /etc/keepalived/keepalived.conf 
    global_defs {     
        router_id lb01   
    }
    #定义脚本名称,以及脚本所在的路径
    vrrp_script check_web {
       script "/scripts/check_web.sh"
       interval 5
    }
    vrrp_instance VI_1 {
        state MASTER
        #nopreempt
        interface eth0
        virtual_router_id 50
        priority 150
        advert_int 1
        authentication {
            auth_type PASS
            auth_pass 1111
    }
        virtual_ipaddress {
            10.0.0.3
        }
        #调用脚本名称
        track_script {
            check_web
        }
    }

3.模拟nginx停止,检查nginx是否会被拉起
4.模拟nginx故障,检查keeplaived的VIP是否会漂移至备节点

9.keepalived高可用脑裂与故障解决?

脑裂(split-brain),指在一个高可用(HA)系统中,当联系着的两个节点断开联系时,本来为一个整体的系统,分裂为两个独立节点,这时两个节点开始争抢共享资源,结果会导致系统混乱,数据损坏。
对于无状态服务的HA,无所谓脑裂不脑裂;
但对有状态服务(比如MySQL)的HA,必须要严格防止脑裂。(但有些生产环境下的系统按照无状态服务HA的那一套去配置有状态服务,结果可想而知...)

master  10.0.0.3
backup  10.0.0.3

1.在备上编写检测脚本, 测试如果能ping通主并且备节点还有VIP的话则认为产生了脑列

[root@lb02 conf.d]# cat /scripts/check_spilt.sh 
vip=10.0.0.3
master_ip=10.0.0.5
ping -c2 $master_ip &>/dev/null
if [ $? -eq 0 ];then
    ip_check=$(ip addr | grep "$vip" | wc -l)
    if [ $ip_check -eq 1 ];then
        echo "脑列"
        systemctl stop keepalived
    fi
fi

[root@lb02 conf.d]# cat /etc/keepalived/keepalived.conf 
global_defs {
    router_id lb02
}

vrrp_script check_spilt {
   script "/scripts/check_spilt.sh"
   interval 3
}
vrrp_instance VI_1 {
    state BACKUP
    nopreempt
    interface eth0
    virtual_router_id 50
    priority 100
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass 1111
    }
    virtual_ipaddress {
        10.0.0.3
    }
    track_script {
    check_spilt
    }
}

keeplaived使用:
1.不能在公有云上使用
2.公有云要想实现负载均衡高可用-----> 购买的SLB 自带高可用
3.虚拟IP咋使--->真实的硬件环境

2019-09-26 高可用_第6张图片
image.png

你可能感兴趣的:(2019-09-26 高可用)