使用keepalived搭建高可用服务

1. 理论篇

1.1 Keepalived 与 VRRP

如果网络中只部署一个路由器,那么这个路由器坏了,整个网络就会瘫痪。因此,在高可用设计下,一般都会部署一对路由器,一主一备。当主路由器坏了之后,就启用备用路由器。

虚拟路由冗余协议(Virtual Router Redundancy Protocol,简称VRRP)就是为以上情景设计的,它是由IETF提出的解决局域网中配置静态网关出现单点失效现象的路由协议。其原理如下:

  • 设定一个虚拟IP(Virtual IP Address,VIP)
  • 多个冗余设备(服务器、路由器等)在选举阶段确定谁将最终获得这个虚拟IP
  • 在同一时刻只允许一个设备拥有该虚拟IP
  • VRRP检测到主设备发生故障时,迅速将虚拟IPpiao'yi到备用设备

服务器高可用问题也可以用相同的方法解决,Keepalived就是这样一款产品,它同时实现了该协议的第二版和第三版。除此之外,Keepalived还基于IPVS(Linux IP Virtual Server)实现了负载均衡功能。

1.2 VRRP工作流程

  1. 给每个VRRP的服务器设置一个权重
  2. 权重最高的服务器将获得虚拟IP
  3. 确定主机以后,主机将定期给备机发送心跳消息
  4. 一旦主机出现故障,最高权重的备机将获得虚拟IP继续提供服务
  5. 如果运行在抢占模式,一旦有更高权重的服务器加入,就会自动获得虚拟IP,成为主机

注意:

  • 协议规定主服务器权重为255,其他备机权重小于255。实际应用中,只要保证主服务器权重最高即可。
  • 当主机接管虚拟IP时,会广播一个ARP消息,通知网络中的其他服务器与虚拟IP关联的MAC地址。这样就可以保证2层网络通信可以正常运行,同时可以加快虚拟IP的漂移。

1.3 数据包格式

Picture2_2.png

通过VRRP的消息包,我们可以更好地了解VRRP是如何工作的。如上是通过Wireshark获取的VRRP广播消息:

  • 无论以太网还是IP网消息的目的地址都是组播地址,意味着消息将会发给网络上所有的主机

  • VRRP使用112端口,注意防火墙设置

  • 网络中可能有多个VRRP实力,需要设置唯一的VRID

2. 实践篇

2.1 安装Keepalived

下面以ubuntu 18.04 LT为例:

# 通过snap安装
snap install keepalived --classic

# 查看版本
keepalived --version

# 检查运行状态
snap services

# 启动/停止服务
snap start keepalived
snap stop keepalived

2.2 配置Keepalived

Keepalived的配置文件位于/etc/keepalived/keepalived.conf

# 主机配置
vrrp_instance VRRP_1 {              # 设定一个VRRP的实例,名称为V1
        state               MASTER  # 设定服务器的初始状态为 MASTER
        interface           enp0s3  # 绑定网卡
        virtual_router_id   60      # 网络中唯一的 VRRP 实例 ID
        priority            200     # 权重
        advert_int          1       # 每隔1秒广播消息
        authentication {
              auth_type PASS        # 认证模式:文本密码
              auth_pass 12345       # 密码
        }
        virtual_ipaddress {
              192.168.1.222/24      # 虚拟IP
        }
}

# 备机配置
vrrp_instance VRRP_1 {

        state               BACKUP
        interface           enp0s3
        virtual_router_id   60
        priority            100
        advert_int          1
        authentication {
              auth_type PASS
              auth_pass 12345
        }
        virtual_ipaddress {
              192.168.1.222/24
        }
}

配置好之后,重启一下keepalived服务,可以看到以下网络信息:

# 主机,拥有虚拟IP
ip -brief address show

lo          UNKNOWN     127.0.0.1/8 ::1/128 
enp0s3      UP          192.168.1.174/24 192.168.1.222/24 fe80::a00:27ff:fee6:cf3b/64

# 备机
ip -br a

lo          UNKNOWN     127.0.0.1/8 ::1/128 
enp0s3      UP          192.168.1.175/24 fe80::a00:27ff:fe0c:b917/64

如果我们将主机服务关闭,虚拟IP会自动切换到备机:

# 主机
snap stop keepalived.daemon

ip -br a

lo               UNKNOWN        127.0.0.1/8 ::1/128 
enp0s3           UP             192.168.1.174/24 fe80::a00:27ff:fee6:cf3b/64

# 备机
ip -br a

lo          UNKNOWN    127.0.0.1/8 ::1/128 
enp0s3      UP         192.168.1.175/24 192.168.1.222/24 fe80::a00:27ff:fe0c:b917/64


2.3 监控VRRP通信

# 主机
tcpdump proto 112

tcpdump: verbose output suppressed, use -v or -vv for full protocol decode
listening on enp0s3, link-type EN10MB (Ethernet), capture size 262144 bytes
05:05:00.615010 IP dev4 > vrrp.mcast.net: VRRPv2, Advertisement, vrid 60, prio 200, authtype simple, intvl 1s, length 20
05:05:01.615515 IP dev4 > vrrp.mcast.net: VRRPv2, Advertisement, vrid 60, prio 200, authtype simple, intvl 1s, length 20
05:05:02.616139 IP dev4 > vrrp.mcast.net: VRRPv2, Advertisement, vrid 60, prio 200, authtype simple, intvl 1s, length 20
05:05:03.616957 IP dev4 > vrrp.mcast.net: VRRPv2, Advertisement, vrid 60, prio 200, authtype simple, intvl 1s, length 20
05:05:04.617905 IP dev4 > vrrp.mcast.net: VRRPv2, Advertisement, vrid 60, prio 200, authtype simple, intvl 1s, length 20
05:05:05.618120 IP dev4 > vrrp.mcast.net: VRRPv2, Advertisement, vrid 60, prio 200, authtype simple, intvl 1s, length 20
^C
6 packets captured
6 packets received by filter
0 packets dropped by kernel

3. 进阶篇

默认情况下,Keepalived通过心跳监测主机故障。除此之外,Keepalived还提供更细粒度的故障监测方法。

3.1 监测进程

以监测 Apache服务为例:

vrrp_track_process track_apache {   # 定义名为 track_apache 的进程监测指令
      process   httpd   # Apache服务进程
      weight    10      # 权重
}

vrrp_instance VRRP_1 {              
        state               MASTER  
        interface           enp0s3  
        virtual_router_id   60      
        priority            200     # 如果http运行正常,权重为 200 + 10 = 210,否则为200      
        advert_int          1       
        authentication {
              auth_type PASS        
              auth_pass 12345       
        }
        virtual_ipaddress {
              192.168.1.222/24      
        }
        track_process {     
              track_apache  # 使用进程监测指令
        }
}

3.2 检测文件

如果文件权重为0,那么文件中任何非0值,都认为是故障。

如果文件权重为非0值,那么权重为文件中的值乘以文件权重。

vrrp_track_file track_app_file {    # 定义名为 track_app_file的文件监测指令
      file /var/run/my_app/vrrp_track_file
}

vrrp_instance VRRP_1 {              
        state               MASTER  
        interface           enp0s3  
        virtual_router_id   60      
        priority            200 # 如果文件中的值为5,权重为 200 + 5 * 1 = 205
        advert_int          1       
        authentication {
              auth_type PASS        
              auth_pass 12345       
        }
        virtual_ipaddress {
              192.168.1.222/24      
        }
        track_process {     
              track_app_file weight 1   # 使用文件监测指令,权重为1
        }
}

3.3 检测网卡

假设一个负载均衡器有两个网卡,一个是对外的虚拟IP,一个是面向后端服务器。我们可以监测面向后端服务器的网络连接是否故障。

vrrp_instance VRRP_1 {              
        state               MASTER  
        interface           enp0s3  
        virtual_router_id   60      
        priority            200 # 如果网卡正常,权重为 200 + 5 = 205
        advert_int          1       
        authentication {
              auth_type PASS        
              auth_pass 12345       
        }
        virtual_ipaddress {
              192.168.1.222/24      
        }
        track_interface {       
              enth0 weight 5    # 使用网卡监测指令,权重为5
        }
}

3.4 检测脚本

Keepalived支持通过任意脚本来检测主机状态。以下例子中,如果脚本返回任何非0值,则进入异常状态。

脚本示例/usr/local/bin/keepalived_check.sh

#!/bin/bash

/usr/bin/ping -c 1 -W 1 8.8.8.8 > /dev/null 2>&1

Keepalived配置:

vrrp_script keepalived_check {  # 定义监测脚本
      script "/usr/local/bin/keepalived_check.sh"
      interval 1                # 脚本每隔1秒执行一次
      timeout 5                 # 脚本超时时间 5秒
      rise 3                    # 脚本成功返回3次,算健康
      fall 3                    # 脚本返回3次失败,算失败
}

vrrp_instance VI_1 {
      state MASTER
      interface eth0
      virtual_router_id 51
      priority 244
      advert_int 1
      authentication {
         auth_type PASS
         auth_pass 12345
      }
      virtual_ipaddress {
         192.168.122.200/24
      }
      track_script {
         keepalived_check    #使用监测脚本
      }
}

3.5 通知脚本

Keepalive支持触发通知脚本,通知脚本将收到4个参数:

  • VRRP组或VRRP实例
  • VRRP组或VRRP实例名称
  • VRRP组或VRRP实例将要进入的状态
  • 权重

通知脚本示例:

# /usr/local/bin/keepalived_notify.sh
#!/bin/bash

echo "$1 $2 has transitioned to the $3 state with a priority of $4" > /var/run/keepalived_status

Keepalived配置:

# keepalived.conf
vrrp_script keepalived_check {
      script "/usr/local/bin/keepalived_check.sh"
      interval 1
      timeout 5
      rise 3
      fall 3
}

vrrp_instance VI_1 {
      state MASTER
      interface eth0
      virtual_router_id 51
      priority 244
      advert_int 1
      authentication {
         auth_type PASS
         auth_pass 12345
      }
      virtual_ipaddress {
         192.168.122.200/24
      }
      track_script {
         keepalived_check
      }
      notify "/usr/local/bin/keepalived_notify.sh"  # 启用通知脚本
}

你可能感兴趣的:(使用keepalived搭建高可用服务)