1 keepalived是什么?
Keepalived软件起初是专为LVS负载均衡软件设计的,用来管理并监控LVS集群系统中各个服务节点的状态,后来又加入了可以实现高可用的VRRP功能。因此,Keepalived除了能够管理LVS软件外,还可以作为其他服务(例如:Nginx、Haproxy、MySQL等)的高可用解决方案软件。
Keepalived软件主要是通过VRRP协议实现高可用功能的。VRRP是Virtual Router RedundancyProtocol(虚拟路由器冗余协议)的缩写,VRRP出现的目的就是为了解决静态路由单点故障问题的,它能够保证当个别节点宕机时,整个网络可以不间断地运行。
所以,Keepalived 一方面具有配置管理LVS的功能,同时还具有对LVS下面节点进行健康检查的功能,另一方面也可实现系统网络服务的高可用功能。
keepalived官网http://www.keepalived.org
2 keepalived服务的三个重要功能
管理LVS负载均衡软件
实现LVS集群节点的健康检查中
作为系统网络服务的高可用性(failover)
3 Keepalived高可用故障切换转移原理
Keepalived高可用服务对之间的故障切换转移,是通过 VRRP (Virtual Router Redundancy Protocol ,虚拟路由器冗余协议)来实现的。
在 Keepalived服务正常工作时,主 Master节点会不断地向备节点发送(多播的方式)心跳消息,用以告诉备Backup节点自己还活看,当主 Master节点发生故障时,就无法发送心跳消息,备节点也就因此无法继续检测到来自主 Master节点的心跳了,于是调用自身的接管程序,接管主Master节点的 IP资源及服务。而当主 Master节点恢复时,备Backup节点又会释放主节点故障时自身接管的IP资源及服务,恢复到原来的备用角色。
那么,什么是VRRP呢?
VRRP ,全 称 Virtual Router Redundancy Protocol ,中文名为虚拟路由冗余协议 ,VRRP的出现就是为了解决静态踣甶的单点故障问题,VRRP是通过一种竞选机制来将路由的任务交给某台VRRP路由器的。
4 keepalived 原理
5 keepalived部署
实验配置环境:
系统:centos 6.5
主:master 192.168.11.130
从:backup 192.168.11.131
vip: 192.168.11.100
主从都关闭防火墙或清除规则
主从都安装keepalived和nginx
#yum install -y keepalived
#yum install -y nginx
1编辑主上配置文件:
# vim /etc/keepalived/keepalived.conf
global_defs { #全局配置 notification_email { 定义报警邮件地址 [email protected] } notification_email_from [email protected] #定义发送邮件的地址 smtp_server 127.0.0.1 smtp_connect_timeout 30 #定义超时时间 router_id LVS_DEVEL #定义路由标识信息,相同局域网唯一 } vrrp_script chk_nginx { #check模块,检测一个服务是否正常,需要写脚本 script "/usr/local/sbin/check_ng.sh" #检测脚本 interval 3 #检测的时间间断 } vrrp_instance VI_1 { #定义master相关 state master #状态参数 master/backup 只是说明 interface eth0 #虚IP地址放置的网卡位置 virtual_router_id 51 #同一家族要一直,同一个集群id一致 priority 100 # 优先级决定是主还是备 越大越优先 advert_int 1 authentication { #认证相关的信息 auth_type PASS auth_pass aminglinux>com } virtual_ipaddress { #vip 192.168.11.100 }
编辑主上监控脚本
# vim /usr/local/sbin/check_ng.sh
#!/bin/bash #时间变量,用于记录日志 d=`date --date today +%Y%m%d_%H:%M:%S` #计算nginx进程数量 n=`ps -C nginx --no-heading|wc -l` #如果进程为0,则启动nginx,并且再次检测nginx进程数量, #如果还为0,说明nginx无法启动,此时需要关闭keepalived if [ $n -eq "0" ]; then service nginx restart n2=`ps -C nginx --no-heading|wc -l` if [ $n2 -eq "0" ]; then echo "$d nginx down,keepalived will stop" >> /var/log/check_ng.log service keepalived stop fi fi
给脚本755权限
# chmod 755 /usr/local/sbin/check_ng.sh
启动keepalived
service keepalived start
启动keepalived后,nginx会自动加载启动
编辑从上配置文件:
# vim /etc/keepalived/keepalived.conf
global_defs { #全局配置 notification_email { 定义报警邮件地址 [email protected] } notification_email_from [email protected] #定义发送邮件的地址 smtp_server 127.0.0.1 smtp_connect_timeout 30 #定义超时时间 router_id LVS_DEVEL #定义路由标识信息,相同局域网唯一 } vrrp_script chk_nginx { #check模块,检测一个服务是否正常,需要写脚本 script "/usr/local/sbin/check_ng.sh" #检测脚本 interval 3 #检测的时间间断 } vrrp_instance VI_1 { #定义master相关 state backup #状态参数 master/backup 只是说明 interface eth0 #虚IP地址放置的网卡位置 virtual_router_id 51 #同一家族要一直,同一个集群id一致 priority 90 # 优先级决定是主还是备 越大越优先 advert_int 1 authentication { #认证相关的信息 auth_type PASS auth_pass aminglinux>com } virtual_ipaddress { #vip 192.168.11.100 }
编辑从上监控脚本
# vim /usr/local/sbin/check_ng.sh
#!/bin/bash #时间变量,用于记录日志 d=`date --date today +%Y%m%d_%H:%M:%S` #计算nginx进程数量 n=`ps -C nginx --no-heading|wc -l` #如果进程为0,则启动nginx,并且再次检测nginx进程数量, #如果还为0,说明nginx无法启动,此时需要关闭keepalived if [ $n -eq "0" ]; then service nginx restart n2=`ps -C nginx --no-heading|wc -l` if [ $n2 -eq "0" ]; then echo "$d nginx down,keepalived will stop" >> /var/log/check_ng.log service keepalived stop fi fi
给脚本755权限
# chmod 755 /usr/local/sbin/check_ng.sh
启动keepalived
service keepalived start
启动keepalived后,nginx会自动加载启动
测试高可用:
先确定好两台机器上nginx差异
主上:# echo master11111111111111 > /usr/share/nginx/html/index.html
从上:# echo backup22222222222222 > /usr/share/nginx/html/index.html
测试1:关闭master上的nginx服务
测试2:在master上增加iptabls规则
iptables -I OUTPUT -p vrrp -j DROP
测试3:关闭master上的keepalived服务
测试4:启动master上的keepalived服务
浏览器缓存测试不准,用另外一台虚拟机curl测试
# curl 192.168.11.100
参考文章: https://www.cnblogs.com/clsn/p/8052649.html