六十一、集群介绍、keepalived介绍、用keepaliver配置高可用集群

一、集群介绍

根据功能划分为两大类:高可用和负载均衡。

高可用集群通常为两台服务器,一台工作,另外一台作为冗余,当提供服务的机器宕机,冗余将接替继续提供服务

实现高可用的开源软件有:heartbeat、keepalived。heartbeat有很多bug,所以不再使用。

负载均衡集群,需要有一台服务器作为分发器,它负责把用户的请求分发给后端的服务器处理,在这个集群里,除了分发器外,就是给用户提供服务的服务器了,这些服务器数量至少为2

实现负载均衡的开源软件有LVS、keepalived、haproxy、nginx,商业的负载均衡器有F5、Netscaler,相当于一台设备,优势是有更高的并发量,有很好的稳定性;开源的软件做负载均衡稳定性就取决于服务器的稳定性了。


二、keepalived介绍

我们使用keepalived来实现高可用集群,因为heartbeat在centos6上有一些问题,影响实验效果,缺点:切换不及时,通信不顺畅。

 keepalived通过VRRP协议(Virtual Router Redundancy Protocl)来实现高可用,是它的核心。虚拟路由冗余协议。

在这个协议里会将多台功能相同的路由器组成一个小组,这个小组里会有1个master角色(主角色)和N(N>=1)个backup角色,通常这个N=1就可以实现了。

master会通过组播的形式向各个backup发送VRRP协议的数据包,当backup收不到master发来的VRRP数据包时,就会认为master宕机了。此时就需要根据各个backup的优先级来决定谁成为新的mater。

Keepalived要有三个模块,分别是core、check和vrrp。

core模块为keepalived的核心,负责主进程的启动、维护以及全局配置文件的加载和解析;

check模块负责健康检查;

vrrp模块是来实现VRRP协议的。


三、用keepaliver配置高可用集群

准备两台机器130和129,130作为master,129作为backup

两台机器都执行yum install -y keepalived

两台机器都安装nginx,其中130上已经编译安装过nginx,129上需要yum安装nginx: # yum install -y pcp-pmda-nginx

设定vip为100

编辑130上keepalived配置文件

先清空原来文件里的内容,# > /etc/keepalived/keepalived.conf

再把下面的内容粘贴进去:

# vim /etc/keepalived/keepalived.conf

global_defs {                   //global,全局定义

  notification_email {                 //出现问题时,给一个邮箱发邮件

    aming@aminglinux.com

  }

  notification_email_from root@aminglinux.com         //由哪个邮件发出去,就是发件人

  smtp_server 127.0.0.1

  smtp_connect_timeout 30

  router_id LVS_DEVEL

}

vrrp_script chk_nginx {

   script "/usr/local/sbin/check_ng.sh"        //作用是检测你的服务是否正常,检测脚本。

   interval 3                                                     //检测的间断是3秒钟。

}

vrrp_instance VI_1 {

   state MASTER                     //这一段是定义master的一些内容的,这行定义角色。

   interface ens33                  //通信,发广播的网卡。

   virtual_router_id 51   //定义你路由器的id是什么,和从的id要保持一致,说明他们是一组

   priority 100                           //权重,主比从要高。

   advert_int 1

   authentication {                      //这三行是认证相关的信息。

       auth_type PASS                     //定义认证的类型是pass,密码。

       auth_pass aminglinux>com          //定义密码,一个字符串。

   }

   virtual_ipaddress {

       192.168.93.100        //主和从的公有IP,这个就叫VIP,主需要绑定这个ip,当主宕机了,从就需要起来绑定这个ip。

   }

   track_script {

       chk_nginx           //对检查脚本做一个加载。

   }

}


130编辑监控脚本,内容

# vim /usr/local/sbin/check_ng.sh   //这个脚本名字是自定义的,配置文件写的什么,这里就写那个名字。

#!/bin/bash

d=`date --date today +%Y%m%d_%H:%M:%S`    //时间变量,用于记录日志

n=`ps -C nginx --no-heading|wc -l`                          //计算nginx进程数量

if [ $n -eq "0" ]; then

//如果进程为0,说明nginx没启动,则启动nginx,并且再次检测nginx进程数量,

//如果还为0,说明nginx无法启动,此时需要关闭keepalived

       /etc/init.d/nginx start

       n2=`ps -C nginx --no-heading|wc -l`

       if [ $n2 -eq "0"  ]; then

               echo "$d nginx down,keepalived will stop" >> /var/log/check_ng.log指定个错误日志

               systemctl stop keepalived        //停掉keepalived

       fi

fi

给脚本755权限chmod 755 /usr/local/sbin/check_ng.sh

systemctl start  keepalived    130启动服务

即使停止也会自动起来,查看这个VIP要用ip

add才能看到它,ifconfig是看不到的。

主和从的防火墙和selinux都要关闭,防火墙如果有就关闭firewalld。


129上编辑配置文件,内容:

# > /etc/keepalived/keepalived.conf

# vim /etc/keepalived/keepalived.conf

global_defs {

  notification_email {

    aming@aminglinux.com

  }

  notification_email_from root@aminglinux.com

  smtp_server 127.0.0.1

  smtp_connect_timeout 30

  router_id LVS_DEVEL

}

vrrp_script chk_nginx {

   script "/usr/local/sbin/check_ng.sh"

   interval 3

}

vrrp_instance VI_1 {

   state BACKUP         //这里是BACKUP

   interface ens33

   virtual_router_id 51      //这里和主保持一致。

   priority 90                    //权重,比主少10。

   advert_int 1

   authentication {

       auth_type PASS

       auth_pass aminglinux>com

   }

   virtual_ipaddress {

       192.168.93.100

   }

   track_script {

       chk_nginx

   }

}

129上编辑监控脚本,内容

# vim /usr/local/sbin/check_ng.sh

d=`date --date today +%Y%m%d_%H:%M:%S`    #时间变量,用于记录日志

n=`ps -C nginx --no-heading|wc -l`        #计算nginx进程数量

if [ $n -eq "0" ]; then

#如果进程为0,则启动nginx,并且再次检测nginx进程数量,

#如果还为0,说明nginx无法启动,此时需要关闭keepalived

       systemctl start nginx

   //和主的启动命令不一样,因为主是编译安装的,启动脚本是自定义的,而从是yum安装的。

       n2=`ps -C nginx --no-heading|wc -l`

       if [ $n2 -eq "0"  ]; then

               echo "$d nginx down,keepalived will stop" >> /var/log/check_ng.log

               systemctl stop keepalived

       fi

fi

给脚本755权限# chmod 755 /usr/local/sbin/check_ng.sh,不改权限就不能启动。

129上也启动服务 systemctl start keepalived

backup的默认页:/usr/share/nginx/html/index.html

用浏览器访问以下192.168.93.130和129,再访问他们的公有IP,就可以看到现在是绑定了master。


测试高可用

先确定好两台机器上nginx差异,比如可以通过curl -I 来查看nginx版本

测试1:关闭master上的nginx服务

测试2:在master上增加iptabls规则

iptables -I OUTPUT -p vrrp -j DROP

测试3:关闭master上的keepalived服务

测试4:启动master上的keepalived服务

多个backup角色就将权重设置不一样,谁的权重更高,就由谁来接替master的角色。


扩展

heartbeat和keepalived比较http://blog.csdn.net/yunhua_lee/article/details/9788433 

DRBD工作原理和配置 http://502245466.blog.51cto.com/7559397/1298945

mysql+keepalived http://lizhenliang.blog.51cto.com/7876557/1362313