一、Linux集群概述

根据功能划分为两大类:高可用和负载均衡

(1)高可用集群通常为两台服务器,台工作,另外一台作为准备,当提供服务的机器宕机,另外一台将接替继续提供服务。

实现高可用的开源软件有:heartbeat,keepalived

(2)负载均衡集群:需要有一台服务器作为分发器,它负责吧用户的请求分发给后端的服务器处理,在这个集群里,除了分发器外,就是给用户提供服务的服务器了,这些服务器数量最少为2

实现负载均衡的开源软件有LVS,keepalived,haproxy,nginx,商业的有F5,Netscaler


二、keepalived介绍

heartbeat在centos6上有一些bug,影响实验效果。所以我们不介意使用heartbeat。


keepalived通过VRRP(虚拟路由冗余协议)来实现高可用。

在这个协议里会将多台功能相同的路由器组成一个小组,这个小组里会有一个master角色和N(N>=1)个backup角色。

工作原理:mster会通过组播的形式向各个backup发送VRRP协议的数据包,当backup收不到master发来的VRRP数据包时,就会认为master宕机了,此时就需要根据哥哥backup的优先级来决定谁成为新的mater。


keepalived要有三个模块,分别是core,check,vrrp。其中core模块为keepalived的核心,负责主进程的启动,维护以及全局配置文件的加载和解析,check模块负责健康检查,vrrp模块是用来实现VRRP协议的。



三、keepalived配置高可用集群

  1. 安装keepalived,配置环境

master:192.168.52.101

backip:192.168.52.100

master和backip上都要安装keepalived

yum install keepalived -y


2.keepalived+nginx实现web高可用

Keepalived的作用是检测服务器的状态,如果有一台web服务器宕机,或工作出现故障,Keepalived将检测到,并将有故障的服务器从系统中剔除,同时使用其他服务器代替该服务器的工作,当服务器工作正常后Keepalived自动将服务器加入到服务器群中,这些工作全部自动完成,不需要人工干涉,需要人工做的只是修复故障的服务器。

(一)我们用nginx来搭建高可用平台。

(1)101的机器之前我们已经搭建Lnmp,安装过nginx,100的机器我们需要安装Nginx。yum install keepalived -y

(2)配置master上的keepalived配置文件

[root@zhuji ~]# vim /etc/keepalived/keepalived.conf 


global_defs {

   notification_email {            (出现问题发邮件的邮箱)

    [email protected]

   } 

   notification_email_from [email protected]         (由哪一个邮箱地址发出,可以引用第三方)   

   smtp_server 127.0.0.1                         

   smtp_connect_timeout 30 

   router_id LVS_DEVEL

}  

vrrp_script chk_nginx {                     (检测服务是否正常,还记得之前说过的keepalived的check模块吗?)

    script "/usr/local/sbin/check_ng.sh"         (需要写一个检测脚本,可以自定义)

    interval 3                           (检测间断3秒)

}   

vrrp_instance VI_1 {

    state MASTER                         (定义角色,是master还是backup)

    interface ens33                       (通过哪一个网卡想backup发送VRRP协议数据包)

    virtual_router_id 51                    (定义路由器的id,master要和backup保持一致)

    priority 100                          (权重,master和backup的权重是不一样的)

    advert_int 1

    authentication {                        (认证相关的配置)

        auth_type PASS                       (认证的类型是PASS密码)

        auth_pass litongyao123                 (定义密码是多少)

    }   

    virtual_ipaddress {  (定义VIP,也就是虚拟IP,这个IP是由keepalived给服务器配置的,服务器靠这个VIP对外提供服务)

        192.168.52.200

    }   

    track_script {                         (加载检查脚本)

        chk_nginx                  

    }   

}   

(3)配置keepalived检查脚本,路径就是在上面配置文件里写的。

[root@zhuji ~]# vim /usr/local/sbin/check_ng.sh

#!/bin/bash

#时间变量,用于记录日志

d=`date --date today +%Y%m%d_%H:%M:%S`

#计算nginx进程数量

n=`ps -C nginx --no-heading|wc -l`

#如果进程为0,则启动nginx,并且再次检测nginx进程数量,

#如果还为0,说明nginx无法启动,此时需要关闭keepalived

if [ $n -eq "0" ]; then

        /etc/init.d/nginx start

        n2=`ps -C nginx --no-heading|wc -l`

        if [ $n2 -eq "0"  ]; then

                echo "$d nginx down,keepalived will stop" >> /var/log/check_ng.log

                systemctl stop keepalived

        fi

fi

[root@zhuji ~]# chmod 755 /usr/local/sbin/check_ng.sh               (给执行脚本755的权限)

[root@zhuji ~]# ll !$

ll /usr/local/sbin/check_ng.sh

-rwxr-xr-x. 1 root root 567 1月   1 15:28 /usr/local/sbin/check_ng.sh


重新启动keepalived,关闭Nginx,看看Keeplived是否会执行脚本,重启Nginx。

[root@zhuji ~]# systemctl restart keepalived 

[root@zhuji ~]# ps aux |grep nginx

root     22598  0.0  0.1  45852  1248 ?        Ss   15:44   0:00 nginx: master process /usr/local/nginx/sbin/nginx -c /usr/local/ngin/conf/nginx.conf

............

[root@zhuji ~]# /etc/init.d/nginx stop

Stopping nginx (via systemctl):                            [  确定  ]

[root@zhuji ~]# ps aux |grep nginx

root     22809  0.0  0.1  45852  1244 ?        Ss   15:45   0:00 nginx: master process /usr/local/nginx/sbin/nginx -c /usr/local/ngin/conf/nginx.conf

..........

结果是可以,在这里我们要注意,如果有问题。他的错误日志在/var/log/messages里。要关闭防火墙和selinux,或者更改规则。


配置从机backup:(检查主从机子的防火墙和selinux的规则。虚拟环境下我们就关闭它)

[root@congji ~]# vim /etc/keepalived/keepalived.conf

global_defs {

   notification_email {

     [email protected]

   }

   notification_email_from [email protected]

   smtp_server 127.0.0.1

   smtp_connect_timeout 30

   router_id LVS_DEVEL

}

vrrp_script chk_nginx {

    script "/usr/local/sbin/check_ng.sh"

    interval 3

}

vrrp_instance VI_1 {

    state BACKUP                           (这里和主不一样,角色为backup)

    interface ens33

    virtual_router_id 51                      (这里要和主保持一样)

    priority 90                            (权重要比主低)

    advert_int 1

    authentication {

        auth_type PASS

        auth_pass litongyao123                    (密码要和主一样)

    }

    virtual_ipaddress {

        192.168.52.99                          (虚拟vip要和主一样)

    }

    track_script {

        chk_nginx

    }   

}  


编写监控nginx服务的脚本:

[root@congji ~]# vim /usr/local/sbin/check_ng.sh

#时间变量,用于记录日志

d=`date --date today +%Y%m%d_%H:%M:%S`

#计算nginx进程数量

n=`ps -C nginx --no-heading|wc -l`

#如果进程为0,则启动nginx,并且再次检测nginx进程数量,

#如果还为0,说明nginx无法启动,此时需要关闭keepalived

if [ $n -eq "0" ]; then

        systemctl start nginx                (这里和主的区别,因为我们从机是Yum安装的)

        n2=`ps -C nginx --no-heading|wc -l`

        if [ $n2 -eq "0"  ]; then

                echo "$d nginx down,keepalived will stop" >> /var/log/check_ng.log

                systemctl stop keepalived

        fi

fi


更改监控脚本的权限

[root@congji ~]# chmod 755 !$

chmod 755 /usr/local/sbin/check_ng.sh


检查Keeplived是否会监控Nginx的状态:

[root@congji ~]# systemctl start keepalived

[root@congji ~]# ps aux |grep nginx

root      4112  0.0  0.2 122908  2108 ?        Ss   16:19   0:00 nginx: master process /usr/sbin/nginx

....

[root@congji ~]# systemctl stop nginx

[root@congji ~]# ps aux |grep nginx

root      4226  0.0  0.2 122908  2112 ?        Ss   16:19   0:00 nginx: master process /usr/sbin/nginx

....


修改两台机子的访问主页,为后面的实验做基础:

master:

[root@zhuji ~]# echo master.master > /data/wwwroot/default/index.html       

backup:

[root@congji ~]# echo backup.backup > /usr/share/nginx/html/index.html (因为backup的Nginx是yum安装,他的默认路径如此)


测试keepalived高可用

关闭master上的keepalived服务。观察vip100和主页的变化。


主机Master: (ip addr我们发现99的vip不见了)

[root@zhuji ~]# systemctl stop keepalived

[root@zhuji ~]# ip addr

ens33: mtu 1500 qdisc pfifo_fast state UP qlen 1000

    link/ether 00:0c:29:95:aa:42 brd ff:ff:ff:ff:ff:ff

    inet 192.168.52.101/24 brd 192.168.52.255 scope global ens33

       valid_lft forever preferred_lft forever

    inet6 fe80::f8ec:e89c:1608:bfc5/64 scope link 

       valid_lft forever preferred_lft forever


从机(backup):

[root@zhuji ~]# ip addr            (vip99已经到了从机上)

ens33: mtu 1500 qdisc pfifo_fast state UP qlen 1000

    link/ether 00:0c:29:83:d1:17 brd ff:ff:ff:ff:ff:ff

    inet 192.168.52.100/24 brd 192.168.52.255 scope global ens33

       valid_lft forever preferred_lft forever

    inet 192.168.52.99/32 scope global ens33

       valid_lft forever preferred_lft forever


四、keeplived+MySQL

https://blog.51cto.com/lizhenliang/1362313