hoo_5

HA集群之CoroSync+Pacemaker浅析及实现

一、CoroSync

corosync最初只是用来演示OpenAIS集群框架接口规范的一个应用，可以说corosync是OpenAIS的一部分，然而后面的发展超越了官方最初的设想，越来越多的厂商尝试使用corosync作为集群解决方案。如Redhat的RHCS集群套件就是基于corosync实现。

corosync只提供了message layer(即实现HeartBeat + CCM)，而没有直接提供CRM，一般使用Pacemaker进行资源管理。

OpenAIS是基于SA Forum 标准的集群框架的应用程序接口规范。OpenAIS提供一种集群模式，这个模式包括集群框架，集群成员管理，通信方式，集群监测等，能够为集群软件或工具提供满足AIS标准的集群接口，但是它没有集群资源管理功能，不能独立形成一个集群。

服务可用性论坛（SA Forum）是一个开放性论坛，它开发并发布AIS规范。AIS是应用接口规范，是用来定义应用程序接口（API）的开放性规范的集合，应用程序作为中间件为应用服务提供一种开放、高移植性的程序接口，是在实现高可用应用过程中是亟需的。使用AIS规范的应用程序接口（API），可以减少应用程序的复杂性和缩短应用程序的开发时间，这些规范的主要目的就是为了提高中间组件可移植性和应用程序的高可用性。

二、Pacemaker

Pacemaker是由Linux-HA工程的Heartbeat项目中的CRM组件发展而来。 Heartbeat 3开始，Heartbeat 3 按模块把的原来Heartbeat拆分为多个子项目。CRM组件单独由另一独立项目Pacemaker 负责。单独成一个项目之后，Pacemaker以做一个可扩展性高可用集群资源管理器(A scalable High-Availability cluster resource manager)为目标，并同时支持Corosync和Heartbeat 。

具体组件请看上图。

三、基于corosync实现web高可用基础配置

1.配置主机名

节点名称很关键，集群每个节的名称都得能互相解析。/etc/hosts中的主机名配置结果必须跟”uname -n”的解析的结果一致。

node1/node2都添加：

node1示例：
# vim /etc/hosts
172.16.1.11 node1.hoo.com node1
172.16.1.12 node2.hoo.com node2
# ifconfig eth0 172.16.1.11  up
# hostname node1.hoo.com
# uname -n
# vim /etc/sysconfig/network  //重启才生效，source也不生效
hostname=node1.hoo.com

2.时间同步

node1,node2都配置

# crontab -e
*/5 * * * * /usr/sbin/ntpdate  172.16.0.1 &> /dev/null

3.配置node之间SSH互信

node1:
#ssh-keygen  -t rsa -f ~/.ssh/id_rsa  -P ''
# ssh-copy-id -i .ssh/id_rsa.pub [email protected]
node1:
#ssh-keygen  -t rsa -f ~/.ssh/id_rsa  -P ''
# ssh-copy-id -i .ssh/id_rsa.pub [email protected]
node1：测试
#  ssh node2.hoo.com ‘date’;date

4.安装httpd

node1,node2

# yum install httpd -y
# ssh node2 "yum install httpd -y "
# ss -tunl | grep 80
# ssh node2 "ss -tunl | grep 80"

node1,node2均关闭httpd的自启动，httpd由Pacemaker管理

# chkconfig httpd off
# ckconfig --list httpd  //检查

node1,node2提供测试页

[root@node1 ~]# echo "node1.hoo.com" >/var/www/html/index.html
[root@node2 ~]# echo "node2.hoo.com" >/var/www/html/index.html

5.安装corosync和pacemaker

所有节点均安装

# yum install corosync pacemaker -y
# rpm -ql corosync
    //配置目录：/etc/corosync
    //配置模板：/etc/corosync/corosync.conf.example
    //服务器脚本：/etc/rc.d/init.d/corosync

6.安装资源管理器客户端命令接口工具crmsh

从pacemaker 1.1.8开始，crmsh发展成了一个独立项目，叫crmsh。pacemaker默认不提供命令接口工具，需要单独安装crmsh。

//crmsh依赖pssh
# yum -y install pssh-2.3.1-2.el6.x86_64.rpm
# yum -y install crmsh-1.2.6-4.el6.x86_64.rpm

7.配置主配置文件

[root@node1 ~]# cd /etc/corosync/
[root@node1 corosync]# cp corosync.conf.example corosync.conf
[root@node1 corosync]# vi corosync.conf
compatibility: whitetank   #表示是否兼容0.8之前的版本
totem {        #图腾，定义集群中各节点中通信机制以及参数
        version: 2    #图腾的协议版本号，不修改
        secauth: on   #安全认证功能是否启用，当使用aisexec时，会非常消耗CPU
        threads: 0    #实现认证时的并行线程数，0表示默认配置
        interface {   # 指定在哪个接口发心跳信息，子模块
                ringnumber: 0   #冗余环号，节点有多个网卡是可定义，避免心跳信息成环。
                bindnetaddr: 192.168.1.0   #绑定心跳网段
                mcastaddr: 226.94.8.8      #心跳组播地址
                mcastport: 5405            #心跳组播使用端口
                ttl: 1                     #表示只向外播一次
        }
}
logging {          # 跟日志相关
        fileline: off       #指定要打印的行
        to_stderr: no       #是否发送到标准错误输出，即屏幕
        to_logfile: yes     #记录到日志文件
        to_syslog: no       #记录到系统日志syslog
        logfile: /var/log/cluster/corosync.log  #日志文件路径
        debug: off          #是否启动调试
        timestamp: on       #是否打印时间戳
        logger_subsys {     #日志的子系统
                subsys: AMF
                debug: off
        }
}
service {
  ver:  0
  name: pacemaker        #定义corosync启动时同时启动pacemaker
  # use_mgmtd: yes
}
                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                       
aisexec {     #表示启动ais的功能时，以哪个用户的身份运行
              #这个块可不定义，corosync默认就是以root身份运行的
  user: root
  group: root
}
amf {     # 跟编程接口相关的
        mode: disabled
}

8.生成认证key

用corosync-keygen生成key时，由于要使用/dev/random生成随机数，因此如果新装的系统操作不多，如果没有足够的熵，狂敲键盘即可，随意敲，敲够即可。（关于random使用键盘敲击产生随机数的原理可自行google）

实验演示没有足够的熵，这里将采用投机的方式，生产环境，切切不可。

//投机的认证方式
# mv /dev/random /dev/lala
# ln /dev/urandom /dev/random   //将随机数生成器链接至伪随机数生成器
# corosync-keygen    //生成密钥文件，用于节点通信，会生成authkey文件
# rm -rf /dev/random        //删除链接
# mv /dev/lala /dev/random     //还原随机数生成器

9.copy配置给node2

[root@node1 corosync]# scp authkey corosync.conf node2:/etc/corosync/

10.启动corosync

[root@node1 corosync]# service corosync start
[root@node1 corosync]# ssh node2  "service corosync start"

11.检查启动情况

//查看corosync引擎是否正常启动
[root@node1 corosync]# grep -e "Corosync Cluster Engine" -e "configuration file" /var/log/messages
//查看初始化节点通知是否正常发出
[root@node1 corosync]# grep  TOTEM  /var/log/messages
//检查启动过程中是否有错误产生
[root@node1 corosync]# grep ERROR: /var/log/messages | grep -v unpack_resources
//查看pacemaker是否正常启动
[root@node1 corosync]# grep pcmk_startup /var/log/messages

四、基于corosync实现web高可用资源管理

1.crmsh使用介绍

[root@node1 ~]# crm  //进入crmsh
crm(live)# help   #查看帮助
This is crm shell, a Pacemaker command line interface.
Available commands:
    cib              manage shadow CIBs            #CIB管理模块
    resource         resources management     #资源管理模块
    configure        CRM cluster configuration  #CRM配置，包含资源粘性、资源类型、资源约束等
    node             nodes management  #节点管理
    options          user preferences  #用户偏好
    history          CRM cluster history  #CRM 历史
    site             Geo-cluster support  #地理集群支持
    ra               resource agents information center #资源代理配置
    status           show cluster status  #查看集群状态
    help,?           show help (help topics for list of topics)  #查看帮助
    end,cd,up        go back one level  #返回上一级
    quit,bye,exit    exit the program  #退出
crm(live)# configure         #进入配置模式
crm(live)configure# show     #查看当前配置
crm(live)configure# verify   #检查当前配置语法
crm(live)configure# commit   #提交配置
crm(live)configure# cd
crm(live)# ra   //进入RA（资源代理配置）模式
crm(live)ra# help
This level contains commands which show various information about
the installed resource agents. It is available both at the top
level and at the `configure` level.
Available commands:
    classes          list classes and providers    ##查看RA类型
    list             list RA for a class (and provider)  ##查看指定类型（或提供商）的RA
    meta,info        show meta data for a RA   ##查看RA详细信息
    providers        show providers for a RA and a class  ##查看指定资源的提供商和类型
    help,?           show help (help topics for list of topics)
    end,cd,up        go back one level
    quit,bye,exit    exit the program
crm(live)ra# cd
crm(live)# status   //查看集群状态

2.stonith参数的调整

禁用stonith功能，corosync默认是启用stonith功能的，没有stonith设备，若直接去配置资源的话，verif会报错，无法commit。

[root@node1 corosync]# crm configure    #进入crm命令行模式配置资源等
crm(live)configure# property    #切换到property目录下，可以用两次tab键进行补全和查看
usage: property [$id=]

3.配置web集群

a).定义IP

crm(live)configure# primitive webip ocf:heartbeat:IPaddr params ip=172.16.1.100
crm(live)configure# verify
crm(live)configure# commit
crm(live)configure# cd
crm(live)# status

验证

[root@node1 ~]# ifconfig
发现：eth0:0有IP

转移资源

[root@node2 ~]# ssh node1 'service corosync stop'
[root@node2 ~]# ssh node1 'ifconfig'
[root@node2 ~]# ifconfig
发现：IP转移

b).配置httpd资源

crm(live)configure# primitive webserver lsb:httpd   //定义资源，资源类型为lsb
crm(live)configure# verify
crm(live)configure# show
crm(live)configure# commit
crm(live)# status
    //资源运行于两个节点上，默认以均衡的方式进行工作,尽可能将不同的资源运行在不同的节点上;

4.资源约束定义

若想将多个资源运行在同一个节点上，则，做成组，或定义排列约束。

资源约束则用以指定在哪些群集节点上运行资源，以何种顺序装载资源，以及特定资源依赖于哪些其它资源。

pacemaker共给我们提供了三种资源约束方法：

1）Resource Location(资源位置）:定义资源可以、不可以或尽可能在哪些节点上运行；
2）Resource Collocation(资源排列）：排列约束定义集群资源可以、不可以在某个节点上同时运行；
3）Resource Order(资源顺序)：顺序约束定义集群资源在节点上启动的顺序；

a).定义组，将资源运行在同一个节点上

//定义资源组webservice
crm(live)configure# help group
crm(live)configure# group webservice webip sebserver
crm(live)configure# verify
crm(live)configure# commit
crm(live)configure# show
crm(live)configure#cd
crm(live)# status

浏览器访问测试，成功！

测试：

//让node1离线，测试是否转移：
crm(live)# node
crm(live)node# help standby
crm(live)node# standby node1.hoo.com   //需要使用完整名称
crm(live)configure#cd
crm(live)# status
    //转移到node2
让node1重新上线：
# crm node online node1.hoo.com
# crm status

b).定义排列约束

先删除组：
crm(live)configure#help delete
crm(live)configure# delete webservice
                //无法删除，正在运行
crm(live)configure#cd
crm(live)# resource
crm(live)resource# help
crm(live)resource# help stop
crm(live)resource# stop sebservice
crm(live)resource# status webservice
crm(live)resource#cd
crm(live)configure#delete webservice
crm(live)configure#show
crm(live)configure#commit
crm(live)configure#cd
crm(live)#status
        //负载均衡
//定义排列约束：
crm(live)configure#help colocation
    //role(可省）:每一个资源都可以定义很多角色， 每一个资源代理在启动一个资源时，会经过很多阶段，刚准备启动叫premote,启动起来叫start，停止为stop。role在主从模型中用的多点，定义主的启动了，从的才能启动或其它role。
crm(live)configure#colocation webserver_with_webip inf: webserver webip
            //让webserver与webip在一起
crm(live)configure#verify
crm(live)configure#commit
crm(live)configure#cd
crm(live)#status

c).定义顺序约束

义顺序约束：
crm(live)configure#help order
    //kind类型：Mandatory | Optional | Serialize
           强制，可选，顺序
crm(live)configure# order webip_before_webserver mandatory: webip webserver
            //按启动顺序写，从左至右
crm(live)configure#commit
crm(live)configure#show

d).定义位置约束

crm(live)configure#location webip_on_node2 webip 200: node2.hoo.com                     
     //定义为webip运行在node2的倾向性为200
crm(live)configure#verify
crm(live)configure#cd
crm(live)#status
    //已转移到node2,node1默认为0;

观察，停掉node2

//停掉node2
# service corosync stop
#crm status
    //资源没有转移到node1上，资源也没有显示了;
    //显示：Current DC: node1.magedu.com - partition WITHOUT QUORUM,表明，node2挂了，node1不具备法定票数，不具备法定票数的默认操作为suicide或stop;suicide全部资源全挂，不显示任何资源
    //两节点集群是一个特殊的集群，当node2挂了，希望资源转移到node1上，此时需要定义全局属性，一旦不具备法定票数时，应该忽略，而不是停止资源：
//上线node2:
#service corosync start
#crm status
    //显示在node2上启动了;
#crm configure
crm(live)configure#property  no-quorum-policy=ignore
crm(live)configure#verify
crm(live)configure#show
crm(live)configure#commit
//观察，停掉node2:
# service corosync stop
#crm status
    资源转移到node1，
    仍显示：Current DC: node1.magedu.com - partition WITHOUT QUORUM
//启动node2:
#service corosync start
#crm status
    //资源转移到node2,node2倾向性大

node1添加倾向值，观察

crm(live)configure#location webserver_on_node1 webserver 200: node1.hoo.com
            //定义为webserver运行在node1的倾向性为200
crm(live)configure#verify
crm(live)configure#commit
crm(live)configure#show
#crm status
    //此时仍在node2;
//停止node2:
# service corosync stop
#crm status
    //转移到node1;
//上线node2:
#service corosync start
#crm status
    //显示仍在node1;因为node1与node2倾向性一样，最终的倾向性取决于所有倾向性之和;

e).定义资源默认粘性

资源粘性生效于当前运行节点。资源运行在哪里，即在哪里生效。

crm(live)configure#help
crm(live)configure#edit
    //删除webserver定义的对node1的200的倾向性;
#crm status
        //此时所有服务都运行在node2
//配置粘性：
crm(live)configure#rsc-defaults resource-stickness=100
crm(live)configure#verify
crm(live)configure#show
crm(live)configure#commit
crm(live)configure#cd
crm(live)# status

测试：

//故障node2:
# service corosync stop
#crm status
    //资源转移到node1;
//上线node2:
#crm status
    //资源没有转移;
    //对当前node的粘性和为200,与对node2的倾向性相同，故留在当前节点
    //粘性定义，无关任一node，只生效当前所运行节点;

f).定义资源监控

//强行kill掉当前节点httpd
#killall httpd
#ss -tnl
#crm status
    //显示服务照常运行
#service httpd status
       //显示：httpd dead but subsys locked,subsys没有删除
       //kill掉服务，不会自动重启;因为，节点没有故障，所有资源不会转移，默认情况下，pacemaker不会对任何资源进行监控,所以，即便是资源关掉了，只要节点没有故障，资源依然不会转移;要想达到资源转移的目的，得定义监控(monitoer);

//定义监控：
#crm configure
crm(live)configure#cd
crm(live)#status
        //仍然在节点上运行着
crm(live)#resource
crm(live)resource# status
        //仍然显示：start,没有定义监控，意识不到httpd停掉
crm(live)resource# stop webserver
crm(live)resource# stop webip
crm(live)resource# status
crm(live)resource# cleanup webserver
crm(live)resource# cleanup webip
            //如果服务被非法关闭，需要清理，以免后续配置的一些麻烦
crm(live)resource# cd
crm(live)resource# configure
crm(live)configure# help monitor
crm(live)configure# monitor webserver 20s:15s
                                //监控时间：超时时间
crm(live)configure# verify
crm(live)configure#commit
crm(live)configure#cd
crm(live)# resource
crm(live)resource# start webip
crm(live)resource# start webserver
crm(live)resource#cd
crm(live)# status
        //资源在node2上启动;

测试：

# service httpd stop
# ss -tnl
    //查看日志：
#tail /var/log/cluster/corosync.log
    //查看node2的httpd是否自启：
#ss -tnl
     //启动成功;
//监控的意义：一旦发现服务没启动，就会尝试在当前主机上重启;
//配置ngnix争用端口                               
#service httpd stop  &&　service ngnix start                                
#ss -tnl
crm(live)#status
            //重启无法成功，资源转移到node1

补充：

//定义资源的同时可以定义监控：
crm(live)configure# primitive vip ocf:heartbeat:Ipaddr  params ip=172.16.1.100 op monitor interval=30s timeout=15s op start timeout=20s op stop timeout=20s                            crm(live)resource#show                      
crm(live)configure#delet vip
                    //直接删除上面的定义

补充：CRM中的几个基本概念

1.资源类型

primitive（native）：基本资源，原始资源
group：资源组
clone：克隆资源（可同时运行在多个节点上），要先定义为primitive后才能进行clone。主要包含STONITH和集群文件系统（cluster filesystem）
master/slave：主从资源，如drdb（下文详细讲解）

2.RA类型

Lsb：linux表中库，一般位于/etc/rc.d/init.d/目录下的支持start|stop|status等参数的服务脚本都是lsb
ocf：Open cluster Framework，开放集群架构
heartbeat：heartbaet V1版本
stonith：专为配置stonith设备而用

3.资源粘性

资源粘性表示资源是否倾向于留在当前节点，如果为正整数，表示倾向，负数则会离开，-inf表示正无穷，inf表示正无穷。

4.资源约束

资源约束则用以指定在哪些群集节点上运行资源，以何种顺序装载资源，以及特定资源依赖于哪些其它资源。

Resource Location（资源位置）：定义资源可以、不可以或尽可能在哪些节点上运行；
Resource Collocation（资源排列）：排列约束用以定义集群资源可以或不可以在某个节点上同时运行；
Resource Order（资源顺序）：顺序约束定义集群资源在节点上启动的顺序；

定义约束时，还需要指定值。资源安按值管理是集群工作方式的重要组成部分。从迁移资源到决定在已降级集群中停止哪些资源的整个过程是通过以某种方式改变资源值来实现的。值按每个资源来计算，资源值为负的任何节点都无法运行该资源。在计算出资源值后，集群选择值最高的节点。

有两个特殊值：inf(正无穷,表示只要有可能就要）、-inf(负无穷,表示只要有可能就不要)

定义资源约束时，也可以指定每个约束的值。值较高的约束先应用，值较低的约束后应用。通过使用不同的值为既定资源创建更多位置约束，可指定资源故障转移至的目标节点的顺序。

二进制方式部署K8s高可用集群麻辣头马头 kubernetes 容器云原生运维服务器 docker 网络
1二进制方式部署K8s高可用集群1.1kubeadm和二进制安装k8s适用场景分析kubeadm是官方提供的开源工具，是一个开源项目，用于快速搭建kubernetes集群，目前是比较方便和推荐使用的。kubeadminit以及kubeadmjoin这两个命令可以快速创建kubernetes集群。Kubeadm初始化k8s，所有的组件都是以pod形式运行的，具备故障自恢复能力。kubeadm是工具，
【深入学习Redis丨第三篇】深入详解Redis高可用集群模式陈橘又青深入学习Redis 学习 redis 数据库高可用集群
前言本文我们将介绍Redis的四种模式及各自优缺点分析。Redis一共4种模式：1、主从复制模式2、(Sentinel)哨兵模式3、(Cluster)集群模式4、代理模式文章目录前言1.**主从模式****1.1简介****1.2工作机制**2.**哨兵模式****2.1简介****2.2工作机制****2.3注意点**3.**Cluster模式****3.1简介****3.2工作机制****3.
Docker搭建MongoDB Replica Set高可用集群+数据丢失&被黑解决+自动备份与恢复脚本+持久化慢查询记录秋风お亦冷运维企业实战笔录运维 docker mongodb 数据库
文章目录引节点规划配置文件创建持久化目录创建并推送证书启动临时容器修改配置文件单节点参考mongod.confdocker-compose.ymlReplicaSet参考mongod.confdocker-compose.yml部署与配置部署集群配置集群验证集群增删节点增加节点删除节点查看节点常用命令重置集群备份数据关闭服务删除持久化数据启动集群配置集群验证集群创建用户验证集群用户管理权限说明创建
81.MySQL-PXC高可用集群戒掉贪嗔痴(薛双奇) 数据库运维-MySQL mysql 数据库
1.第一个节点启动。Linux7:my.cnf文件需要拷贝到：/etc/my.cnf(非常重要)[root@mysql51~]#mysqlpxcbootstrap-pxcBootstrappingPXC(PerconaXtraDBCluster)InitializingMySQ[OK]se:StartingMySQL(PerconaXtraDBCluster)..[OK]当前集群只有一个节点。my
MySQL 高可用--PXC 行走的猫儿 MySQL
1.PXC(PerconaXtradbCluster)Percona：基于MySQL数据库已二次开发的数据库产品xtradb：存储引擎Cluster：集群1.1概念：PXC是属于一套比较完美的MySQL高可用集群解决方案，相比较传统的基于主从复制的架构，基本上可以达到实时同步。且节点与节点之间是相互低等的，不存在主从关系。2.PXC实现的功能1）多主复制：真正的多点读写集群，在任何时候都写数据都是
keepalived mysql双主架构图_通过KeepAlived搭建MySQL双主模式的高可用集群系统尤亚洲 keepalived mysql双主架构图
通过KeepAlived搭建MySQL双主模式的高可用集群系统一、整体架构企业级mysql集群具备高可用、可扩展、易管理、低成本的特点。下面将介绍企业环境中经常应用的一个解决方案，即MySQL的双主互备架构，主要设计思路是通过MySQLReplication技术将两台MySQLServer互相将对方作为自己的Master，自己又同时作为对方的Slave来进行复制。这样就实现了高可用构架中的数据同步
【Mysql】通过Keepalived搭建mysql双主高可用集群维运数据库 mysql 数据库
一、环境信息主机名ip操作系统mysql版本VIP（虚拟ip）hadoop01192.168.10.200centos7_x865.7192.168.10.253hadoop03192.168.10.202centos7_x865.7二、mysql集群搭建两台节点，如果未部署mysql服务，部署文档请看【Mysql】mysql三种安装方式（二进制、yum、docker）-CSDN博客三、配置文件修
基于Zookeeper搭建Kafka高可用集群数字游牧人0v0 大数据BigData kafka java-zookeeper zookeeper 大数据
基于Zookeeper搭建Kafka高可用集群一、Zookeeper集群搭建为保证集群高可用，Zookeeper集群的节点数最好是奇数，最少有三个节点，所以这里搭建一个三个节点的集群。1.1下载&解压下载对应版本Zookeeper，这里我下载的版本3.4.14。官方下载地址：https://archive.apache.org/dist/zookeeper/#下载wgethttps://archi
从零开始搭建Aliyun ESC高可用集群 (HaVip+KeepAlived) cloud_ether 云原生运维 lvs 高性能集群 keepalived lvs 高可用集群高性能集群云原生
从零开始搭建AliyunESC高可用集群(HaVip+KeepAlived)架构架构本设计方案采用两台阿里云ECS服务器搭建Keepalived结合LVS的高可用集群。使用LVS的TUN模式进行负载均衡，同时利用阿里云的弹性IP（EIP）与高可用虚拟HaVIP实现跨服务器的高可用性。架构中，一台ECS服务器作为主LVSDirector节点，另一台作为备份LVSDirector节点，两者通过Keep
Zabbix HA高可用集群搭建 KK小草莓 zabbix
ZabbixHA高可用集群搭建ZabbixHA高可用集群搭建一、Zabbix高可用集群（ZabbixHA）二、部署Zabbix高可用集群1、两个服务端配置1.1主节点ZabbixServer配置1.2备节点ZabbixServer配置1.3主备节点添加监控主机1.4查看高可用集群状态2、两个客户端配置2.1修改agent01和agent02的配置文件2.2查看web页面3、故障模拟和效果测试3.1
HA集群--一起学习吧之架构 wd90119 学习架构
今天想和大家一起学习HA集群。首先，上定义~一、HA定义HA（HighAvailability）集群，即高可用集群，是一种以减少服务中断时间为目的的服务器集群技术。它通过保护用户业务程序对外不间断地提供服务，把因软件、硬件、人为造成的故障对业务的影响降低到最小程度，从而保证公司业务7*24小时不宕机。HA集群一般包含两个或两个以上的节点，且分为活动节点及备用节点。通常把正在执行业务的节点称为活动节
kubeasz部署k8s高可用集群时空无限 kubernetes
前言：如无特殊说明，所有操作都用root账号在所有节点执行。说明：kubeasz是一款国产开源的k8s部署软件，采用ansiblerole的部署方式，部署k8s二进制集群。熟悉ansiblerole的用该软件部署k8s方便快捷。一、机器deploy#部署机器master01master02node01二、环境2.1部署机器环境[root@localhostopt]#cat/etc/redhat-r
Centos7.9基于Kubeasz部署k8s 1.27.1高可用集群 Arnold.Shen Kubernetes docker 运维 kubernetes
一：kubeasz的介绍kubeasz致力于提供快速部署高可用k8s集群的工具,同时也努力成为k8s实践、使用的参考书；基于二进制方式部署和利用ansible-playbook实现自动化；既提供一键安装脚本,也可以根据安装指南分步执行安装各个组件。kubeasz从每一个单独部件组装到完整的集群，提供最灵活的配置能力，几乎可以设置任何组件的任何参数；同时又为集群创建预置一套运行良好的默认配置，甚至自
中间件-Nginx学习笔记笑一笑、 Java nginx 服务器 linux
目录nginx简介Linux安装Nginxnginx常用命令nginx.conf配置文件nginx反向代理nginx负载均衡nginx动静分离nginx搭建高可用集群高可用配置（主从配置）高可用主从配置文件详解nginx原理nginx简介什么是nginxNginx(enginex)是一个高性能的HTTP和反向代理]web服务器，同时也提供了IMAP/POP3/SMTP服务。Nginx可以作为静态页
运维工程师的转型与升级：解析35岁半衰期现象及其应对策略 Srlua 运维话题分享运维
目录什么是运维工程师1.系统维护：2.故障排除：3.安全管理：4.性能优化：5.自动化流程：6.云计算服务：运维工程师需要学什么Linux系统知识：网络基础知识：企业级负载集群：高可用集群：运维监控：脚本编程：安全知识：版本控制：云计算服务：容器技术：DevOps文化：软件工具：故障排查：项目管理：35岁被称为运维半衰期，究竟为何？1.时间分配：2.工作弹性需求：3.职业稳定性：4.精力分配：该如
LVS/DR&LVS高可用集群 Hannah_zh Linux LVS集群 keepalived ipvsadm VS/DR
一、基本知识HeartbeatHeartbeat项目是Linux-HA工程的一个组成部分，其与lvs在本质上无关。Heartbeat提供了2个核心的功能正是lvs所需要的，心跳监测部分和资源接管，心跳监测可以通过网络链路和串口进行，而且支持冗余链路，安装了Heartbeat的两台机器会通过心跳检测互相检测对方的状态，当检测到对方失效的时候会调用资源接管来做接管服务器，保证高可靠性。在一个高可靠的l
Redis缓存高可用集群在电商网站中的应用 MarkHD 缓存 redis spring
实战案例：Redis缓存高可用集群在电商网站中的应用背景某大型电商网站在日常运营中面临巨大的访问量和数据压力。为了提高系统的响应速度和稳定性，该电商网站决定采用Redis作为缓存层，并构建高可用集群以应对高并发和故障转移的需求。架构设计节点规划：根据业务需求，该电商网站规划了16个Redis节点，其中8个为主节点（Master），8个为从节点（Slave）。每个主节点都配置了一个对应的从节点，用于
Redis缓存高可用集群浅谈 MarkHD 缓存 redis 数据库
Redis缓存高可用集群的创新主要体现在以下几个方面：无中心节点设计：Redis集群是一个由多个主从节点群组成的分布式服务器群，它没有中心节点，这使得集群可以水平扩展，并且可以线性扩展到上万个节点（官方推荐不超过1000个节点）。这种设计大大提高了系统的可用性和并发处理能力。自动故障转移：在Redis集群中，如果某个节点发生故障，集群会自动进行故障转移，将故障的节点从集群中移除，并将其他节点升级为
实战 | Nginx+keepalived 实现高可用集群开源Linux
前言今天通过两个实战案例，带大家理解Nginx+keepalived如何实现高可用集群，在学习新知识之前您可以选择性复习之前的知识点：给小白的Nginx10分钟入门指南Nginx编译安装及常用命令Nginx配置文件详解一文带你读懂Nginx反向代理一文彻底读懂nginx中的location指令Nginx负载均衡原理及配置实例Nginx为什么快到根本停不下来？Keepalived入门学习Keepal
Hadoop-HA高可用集群部署魔笛Love hadoop hdfs big data
HadoopHAHA概述(1)所谓HA(HighAvailablity),即高可用(7*24小时不中断服务)。(2)实现高可用最关键的策略是消除单点故障。HA严格来说应该分成各个组件的HA机制:HDFS的HA和YARN的HA。(3)NameNode主要在以下两个方面影响HDFS集群➢NameNode机器发生意外,如宕机,集群将无法使用,直到管理员重启➢NameNode机器需要升级,包括软件、硬件升
使用 kind 部署单机版 kubernetes 集群 leileitang_blog
1.kind的介绍和优势kind（KubernetesinDocker）是一个基于Docker构建的Kubernetes集群的工具。它经过CNCF认证，并且支持多节点集群，包括高可用集群。并且支持Linux、macOS以及Windows操作系统，操作简单，学习成本低，非常适合用来在本地搭建基于Kubernetes的开发/测试环境2.使用kind部署本地k8s集群2.1本地安装kindmac环境安装
k8s1.20 搭建-抛弃docker使用containerd 玄德公笔记 #02-k8s集群安装 k8s kubernetes 容器运维 k8s集群安装
前言：k8s动不动就要抛弃docker，好吧，让我们体验一下没有docker的k8s。其他相关文档：《k8s-1.21高可用集群搭建》文章目录前言：1.环境准备1.1关闭无用服务1.2环境和网络1.3依赖安装1.4系统优化2.安装Containerd2.1安装2.2修改配置文件2.3启动2.4测试3.k8s集群安装3.1安装服务3.2master初始化3.2.1初始化文件3.2.3下载镜像（非必要
Keepalived热备、Keepalived+LVS、HAProxy监控及后端服务器健康检查、负载均衡调度器对比 Mick方服务器 lvs 负载均衡
KeepAlived高可用集群keepalived用于实现高可用集群它的工作原理就是VRRP（虚拟冗余路由协议）配置高可用的web集群环境说明：web1：eth0->192.168.88.100/24web2：eth0->192.168.88.200/24配置keepalived#在两台web服务器上安装keepalived[root@pubservercluster]#vim07-install
集群及LVS简介、LVSNAT模式原理、LVSNAT模式配置、LVSDR模式原理、LVSDR模式配置、LVS错误排查 Mick方 lvs java 开发语言
集群将很多机器组织到一起，作为一个整体对外提供服务集群在扩展性、性能方面都可以做到很灵活集群分类：负载均衡集群：LoadBalance高可用集群：HighAvailability高性能计算：HighPerformanceComputingLVSLVS：LinuxVirtualServer，Linux虚拟服务器实现负载均衡集群作者：章文嵩。国防科技大学读博士期间编写LVS的工作模式：NAT：网络地址
Redis缓存高可用集群车马去闲闲丶缓存 redis 数据库
Redis集群方案哨兵集群在redis3.0以前的版本要实现集群一般是借助哨兵sentinel工具来监控master节点的状态，如果master节点异常，则会做主从切换，将某一台slave作为master，哨兵的配置略微复杂，并且性能和高可用性等各方面表现一般，特别是在主从切换的瞬间存在访问瞬断的情况，而且哨兵模式只有一个主节点对外提供服务，没法支持很高的并发，且单个主节点内存也不宜设置得过大，否
Redis不是一直号称单线程效率也很高吗，为什么又采用多线程了？小梁同学jxy
Redis是目前广为人知的一个内存数据库，在各个场景中都有着非常丰富的应用，前段时间Redis推出了6.0的版本，在新版本中采用了多线程模型。Redis为什么最开始被设计成单线程的？Redis作为一个成熟的分布式缓存框架，它由很多个模块组成，如网络请求模块、索引模块、存储模块、高可用集群支撑模块、数据操作模块等。很多人说Redis是单线程的，就认为Redis中所有模块的操作都是单线程的，其实这是不
Redis（三）主从架构、Redis哨兵架构、Redis集群方案对比、Redis高可用集群搭建、Redis高可用集群之水平扩展 _蓝天IT_ 分布式 redis 架构 java
转自极客时间Redis主从架构redis主从架构搭建，配置从节点步骤：1、复制一份redis.conf文件2、将相关配置修改为如下值：port6380pidfile/var/run/redis_6380.pid#把pid进程号写入pidfile配置的文件logfile"6380.log"dir/usr/local/redis-5.0.3/data/6380#指定数据存放目录#需要注释掉bind#b
kafka高可用集群搭建憧憬blog 分布式 kafka java zookeeper linux
kafka高可用集群搭建说明这篇博文主要是为了后面的elk做准备，我们这里搭建一个kafka集群，使用2个节点，还是前面的节点。主要是为了后面做数据缓冲。这里不对mq的详细进行介绍，必要会对kafka相关配置进行描述。节点说明节点hostname192.168.179.123node-5192.168.179.124node-4192.168.179.125node-3当我们进行集群搭建的时候，要
Kafka基于Zookeeper搭建高可用集群实战八五年的湘哥 #Kafka zookeeper 分布式 kafka java
目录1、前言1.1高可用的由来1.2相关术语2、架构图3、发送消息流程4、部署kafka&zookeeper集群4.1准备工作4.2启动zookeeper集群4.3启动kafka集群4.4测试5、kafka集群管理控制台安装5.1安装配置5.2控制台访问6、JavaAPI操作6.1本地DNS映射配置6.2pom依赖6.3生产者类6.4消费者类7、分区/片备份8、集群监控8.1开启JMX端口8.2K
第96讲：MySQL高可用集群MHA的核心概念以及集群搭建 Jiangxl~ mysql 数据库云计算运维数据结构
文章目录1.MHA高可用数据库集群的核心概念1.1.主从复制架构的演变1.2.MHA简介以及架构1.3.MHA的软件结构1.4.MHAManager组件的启动过程1.5.MHA高可用集群的原理2.搭建MHA高可用数据库集群2.1.环境架构简介2.2.搭建基于GTID的主从复制集群2.2.1.在三台服务器中分别搭建MySQL实例2.2.2.配置基于GTID的主从复制集群2.2.3.查看集群各节点的状
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

HA集群之CoroSync+Pacemaker浅析及实现

你可能感兴趣的:(crmsh,高可用集群)