332119393

corosync+pacemaker+crmsh+DRBD实现数据库服务器高可用集群构建

DRBD (DistributedReplicated Block Device) 是 Linux 平台上的分散式储存系统。其中包含了核心模组，数个使用者空间管理程式及 shell scripts，通常用于高可用性（high availability, HA）丛集。DRBD 类似磁盘阵列的RAID 1（镜像），只不过 RAID 1 是在同一台电脑内，而 DRBD 是透过网络。

DRBD 是以 GPL2 授权散布的自由软件。

实验架构图：

一.高可用集群构建的前提条件

1.主机名互相解析，实现主机名通信

[root@node1 ~]# vim /etc/hosts
127.0.0.1  localhost localhost.localdomain localhost4 localhost4.localdomain4
::1        localhost localhost.localdomain localhost6 localhost6.localdomain6
172.16.31.10 node1.stu31.com node1
172.16.31.11 node2.stu31.com node2

复制一份到node2：

[root@node1 ~]# scp /etc/[email protected]:/etc/hosts

2.节点直接实现ssh无密钥通信

节点1：
[root@node1 ~]# ssh-keygen -t rsa -P""
[root@node1 ~]# ssh-copy-id -i.ssh/id_rsa.pub root@node2
节点2：
[root@node2 ~]# ssh-keygen -t rsa -P""
[root@node2 ~]# ssh-copy-id -i.ssh/id_rsa.pub root@node1

测试ssh无密钥通信：

[root@node2 ~]# date ; ssh node1 'date'
Fri Jan 2 12:34:02 CST 2015
Fri Jan 2 12:34:02 CST 2015

时间同步，上面两个节点的时间是一致的！

二.DRBD软件的安装

1.获取DRBD软件程序，CentOS6.6的内核版本是2.6.32-504

[root@node1 ~]# uname -r
2.6.32-504.el6.x86_64

DRBD已经合并到linux kernel2.6.33及以后内核版本中，这里直接安装管理工具即可，若内核

版本低于2.6.33时请额外安装DRBD内核模块，且与管理工具版本保持一致。

kmod-drbd84-8.4.5-504.1.el6.x86_64.rpm
drbd84-utils-8.9.1-1.el6.elrepo.x86_64.rpm

此软件包是经过编译源码而成，我提供下载，根据附件下载即可：

2.安装软件包，节点1和节点2都需要安装

安装时间将持续很长时间：

[root@node1 ~]# rpm -ivhdrbd84-utils-8.9.1-1.el6.elrepo.x86_64.rpm kmod-drbd84-
8.4.5-504.1.el6.x86_64.rpm
warning:drbd84-utils-8.9.1-1.el6.elrepo.x86_64.rpm: Header V4 DSA/SHA1 Signature,
key ID baadae52: NOKEY
Preparing...               ########################################### [100%]
  1:drbd84-utils          ########################################### [ 50%]
  2:kmod-drbd84           ########################################### [100%]
Working. This may take some time ...
Done.

3.各节点准备存储设备

节点1和节点2都需要操作：

[root@node1 ~]#  echo -n -e "n\np\n3\n\n+1G\nw\n"|fdisk /dev/sda  
[root@node1 ~]# partx -a /dev/sda
BLKPG: Device or resource busy
error adding partition 1
BLKPG: Device or resource busy
error adding partition 2
BLKPG: Device or resource busy
error adding partition 3

四.配置DRBD

1.DRBD的配置文件：

[root@node1 ~]# vim /etc/drbd.conf
# You can find an example in  /usr/share/doc/drbd.../drbd.conf.example
 
include "drbd.d/global_common.conf";
include "drbd.d/*.res";

DRBD的所有的控制都是在配置文件/etc/drbd.conf中。通常情况下配置文件包含如下内容：

include"/etc/drbd.d/global_common.conf";

include "/etc/drbd.d/*.res";

通常情况下，/etc/drbd.d/global_common.conf包含global和common的DRBD配置部分，而.res文件都包含一个资源的部分。

在一个单独的drbd.conf文件中配置全部是可以实现的，但是占用的配置很快就会变得混乱，变得难以管理，这也是为什么多文件管理作为首选的原因之一。

无论采用哪种方式，需必须保持在各个集群节点的drbd.conf以及其他的文件完全相同。

2.配置DRBD的全局及通用资源配置文件

[root@node1 drbd.d]# cat global_common.conf
# DRBD is the result of over a decade ofdevelopment by LINBIT.
# In case you need professional servicesfor DRBD or have
# feature requests visithttp://www.linbit.com
 
global {
         #用于统计应用各个版本的信息。当新的版本的drbd被安装就会和http server进行联系
。当然也可以禁用该选项，默认情况下是启用该选项的。
       usage-count no;
       # minor-count dialog-refresh disable-ip-verification
}
 
common {
       handlers {
                # These are EXAMPLE handlersonly.
                # They may have severeimplications,
                # like hard resetting the nodeunder certain circumstances.
                # Be careful when chosing yourpoison.
                #一旦节点发生错误就降级
                pri-on-incon-degr"/usr/lib/drbd/notify-pri-on-incon-degr.sh;
/usr/lib/drbd/notify-emergency-reboot.sh;echo b > /proc/sysrq-trigger ; reboot -f";
                #一旦节点发生脑裂的处理是重启
                pri-lost-after-sb"/usr/lib/drbd/notify-pri-lost-after-sb.sh;
/usr/lib/drbd/notify-emergency-reboot.sh;echo b > /proc/sysrq-trigger ; reboot -f";
                #一旦本地io错误的处理是关机
                local-io-error"/usr/lib/drbd/notify-io-error.sh;
/usr/lib/drbd/notify-emergency-shutdown.sh;echo o > /proc/sysrq-trigger ; halt -f";
                # fence-peer"/usr/lib/drbd/crm-fence-peer.sh";
                # split-brain"/usr/lib/drbd/notify-split-brain.sh root";
                # out-of-sync"/usr/lib/drbd/notify-out-of-sync.sh root";
                # before-resync-target"/usr/lib/drbd/snapshot-resync-target-lvm.sh
-p 15 -- -c 16k";
                # after-resync-target/usr/lib/drbd/unsnapshot-resync-target-lvm.sh;
       }
 
        startup {
                # wfc-timeout degr-wfc-timeoutoutdated-wfc-timeout wait-after-sb
       }
 
       options {
                # cpu-maskon-no-data-accessible
       }
 
       disk {
                # size on-io-error fencingdisk-barrier disk-flushes
                   #一旦本地磁盘发生IO错误时的操作:拆除
                on-io-error detach;
                # disk-drain md-flushesresync-rate resync-after al-extents
                # c-plan-ahead c-delay-targetc-fill-target c-max-rate
                # c-min-rate disk-timeout
       }
 
       net {
                # protocol timeoutmax-epoch-size max-buffers unplug-watermark
                #资源配饰使用完全同步复制协议（Protocol C），除非另有明确指定；表示
收到远程主机的写入确认后,则认为写入完成.
                protocol C;
                # connect-int ping-intsndbuf-size rcvbuf-size ko-count
                # allow-two-primariescram-hmac-alg shared-secret after-sb-0pri
                #设置主备机之间通信使用的信息算法.
                cram-hmac-alg "sha1";
                #消息摘要认证密钥
                shared-secret "password";
                # after-sb-1pri after-sb-2prialways-asbp rr-conflict
                # ping-timeoutdata-integrity-alg tcp-cork on-congestion
                # congestion-fillcongestion-extents csums-alg verify-alg
                # use-rle
       }
 
       syncer  {
                #设置主备节点同步时的网络速率最大值,单位是字节.
                rate 1000M;
       }
}

3.定义节点存储资源配置文件

一个DRBD设备(即:/dev/drbdX),叫做一个"资源"。里面包含一个DRBD设备的主备节点的的ip信息，底层存储设备名称，设备大小，meta信息存放方式，drbd对外提供的设备名等等。

[root@node1 drbd.d]# vim mystore.res
resource mystore {
       #每个主机的说明以"on"开头,后面是主机名.在后面的{}中为这个主机的配置.
       on node1.stu31.com  {
                device /dev/drbd0;
                disk /dev/sda3;
                #设置DRBD的监听端口,用于与另一台主机通信
                address 172.16.31.10:7789;
                meta-disk internal;
       }
 
       on node2.stu31.com  {
                device /dev/drbd0;
                disk /dev/sda3;
                address 172.16.31.11:7789;
                meta-disk internal;
       }
}

配置完成后复制一份到节点2：

[root@node1 drbd.d]# ls
global_common.conf  mystore.res
[root@node1 drbd.d]# scp *node2:/etc/drbd.d/
global_common.conf                            100% 2105     2.1KB/s  00:00   
mystore.res                                   100%  318    0.3KB/s   00:00

4.创建matadata

在启动DRBD之前,需要分别在两台主机的sda分区上,创建供DRBD记录信息的数据块.分别在两台主机上执行:

[root@node1 drbd.d]# drbdadm create-mdmystore
initializing activity log
NOT initializing bitmap
Writing meta data...
New drbd meta data block successfullycreated.
 
[root@node2 ~]# drbdadm create-md mystore
initializing activity log
NOT initializing bitmap
Writing meta data...
New drbd meta data block successfullycreated.

5.启动DRBD服务

[root@node1 ~]#  /etc/init.d/drbd start
Starting DRBD resources: [
    create res: mystore
  prepare disk: mystore
   adjust disk: mystore
    adjust net: mystore
]
..........
***************************************************************
 DRBD's startup script waits for the peernode(s) to appear.
 - Incase this node was already a degraded cluster before the
   rebootthe timeout is 0 seconds. [degr-wfc-timeout]
 - Ifthe peer was available before the reboot the timeout will
  expire after 0 seconds. [wfc-timeout]
  (These values are for resource 'mystore'; 0 sec -> wait forever)
 Toabort waiting enter 'yes' [  21]:
.
[root@node1 ~]#
节点2启动drbd：
[root@node2 ~]# /etc/init.d/drbd start
Starting DRBD resources: [
    create res: mystore
  prepare disk: mystore
   adjust disk: mystore
    adjust net: mystore
]
.

6. 查看DRBD的状态，分别在两台主机上执行

[root@node1 ~]# cat /proc/drbd
version: 8.4.5 (api:1/proto:86-101)
GIT-hash:1d360bde0e095d495786eaeb2a1ac76888e4db96 build by [email protected],
2015-01-02 12:06:20
 0:cs:Connected ro:Secondary/Secondary ds:Inconsistent/Inconsistent C r-----
   ns:0 nr:0 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:1059216

对输出的含义解释如下：

ro表示角色信息，第一次启动drbd时，两个drbd节点默认都处于Secondary状态，

ds是磁盘状态信息，“Inconsistent/Inconsisten”，即为“不一致/不一致”状态，表示两个节点的磁盘数据处于不一致状态。

Ns表示网络发送的数据包信息。

Dw是磁盘写信息

Dr是磁盘读信息

7.设置主节点

由于默认没有主次节点之分，因而需要设置两个主机的主次节点，选择需要设置为主节点的主机，然后执行如下

node1为主节点

#强制设置主节点

[root@node1 ~]# drbdadm primary --forcemystore

查看同步操作：

[root@node1 ~]# drbd-overview

0:mystore/0 SyncSource Primary/Secondary UpToDate/Inconsistent

[=====>..............] sync'ed: 32.1% (724368/1059216)K

[root@node1 ~]# watch -n1 'cat /proc/drbd'

完成后查看节点状态：

[root@node1 ~]# cat /proc/drbd
version: 8.4.5 (api:1/proto:86-101)
GIT-hash:1d360bde0e095d495786eaeb2a1ac76888e4db96 build by [email protected],
2015-01-02 12:06:20
 0:cs:Connected ro:Primary/Secondary ds:UpToDate/UpToDate C r-----
   ns:1059216 nr:0 dw:0 dr:1059912 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:foos:0

8.格式化存储

[root@node1 ~]# mke2fs -t ext4 /dev/drbd0

挂载到一个目录：
[root@node1 ~]# mount /dev/drbd0 /mnt
复制一个文件到mnt：
[root@node1 ~]# cp /etc/issue /mnt
卸载存储：
[root@node1 ~]# umount /mnt

9.切换主节点为备节点，将node2提升为主节点

节点1设置为备节点：
[root@node1 ~]# drbdadm secondary mystore
[root@node1 ~]# drbd-overview
 0:mystore/0 Connected Secondary/Secondary UpToDate/UpToDate
提升节点2为主节点：
[root@node2 ~]# drbdadm primary mystore
[root@node2 ~]# drbd-overview
 0:mystore/0 Connected Primary/Secondary UpToDate/UpToDate

挂载文件系统，查看文件是否存在：

[root@node2 ~]# mount /dev/drbd0 /mnt

[root@node2 ~]# ls /mnt

issue lost+found

注意：

（1）mount drbd设备以前必须把设备切换到primary状态。

（2）两个节点中，同一时刻只能有一台处于primary状态，另一台处于secondary状态。

（3）处于secondary状态的服务器上不能加载drbd设备。

（4）主备服务器同步的两个分区大小最好相同,这样不至于浪费磁盘空间,因为drbd磁盘镜像相当于网络raid 1。

10.将drbd服务关闭，开机自启动关闭：

节点1：
[root@node1 ~]# service drbd stop
Stopping all DRBD resources: .
[root@node1 ~]# chkconfig drbd off
节点2：
[root@node2 ~]# service drbd stop
Stopping all DRBD resources:
.
[root@node2 ~]# chkconfig drbd off

五.corosync+pacemaker+drbd实现mariadb高可用集群

1.安装corosync和pacemaker软件包:节点1和节点2都安装

# yum install corosync pacemaker -y

2.创建配置文件并配置

[root@node1 ~]# cd /etc/corosync/
[root@node1 corosync]# cpcorosync.conf.example corosync.conf

[root@node1 corosync]# cat corosync.conf
# Please read the corosync.conf.5 manualpage
compatibility: whitetank
 
totem {
       version: 2
 
       # secauth: Enable mutual node authentication. If you choose to
       # enable this ("on"), then do remember to create a shared
       # secret with "corosync-keygen".
       #开启认证
       secauth: on
 
       threads: 0
 
       # interface: define at least one interface to communicate
       # over. If you define more than one interface stanza, you must
       # also set rrp_mode.
       interface {
                # Rings must be consecutivelynumbered, starting at 0.
                ringnumber: 0
                # This is normally the*network* address of the
                # interface to bind to. Thisensures that you can use
                # identical instances of thisconfiguration file
                # across all your clusternodes, without having to
                # modify this option.
                #定义网络地址
                bindnetaddr: 172.16.31.0
                # However, if you have multiplephysical network
                # interfaces configured for thesame subnet, then the
                # network address alone is notsufficient to identify
                # the interface Corosync shouldbind to. In that case,
                # configure the *host* addressof the interface
                # instead:
                # bindnetaddr: 192.168.1.1
                # When selecting a multicastaddress, consider RFC
                # 2365 (which, among otherthings, specifies that
                # 239.255.x.x addresses areleft to the discretion of
                # the network administrator).Do not reuse multicast
                # addresses across multipleCorosync clusters sharing
                # the same network.
                #定义组播地址
                mcastaddr: 239.224.131.31
                # Corosync uses the port youspecify here for UDP
                # messaging, and also theimmediately preceding
                # port. Thus if you set this to5405, Corosync sends
                # messages over UDP ports 5405and 5404.
                #信息传递端口
                mcastport: 5405
                # Time-to-live for clustercommunication packets. The
                # number of hops (routers) thatthis ring will allow
                # itself to pass. Note thatmulticast routing must be
                # specifically enabled on mostnetwork routers.
                ttl: 1
       }
}
 
logging {
       # Log the source file and line where messages are being
       # generated. When in doubt, leave off. Potentially useful for
       # debugging.
       fileline: off
       # Log to standard error. When in doubt, set to no. Useful when
       # running in the foreground (when invoking "corosync -f")
       to_stderr: no
       # Log to a log file. When set to "no", the "logfile"option
       # must not be set.
       #定义日志记录存放
       to_logfile: yes
       logfile: /var/log/cluster/corosync.log
       # Log to the system log daemon. When in doubt, set to yes.
       #to_syslog: yes
       # Log debug messages (very verbose). When in doubt, leave off.
       debug: off
       # Log messages with time stamps. When in doubt, set to on
       # (unless you are only logging to syslog, where double
       # timestamps can be annoying).
       timestamp: on
       logger_subsys {
                subsys: AMF
               debug: off
       }
}
 
#以插件方式启动pacemaker：
service {
       ver:    0
       name:   pacemaker
}

3.生成认证密钥文件：认证密钥文件需要1024字节，手动写入太麻烦了,我们可以下载程序包来实现写满内存的熵池实现，

[root@node1 corosync]# corosync-keygen
Corosync Cluster Engine Authentication key generator.
Gathering 1024 bits for key from/dev/random.
Press keys on your keyboard to generateentropy.
Press keys on your keyboard to generateentropy (bits = 128).
Press keys on your keyboard to generateentropy (bits = 192).
Press keys on your keyboard to generateentropy (bits = 256).
Press keys on your keyboard to generateentropy (bits = 320).
Press keys on your keyboard to generateentropy (bits = 384).
Press keys on your keyboard to generateentropy (bits = 448).
Press keys on your keyboard to generateentropy (bits = 512).
Press keys on your keyboard to generateentropy (bits = 576).
Press keys on your keyboard to generateentropy (bits = 640).
Press keys on your keyboard to generateentropy (bits = 704).
Press keys on your keyboard to generate entropy(bits = 768).
Press keys on your keyboard to generateentropy (bits = 832).
Press keys on your keyboard to generateentropy (bits = 896).
Press keys on your keyboard to generateentropy (bits = 960).
Writing corosync key to/etc/corosync/authkey.

随便下载神马程序都行！

完成后将配置文件及认证密钥复制一份到节点2：

[root@node1 corosync]# scp authkeycorosync.conf node2:/etc/corosync/
authkey                                      100%  128     0.1KB/s  00:00   
corosync.conf                                 100% 2724     2.7KB/s  00:00

4.启动corosync服务：

[root@node1 corosync]# service corosyncstart
Starting Corosync Cluster Engine(corosync):               [  OK  ]
 
[root@node2 ~]# service corosync start
Starting Corosync Cluster Engine(corosync):               [  OK  ]

5.查看日志：

查看corosync引擎是否正常启动：

节点1的启动日志：

[root@node1 corosync]# grep -e"Corosync Cluster Engine" -e "configuration file"
/var/log/cluster/corosync.log
Jan 02 14:20:28 corosync [MAIN  ] Corosync Cluster Engine ('1.4.7'): startedand
ready to provide service.
Jan 02 14:20:28 corosync [MAIN  ] Successfully read main configuration file
'/etc/corosync/corosync.conf'.

节点2的启动日志：

[root@node2 ~]# grep -e "CorosyncCluster Engine" -e "configuration file"
/var/log/cluster/corosync.log
Jan 02 14:20:39 corosync [MAIN  ] Corosync Cluster Engine ('1.4.7'): startedand
ready to provide service.
Jan 02 14:20:39 corosync [MAIN  ] Successfully read main configuration file
'/etc/corosync/corosync.conf'.

查看关键字TOTEM，初始化成员节点通知是否发出:

[root@node1 corosync]# grep"TOTEM" /var/log/cluster/corosync.log
Jan 02 14:20:28 corosync [TOTEM ]Initializing transport (UDP/IP Multicast).
Jan 02 14:20:28 corosync [TOTEM ]Initializing transmit/receive security:
libtomcrypt SOBER128/SHA1HMAC (mode 0).
Jan 02 14:20:28 corosync [TOTEM ] Thenetwork interface [172.16.31.10] is now up.
Jan 02 14:20:28 corosync [TOTEM ] Aprocessor joined or left the membership and a
new membership was formed.
Jan 02 14:20:37 corosync [TOTEM ] Aprocessor joined or left the membership and a
new membership was formed.

查看监听端口5405是否开启：

[root@node1 ~]# ss -tunl |grep 5405
udp   UNCONN     0      0           172.16.31.10:5405                  *:*    
udp   UNCONN     0      0        239.224.131.31:5405                 *:*

查看错误日志：

[root@node1 ~]# grep ERROR/var/log/cluster/corosync.log
#警告信息：将pacemaker以插件运行的告警，忽略即可
Jan 02 14:20:28 corosync [pcmk  ] ERROR: process_ais_conf: You haveconfigured a
cluster using the Pacemaker plugin for Corosync.The plugin is not supported in this
environment and will be removed very soon.
Jan 02 14:20:28 corosync [pcmk  ] ERROR: process_ais_conf:  Please see Chapter 8 of
'Clusters from Scratch'(http://www.clusterlabs.org/doc) for details on using
Pacemaker with CMAN
Jan 02 14:20:52 [6260] node1.stu31.com    pengine:  notice: process_pe_message:    
  Configuration ERRORs found during PE processing.  Please run "crm_verify -L" to
identify issues.
Jan 02 14:20:52 [6260] node1.stu31.com    pengine:  notice: process_pe_message:    
  Configuration ERRORs found during PE processing.  Please run "crm_verify -L" to
identify issues.

[root@node1 ~]# crm_verify -L -V   
#无stonith设备的警告信息，可以忽略            
  error: unpack_resources:    Resource start-up disabled since no STONITH
resources have been defined
  error: unpack_resources:    Either configure some or disable STONITH with the
stonith-enabled option
  error: unpack_resources:     NOTE:Clusters with shared data need STONITH to
ensure data integrity
Errors found during check: config not valid

六.集群配置工具安装：crmsh软件安装

1.配置yum源：我这里存在一个完整的yum源服务器

[root@node1 yum.repos.d]# vimcentos6.6.repo
[base]
name=CentOS $releasever $basearch on localserver 172.16.0.1
baseurl=http://172.16.0.1/cobbler/ks_mirror/CentOS-6.6-$basearch/
gpgcheck=0
 
[extra]
name=CentOS $releasever $basearch extras
baseurl=http://172.16.0.1/centos/$releasever/extras/$basearch/
gpgcheck=0
 
[epel]
name=Fedora EPEL for CentOS$releasever$basearch on local server 172.16.0.1
baseurl=http://172.16.0.1/fedora-epel/$releasever/$basearch/
gpgcheck=0
 
[corosync2]
name=corosync2
baseurl=ftp://172.16.0.1/pub/Sources/6.x86_64/corosync/
gpgcheck=0

复制一份到节点2：

[root@node1 ~]# scp /etc/yum.repos.d/centos6.6.reponode2:/etc/yum.repos.d/
centos6.6.repo                                100%  521    0.5KB/s   00:00

2.安装crmsh软件，2各节点都安装

# yum install -y crmsh
# rpm -qa crmsh
crmsh-2.1-1.6.x86_64

3.去除上面的stonith设备警告错误：

[root@node1 ~]# crm
crm(live)# configure
crm(live)configure# propertystonith-enabled=false
crm(live)configure# verify
#双节点需要仲裁，或者忽略(会造成集群分裂）
crm(live)configure# propertyno-quorum-policy=ignore
crm(live)configure# verify
crm(live)configure# commit
crm(live)configure# show
node node1.stu31.com
node node2.stu31.com
property cib-bootstrap-options: \
       dc-version=1.1.11-97629de \
       cluster-infrastructure="classic openais (with plugin)" \
       expected-quorum-votes=2 \
       stonith-enabled=false \
       no-quorum-policy=ignore

无错误信息输出了：

[root@node1 ~]# crm_verify -L -V
[root@node1 ~]#

七.将DRBD定义为集群服务

1.按照集群服务的要求，首先确保两个节点上的drbd服务已经停止，且不会随系统启动而自动启动：

[root@node1 ~]# drbd-overview
 0:mystore/0 Unconfigured . .
[root@node1 ~]# chkconfig --list drbd
drbd           0:off   1:off  2:off   3:off   4:off  5:off   6:off

2.配置drbd为集群资源：

提供drbd的RA目前由OCF归类为linbit，其路径为/usr/lib/ocf/resource.d/linbit/drbd。我们可以使用如下命令来查看此RA及RA的meta信息：

[root@node1 ~]# crm ra classes
lsb
ocf / heartbeat linbit pacemaker
service
stonith
[root@node1 ~]# crm ra list ocf linbit
drbd

下面命令可以查看详细信息

[root@node1 ~]# crm ra info ocf:linbit:drbd

输出内容略

drbd需要同时运行在两个节点上，但只能有一个节点（primary/secondary模型）是Master，而另一个节点为Slave；因此，它是一种比较特殊的集群资源，其资源类型为多态（Multi-state）clone类型，即主机节点有Master和Slave之分，且要求服务刚启动时两个节点都处于slave状态。

开始定义集群资源：

[root@node1 ~]# crm configure
crm(live)configure# primitive mydrbdocf:linbit:drbd params drbd_resource="mystore"
op monitor role=Slave interval=20stimeout=20s op monitor role=Master interval=10s
timeout=20s op start timeout=240s op stoptimeout=100s
crm(live)configure# verify
将集群资源设置为主从模式：
crm(live)configure# ms ms_mydrbd mydrbdmeta master-max="1" master-node-max="1"
clone-max="2"clone-node-max="1" notify="true"
crm(live)configure# verify
crm(live)configure# show
node node1.stu31.com
node node2.stu31.com
primitive mydrbd ocf:linbit:drbd \
       params drbd_resource=mystore \
       op monitor role=Slave interval=20s timeout=20s \
       op monitor role=Master interval=10s timeout=20s \
       op start timeout=240s interval=0 \
       op stop timeout=100s interval=0
ms ms_mydrbd mydrbd \
       meta master-max=1 master-node-max=1 clone-max=2 clone-node-max=1notify=true
property cib-bootstrap-options: \
       dc-version=1.1.11-97629de \
       cluster-infrastructure="classic openais (with plugin)" \
       expected-quorum-votes=2 \
       stonith-enabled=false \
       no-quorum-policy=ignore
crm(live)configure# commit
crm(live)configure# cd
crm(live)# status
Last updated: Sat Jan  3 11:22:54 2015
Last change: Sat Jan  3 11:22:50 2015
Stack: classic openais (with plugin)
Current DC: node1.stu31.com - partitionwith quorum
Version: 1.1.11-97629de
2 Nodes configured, 2 expected votes
2 Resources configured
 
 
Online: [ node1.stu31.com node2.stu31.com ]
 
 Master/Slave Set: ms_mydrbd [mydrbd]
    Masters: [ node2.stu31.com ]
    Slaves: [ node1.stu31.com ]

#master-max：有几个主资源master-node-max: 1个节点上最多运行的主资源

#clone-max：有几个克隆资源clone-node-max:1个节点上最多运行的克隆资源

#主从资源也是克隆资源的一种的，只不过它有主从关系

查看drbd的主从状态：

[root@node1 ~]# drbd-overview
 0:mystore/0 Connected Secondary/Primary UpToDate/UpToDate
 
[root@node2 ~]# drbd-overview
 0:mystore/0 Connected Primary/Secondary UpToDate/UpToDate

将node2降级成从节点并上线：

[root@node2 ~]# crm node standby
[root@node2 ~]# drbd-overview
 0:mystore/0 Unconfigured . .
[root@node2 ~]# crm node online
[root@node2 ~]# drbd-overview 
 0:mystore/0  Connected Secondary/Primary UpToDate/UpToDate

那么node1就成为主节点了：

[root@node1 ~]# drbd-overview
 0:mystore/0 Connected Primary/Secondary UpToDate/UpToDate

3.定义DRBD存储自动挂载，主节点在哪里，存储就在哪里，需要定义约束

crm(live)# configure
crm(live)configure# primitive myfsocf:heartbeat:Filesystem params device=/dev/drbd0
directory=/mydata fstype="ext4"op monitor interval=20s timeout=40s op start
timeout=60s op stop timeout=60s
crm(live)configure# verify
#定义协同约束，主节点在哪里启动，存储就跟随主节点
crm(live)configure# colocation myfs_with_ms_mydrbd_masterinf: myfs ms_mydrbd:Master
#定义顺序约束，主角色提升完成后才启动存储
crm(live)configure# orderms_mydrbd_master_before_myfs inf: ms_mydrbd:promote
myfs:start
crm(live)configure# verify
crm(live)configure# commit
crm(live)configure# cd
crm(live)# status
Last updated: Sat Jan  3 11:34:23 2015
Last change: Sat Jan  3 11:34:12 2015
Stack: classic openais (with plugin)
Current DC: node1.stu31.com - partitionwith quorum
Version: 1.1.11-97629de
2 Nodes configured, 2 expected votes
3 Resources configured
 
 
Online: [ node1.stu31.com node2.stu31.com ]
 
 Master/Slave Set: ms_mydrbd [mydrbd]
    Masters: [ node1.stu31.com ]
    Slaves: [ node2.stu31.com ]
 myfs  (ocf::heartbeat:Filesystem):   Started node1.stu31.com

可以知道主节点是node1，存储也是挂载在节点1上的。

查看挂载的目录：文件存在，挂载成功

[root@node1 ~]# ls /mydata
issue lost+found

主从资源，文件系统挂载都完成了，下面就开始安装mariadb数据库了！

八.安装mariadb数据库

1.初始化安装mariadb必须在主节点进行：

创建用户mysql管理数据库及配置数据存储目录权限为mysql，两个节点都需要创建用户

# groupadd -r -g 306 mysql
# useradd -r -g 306 -u 306 mysql

获取mariadb的二进制安装包：

mariadb-10.0.10-linux-x86_64.tar.gz

解压至/usr/local目录中：

[root@node1 ~]# tar xfmariadb-10.0.10-linux-x86_64.tar.gz -C /usr/local/

创建软链接：

[root@node1 ~]# cd /usr/local
[root@node1 local]# ln -svmariadb-10.0.10-linux-x86_64/ mysql

在挂载的DRBD存储上创建数据库数据存放目录：

# chown -R mysql:mysql /mydata/

进入安装目录：

[root@node1 local]# cd mysql
[root@node1 mysql]# pwd
/usr/local/mysql
[root@node1 mysql]# chown -R root:mysql ./*

初始化安装mariadb：

[root@node1 mysql]#scripts/mysql_install_db --user=mysql --datadir=/mydata/data

安装完成后查看数据存放目录：

[root@node1 mysql]# ls /mydata/data/
aria_log.00000001  ibdata1     ib_logfile1  performance_schema
aria_log_control   ib_logfile0 mysql        test

安装成功！

mariadb配置文件的存放，如果我们希望一个节点的配置文件更改后，备节点同步更新，那么配置文件需要存放在drbd存储上是最合适的！

[root@node1 mysql]# mkdir /mydata/mysql/
[root@node1 mysql]# chown -R mysql:mysql  /mydata/mysql/
[root@node1 mysql]# cp support-files/my-large.cnf /mydata/mysql/my.cnf
[root@node1 mysql]# vim  /mydata/mysql/my.cnf
[mysqld]
port            = 3306
datadir = /mydata/data
socket          = /tmp/mysql.sock
skip-external-locking
key_buffer_size = 256M
max_allowed_packet = 1M
table_open_cache = 256
sort_buffer_size = 1M
read_buffer_size = 1M
read_rnd_buffer_size = 4M
myisam_sort_buffer_size = 64M
thread_cache_size = 8
query_cache_size= 16M
# Try number of CPU's*2 forthread_concurrency
thread_concurrency = 8
innodb_file_per_table = on
skip_name_resolve = on

在本地创建软链接指向配置文件目录：

[root@node1 ~]# ln -sv /mydata/mysql/etc/mysql
`/etc/mysql' -> `/mydata/mysql'

服务脚本的创建：

[root@node1 mysql]# cpsupport-files/mysql.server /etc/init.d/mysqld
[root@node1 mysql]# chkconfig --add mysqld

启动服务测试：

[root@node1 mysql]# service mysqld start
Starting MySQL.                                           [  OK  ]

登录mysql创建数据库：

[root@node1 mysql]#/usr/local/mysql/bin/mysql
Welcome to the MariaDB monitor.  Commands end with ; or \g.
Your MariaDB connection id is 4
Server version: 10.0.10-MariaDB-log MariaDBServer
 
Copyright (c) 2000, 2014, Oracle, SkySQL Aband others.
 
Type 'help;' or '\h' for help. Type '\c' toclear the current input statement.
 
MariaDB [(none)]> create databasetestdb;
Query OK, 1 row affected (0.00 sec)
 
MariaDB [(none)]> \q
Bye

停止mysql服务器：

[root@node1 mysql]# service mysqld stop
Shutting down MySQL..                                      [ OK  ]

2.节点2也要配置mariadb

切换node1为从节点：

[root@node1 ~]# crm node standby
[root@node1 ~]# crm status
Last updated: Sat Jan  3 12:21:38 2015
Last change: Sat Jan  3 12:21:34 2015
Stack: classic openais (with plugin)
Current DC: node1.stu31.com - partitionwith quorum
Version: 1.1.11-97629de
2 Nodes configured, 2 expected votes
3 Resources configured
 
 
Node node1.stu31.com: standby
Online: [ node2.stu31.com ]
 
 Master/Slave Set: ms_mydrbd [mydrbd]
    Masters: [ node2.stu31.com ]
    Stopped: [ node1.stu31.com ]
 myfs  (ocf::heartbeat:Filesystem):   Started node2.stu31.com

让node1从节点上线：

[root@node1 ~]# crm node online
[root@node1 ~]# crm status
Last updated: Sat Jan  3 12:21:52 2015
Last change: Sat Jan  3 12:21:48 2015
Stack: classic openais (with plugin)
Current DC: node1.stu31.com - partitionwith quorum
Version: 1.1.11-97629de
2 Nodes configured, 2 expected votes
3 Resources configured
 
 
Online: [ node1.stu31.com node2.stu31.com ]
 
 Master/Slave Set: ms_mydrbd [mydrbd]
    Masters: [ node2.stu31.com ]
    Slaves: [ node1.stu31.com ]
 myfs  (ocf::heartbeat:Filesystem):   Started node2.stu31.com

mariadb程序包解压：

[root@node2 ~]# tar xfmariadb-10.0.10-linux-x86_64.tar.gz -C /usr/local
[root@node2 ~]# cd /usr/local
[root@node2 local]# ln -sv mariadb-10.0.10-linux-x86_64/mysql
`mysql' ->`mariadb-10.0.10-linux-x86_64/'
[root@node2 local]# cd mysql
[root@node2 mysql]# chown -R root:mysql ./*

不需要初始化安装了！

查看节点2的存储挂载完成与否：

[root@node2 local]# ls /mydata/data/
aria_log.00000001  ib_logfile1        mysql-bin.index     testdb
aria_log_control   multi-master.info  mysql-bin.state
ibdata1            mysql              performance_schema
ib_logfile0        mysql-bin.000001   test

成功挂载：

只需要服务脚本了：

[root@node2 mysql]# cpsupport-files/mysql.server /etc/init.d/mysqld
[root@node2 mysql]# chkconfig --add mysqld
[root@node2 mysql]# chkconfig mysqld off

创建软链接将存储的配置文件定位到/etc/下，方便mysql启动：

[root@node2 ~]# ln -sv /mydata/mysql//etc/mysql
`/etc/mysql' -> `/mydata/mysql/'

启动mysqld服务：

[root@node2 ~]# service mysqld start
Starting MySQL...                                         [  OK  ]
[root@node2 ~]# /usr/local/mysql/bin/mysql
Welcome to the MariaDB monitor.  Commands end with ; or \g.
Your MariaDB connection id is 4
Server version: 10.0.10-MariaDB-log MariaDBServer
 
Copyright (c) 2000, 2014, Oracle, SkySQL Aband others.
 
Type 'help;' or '\h' for help. Type '\c' toclear the current input statement.
 
MariaDB [(none)]> show databases;
+--------------------+
| Database           |
+--------------------+
| information_schema |
| mysql              |
| performance_schema |
| test               |
| testdb             |
+--------------------+
5 rows in set (0.04 sec)
 
MariaDB [(none)]> grant all on *.* to'root'@'172.16.%.%' identified by 'oracle';
Query OK, 0 rows affected (0.00 sec)
 
MariaDB [(none)]> flush privileges;
Query OK, 0 rows affected (0.00 sec)
 
MariaDB [(none)]> \q
Bye

可以看出数据库是有testdb的！！！

同步过来了！我们授权一下远程客户端可以登录！

两个节点都安装好了mariadb，

九.定义mariadb数据库集群服务资源

[root@node2 ~]# crm
crm(live)# configure
#定义数据库集群的VIP
crm(live)configure# primitive myipocf:heartbeat:IPaddr params ip="172.16.31.166" op
monitor interval=10s timeout=20s
crm(live)configure# verify
#定义数据库集群的服务资源mysqld
crm(live)configure# primitive myserverlsb:mysqld op monitor interval=20s
timeout=20s
crm(live)configure# verify
#将资源加入资源组，进行结合资源在一起
crm(live)configure# group myservice myipms_mydrbd:Master myfs myserver
ERROR: myservice refers to missing objectms_mydrbd:Master
INFO: resource references incolocation:myfs_with_ms_mydrbd_master updated
INFO: resource references inorder:ms_mydrbd_master_before_myfs updated
#定义资源顺序约束，启动好myfs资源后再启动myserver资源：
crm(live)configure# ordermyfs_before_myserver inf: myfs:start myserver:start
crm(live)configure# verify
#所有都定义完成后就提交！可能mysql服务启动有点慢，等一下即可！
crm(live)configure# commit
crm(live)configure# cd
crm(live)# status
Last updated: Sat Jan  3 13:42:13 2015
Last change: Sat Jan  3 13:41:48 2015
Stack: classic openais (with plugin)
Current DC: node1.stu31.com - partitionwith quorum
Version: 1.1.11-97629de
2 Nodes configured, 2 expected votes
5 Resources configured
 
 
Online: [ node1.stu31.com node2.stu31.com ]
 
 Master/Slave Set: ms_mydrbd [mydrbd]
    Masters: [ node2.stu31.com ]
    Slaves: [ node1.stu31.com ]
 Resource Group: myservice
    myip      (ocf::heartbeat:IPaddr):       Started node2.stu31.com
    myfs      (ocf::heartbeat:Filesystem):   Started node2.stu31.com
    myserver   (lsb:mysqld):   Started node2.stu31.com

启动完成后，我们在远程客户端上连接数据库进行测试：

[root@nfs ~]# mysql -h 172.16.31.166 -uroot -poracle
Welcome to the MySQL monitor.  Commands end with ; or \g.
Your MySQL connection id is 4
Server version: 5.5.5-10.0.10-MariaDB-logMariaDB Server
 
Copyright (c) 2000, 2013, Oracle and/or itsaffiliates. All rights reserved.
 
Oracle is a registered trademark of OracleCorporation and/or its
affiliates. Other names may be trademarksof their respective
owners.
 
Type 'help;' or '\h' for help. Type '\c' toclear the current input statement.
 
mysql> show databases;
+--------------------+
| Database           |
+--------------------+
| information_schema |
| mysql              |
| performance_schema |
| test               |
| testdb             |
+--------------------+
5 rows in set (0.05 sec)
 
mysql> use testdb
Database changed
mysql> create table t1 (id int);
Query OK, 0 rows affected (0.18 sec)
 
mysql> show tables;
+------------------+
| Tables_in_testdb |
+------------------+
| t1               |
+------------------+
1 row in set (0.01 sec)
 
mysql> \q
Bye

将节点2切换为备节点，让node1成为主节点：

[root@node2 ~]# crm node standby

输入切换指令后我们监控node1转换成主节点的过程：

查看节点1的集群状态信息：

[root@node1 ~]# crm status
Last updated: Sat Jan  3 13:59:38 2015
Last change: Sat Jan  3 13:48:49 2015
Stack: classic openais (with plugin)
Current DC: node1.stu31.com - partitionwith quorum
Version: 1.1.11-97629de
2 Nodes configured, 2 expected votes
5 Resources configured
 
 
Node node2.stu31.com: standby
Online: [ node1.stu31.com ]
 
 Master/Slave Set: ms_mydrbd [mydrbd]
    Masters: [ node1.stu31.com ]
    Stopped: [ node2.stu31.com ]
 Resource Group: myservice
    myip      (ocf::heartbeat:IPaddr):       Started node1.stu31.com
    myfs      (ocf::heartbeat:Filesystem):   Started node1.stu31.com
    myserver   (lsb:mysqld):   Started node1.stu31.com

再次远程连接数据库测试：

[root@nfs ~]# mysql -h 172.16.31.166 -uroot -poracle
Welcome to the MySQL monitor.  Commands end with ; or \g.
Your MySQL connection id is 4
Server version: 5.5.5-10.0.10-MariaDB-logMariaDB Server
 
Copyright (c) 2000, 2013, Oracle and/or itsaffiliates. All rights reserved.
 
Oracle is a registered trademark of OracleCorporation and/or its
affiliates. Other names may be trademarksof their respective
owners.
 
Type 'help;' or '\h' for help. Type '\c' toclear the current input statement.
 
mysql> use testdb;
Reading table information for completion oftable and column names
You can turn off this feature to get aquicker startup with -A
 
Database changed
mysql> show tables;
+------------------+
| Tables_in_testdb |
+------------------+
| t1               |
+------------------+
1 row in set (0.00 sec)
 
mysql> \q
Bye

测试成功，同步完成！

至此，corosync+pacemaker+crmsh+DRBD实现数据库服务器高可用性集群的搭建就完成了！！！

你可能感兴趣的:(pacemaker,corosync,crmsh)

oracle提供两个命令,两条命令彻底杀死oracle Tanuo oracle提供两个命令
今天编写的两条极具杀伤力的命令，它可以瞬间将Oracle杀死在无形之中。后面我将给出简单注释并展示一下它的威力。$ps-ef|grep$ORACLE_SID|grep-vgrep|awk'{print$2}'|xargskill-9$ipcs-m|greporacle|awk'{print$2}'|xargsipcrmshm这两条命令的来由：今天处理了三起Oracle数据库无故无法登录的问题，无论
使用Nginx + Keepalived配置实现Web站点高可用方案夜影风 linux系统管理 Architecture nginx 前端智能路由器
1.概述1.1Keepalived介绍Keepalived是一个基于VRRP协议来实现的服务高可用方案，可以利用其来避免IP单点故障，类似的工具还有heartbeat、corosync、pacemaker。但是它一般不会单独出现，而是与其它负载均衡技术（如LVS、HAProxy、Nginx）一起工作来达到集群的高可用。VRRP（VirtualRouterRedundancyProtocol），即虚
PCS 管理 PostgreSQL 高可用集群取个名真难呀 postgresql 数据库
以下是使用Pacemaker/Corosync(PCS)管理PostgreSQL高可用集群的详细实现方案。该方案基于流复制（StreamingReplication）和自动故障转移，确保数据库服务的高可用性。一、环境准备节点规划|节点名称|IP地址|角色||-------------|--------------|--------------------||node1|192.168.1.101|
heartbeat + pacemaker实现pg流复制自动切换（二） weixin_34308389 数据库网络运维
五、测试5.1备节点失效在node2上杀死postgres数据库进程，模拟备节点上数据库崩溃：[root@node2 ~]# killall -9 postgres查看此时集群状态：[root@node1 ~]# crm_mon -Afr1============Last updated: Mon Jan 27 08:36:49 2014Stack: HeartbeatCurrent DC: no
RHCA核心课程技术解析5：红帽高可用性集群架构与深度实践噗老师华为认证架构 java 服务器红帽认证 Linux RHCA
一、红帽高可用集群架构全景1.1核心组件交互逻辑graphTDA[节点1]-->|Corosync心跳|B[节点2]A-->|Pacemaker资源管理|C[共享存储]B-->CD[Fencing设备]-->|STONITH|AD-->|STONITH|BC-->|GFS2锁管理|AC-->|GFS2锁管理|B1.2集群服务层次模型层级组件关键功能消息层Corosync节点间心跳与仲裁资源层Pac
Openstack云平台脚本部署之Galera高可用集群配置（二）梅馨嫣栀云计算云计算 devops
目录一、概述二、Pacemaker配置三、Haproxy配置四、MariaDBGalera配置五、参考文档六、系列文章一、概述社区文档中，Openstack的高可用架构采用“Pacemkaer+Haproxy+Galera”的架构，数据库服务的高可用采用Galera同步复制的多主数据库集群，在三个控制节点分别安装MariaDB，然后构建Galera多主集群，数据库后台会进行更新数据的同步复制。使用
postgresql 集群文档 st780206 postgresql postgresql 数据库
https://www.cnblogs.com/Alicebat/p/14148933.html[命令]Pacemaker命令pcscluster（管理节点）–EternalCenterPostgreSQL实战之物理复制和逻辑复制（五）_postgresql流复制和物理复制-CSDN博客https://jingyan.baidu.com/article/a378c9606f059df3292830
【pacemaker pcs】* Node X : UNCLEAN (offline) 康雨城 linux pcs pacemaker
背景在配置PCS的时候，找了两个节点分别做好了配置4.3.创建高可用性集群RedHatEnterpriseLinux8|RedHatCustomerPortal但是发现，NodeList:*Nodemaster:UNCLEAN(offline)*Nodemon-node1:UNCLEAN(offline)排查排查发现原来是时间不一致导致修复通过ntp同步一下时间就可以了#安装工具yum-yinst
Proxmox VE退出集群模式传说中的暗暗 Linux PVE Proxmox
有2台PVE集群，一台突然当机了，然后一时半会也弄不好，这时候操作虚拟机重启的话会导致联系不到集群服务器导致虚拟机起不来，快速解决方法就是将集群服务停止。通过SSH连上PVE主机，直接输入下面的命令就可以完全退出集群服务停止cluster服务systemctlstoppve-cluster.servicesystemctlstopcorosync.service设置本地模式pmxcfs-l删除co
分布式一致性协议 growdu
分布式一致性协议当前业界主流的分布式一致性协议主要有如下几种：totem协议（简单即有效）totem协议，全称是TheTotemSingle-RingOrderingandMembershipProtocol，是一个基于令牌环的分布式一致性算法。corosync基于totem协议实现。paxos协议（二阶段提交）raft协议（二阶段提交，基于paxos协议完善和改进）Raft协议就是Paxos的衍
回顾 2023 这一年的进展，哪些 AI 公司让你觉得未来可期？网罗开发 AIGC 人工智能
文章目录前言行业趋势1、OpenAI成立于2015年2、Tome成立于2020年3、Synthesia成立于2017年4、Uizard成立于2018年5、Soundful成立于2019年6、GoodVision成立于2017年7、Writesonic成立于2021年8、AtomicAI成立于2020年9、Eightfold成立于2016年10、SpacemakerAI成立于2016年11、Deep
部署Openstack HA 叮咚网工 openstack 云计算 linux服务器 openstack linux 运维服务器虚拟化分布式
一、技术介绍Heartbeat与Corosync是流行的MessagingLayer（集群信息层），Pacemaker是最流行的CRM（集群资源管理器），同时Corosync+Pacemaker是最流行的高可用集群的套件，使用DRBD+Pacemaker+Corosync部署OpenStackHA。二、安装前准备1、常规初始化操作两个个节点都需要执行hostnamectlset-hostnamec
MFS分布式文件系统 Hongx06 kubernetes docker 容器
目录集群部署MasterServersChunkservers编辑ClientsStorageClassesLABELmfs高可用pacemaker高可用编辑ISCSI添加集群资源主机ip角色server1192.168.81.11MasterServersserver2192.168.81.12Chunkserversserver3192.168.81.13Chunkserversserver4
kubernetes集群编排（13） Hongx06 kubernetes 容器云原生
目录k8s高可用集群haproxy负载均衡pacemaker高可用部署control-plane部署workernodek8s高可用集群实验环境主机名IP角色k8s1192.168.81.10harbork8s2192.168.81.11control-planek8s3192.168.81.12control-planek8s4192.168.81.13control-planek8s5192.
kubernetes集群编排——k8s高可用集群 HaoJl09 kubernetes集群编排 kubernetes 容器云原生
实验环境主机名IP角色k8s1192.168.92.11harbork8s2192.168.92.12control-planek8s3192.168.92.13control-planek8s4192.168.92.14control-planek8s5192.168.92.15haproxy,pacemakerk8s6192.168.92.16haproxy,pacemakerk8s7192.
kubernetes 高可用集群 Mlul392 kubernetes kubernetes 容器
目录一、haproxy负载均衡二、pacemaker高可用三、部署control-plane四、部署workernode实验环境主机名IP角色docker192.168.67.10harbork8s1192.168.67.11control-planek8s2192.168.67.12control-planek8s3192.168.67.13control-planek8s4192.168.56
四层负载均衡(haproxy实现) w1n0
文章目录haproxy安装使用效果日志管理效果管理页面调度算法效果acl访问控制动静分离读写分离结合keepalived实现高可用安装测试VIP设置脚本检查haproxy状态效果haproxy+pacemaker配置PCSDhaproxyhaproxy是一种web服务解决方案，HAProxy提供高可用性、负载均衡以及基于TCP和HTTP应用的代理，支持虚拟主机，它是免费、快速并且可靠的一种解决方案
【PostgreSQL高可用之Repmgr和Patroni部分场景对比】小怪兽ysl PostgreSQL 数据库服务器 postgresql
PostgreSQL数据库有着各种各样的高可用方案，绝大多数，都是基于流复制机制实现的，常见的例如Patroni+DCS,Pacemaker+Corosync,Repmgr，keepalived，pg_auto_failover，PGpool等等，其中使用较多的应该是Patroni和Repmgr两种，下文针对PostgreSQ的两种高可用方案Repmgr和Patroni进行部分场景对比。一、Rep
Nginx + keepalived 实现双机热备无与伦比jia linux Nginx 服务器 Nginx Keepalived
Nginx+keepalivedkeepalived简介Keepalived是一个基于VRRP协议来实现的服务高可用方案，可以利用其来避免IP单点故障，类似的工具还有heartbeat、corosync、pacemaker。但是它一般不会单独出现，而是与其它负载均衡技术（如lvs、haproxy、nginx）一起工作来达到集群的高可用。VRRP协议VRRP全称VirtualRouterRedund
Pacemaker中的资源管理工具--CRM基本指令及用法 Mumunu- pacmaker
配置pacemaker有2种途径，一是命令行工具包括crm和pcs，二是图形工具包括：pygui(mgmt),Hawk,LCMC,pcsd.mgmt出道时间较早，很多文章有介绍；LCMC是Java编写的图形管理工具；Hawk则是官方推荐的代替mgmt的web界面配置工具；pcsd则是pcs的图形界面。具体可参考本文主要介绍命令行工具crm,而pcs和crm相似，语法稍有不同，掌握crm后使用pcs
国家及校级奖项、称号（中英对照） huanhuan_tiantian 工作
国家奖学金NationalScholarship国家励志奖学金NationalEncouragementscholarship三好学生标兵PacemakertoMeritStudent三好学生MeritStudent学习优秀生ModelStudentofAcademicRecords突出才能奖ModelStudentofOutstandingCapacity先进个人AdvancedIndividu
Arch Linux源码安装corosync成功乡路 Linux 编译
ArchLinux源码安装corosync成功[xy@archlinux~]$uname-rp5.13.5-arch1-1unknown[xy@archlinux~]$cat/etc/os-releaseNAME=“ArchLinux”直接安装找不到[xy@archlinux~]$sudopacman-Spacemakererror:targetnotfound:pacemakerarch网站也搜
corosync+pacemaker+nfs配置简单高可用吃面包的刺猬 linux 服务器运维
环境准备：每个节点提供20G共享存储web1192.168.134.176node7web2192.168.134.177node8一、准备web环境（两台web测试机都要准备）yuminstallhttpd-yecho"webtestpage,ipis`hostname-I`.">/var/www/html/index.htmlsystemctlstarthttpd二、做两个节点免密登录，和配置
euler欧拉系统尝试用yum、源码安装pacemaker失败乡路 Linux euler pacemaker
euler欧拉系统尝试用yum、源码安装pacemaker失败用yum安装pacemaker======================================[root@euler~]#uname-rp3.10.0-862.14.1.0.h209.eulerosv2r7.x86_64x86_64不能自动安装[root@euler~]#yuminstallpacemakerLoadedpl
FreeSwitch 使用keepalived进行主备切换高可用部署 xiedy001 freeswitch 服务器运维
FreeSWITCH的高可用部署方式有两种：主备切换和负载均衡，官方文档介绍的主备切换部署是采用Corosync&Pacemaker，负载均衡采用前置opensips。但对使用keepalived进行主备切换的高可用方式没有介绍，同时网上对该种部署方式也没有介绍。本人对Corosync&Pacemaker不熟悉，目前在职的公司web应用大部分采用keepalived+haproxy，所以对keep
【MogDB/openGauss与PG的repmgr对比】小怪兽ysl openGauss 数据库运维 linux
提到PG的repmgr，大家可能并不陌生，他是现在PG比较流行的一套开源工具，用于管理PostgreSQL服务器集群中的复制管理和故障转移，也就是相当于一个集群管理+HA工具。当前PG的高可用方案，大致有keepalived、pgpool、repmgr、pacemaker+corosync、etcd+patroni等等。其中etcd+patroni和repmgr是目前用的较多的高可用。patron
corosync-qdevice中ffsplit与lsm算法的区别 growdu_real corosync 集群服务器 linux corosync 集群
corosync-qdevice中ffsplit与lsm算法的区别corosync-qdevice目前支持两种算法来设置corosync-qnetd如何为给定的节点或者分区提供投票的行为。ffsplit五五平分算法。这仅对具有偶数个节点的集群有意义。它只为活动节点数最多的分区提供一票。如果有两个完全相同的分区，它将投票给得分较高的分区。分数计算规则为：连接节点数+启发式通过的连接节点数-启发式失败
corosync-qnetd投票机制 growdu_real corosync 集群服务器 linux 集群 corosync
corosync-qnetd投票机制corosync-qnetd是corosync的第三方仲裁机制，当corosync出现网络分区时，集群内部无法选择出quorate一方时，就会借助corosync-qnetd来进行辅助投票。corosync-qnetd作为服务端，会根据各分区连接到qnetd的客户端数目，完成启发式算法的客户端数目等信息来对各分区节点进行投票corosync-qdevice作为客
一台主机运行多个corosync代码分析 growdu_real corosync 数据库大数据集群 corosync
一台主机运行多个corosync代码分析corosync当前设计为一台机器只能运行一个corosyc实例，无法部署多个，是由如下两个部分决定的：锁文件ipc创建锁文件corosync从设计上就只运行一台机器运行一个corosync节点，它通过每次运行将pid写入固定的pid文件来进行控制，pid的文件路径在代码中写死，无法配置。staticconstchar*corosync_lock_file=
ansible shell non-zero return code 隐藏错误信息某呆啊杂七杂八的问题记录 linux shell ansible
在使用ansible的shell模块时，可能会碰到non-zeroreturncode，这时task会failed，但是需要该任务不为failed。此时可以在shell命令末尾增加cat，将返回的内容通过管道传递给cat，使用cat返回的rc始终为0，而且也能捕获到原始输出进行判断。实际应用目前有如下需求：往pacemaker的集群里面添加资源时，如果资源已经存在，命令返回值非0，但是需要该任务正
Spring4.1新特性——综述 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Schema与数据类型优化 annan211 数据结构 mysql
目前商城的数据库设计真是一塌糊涂，表堆叠让人不忍直视，无脑的架构师，说了也不听。在数据库设计之初，就应该仔细揣摩可能会有哪些查询，有没有更复杂的查询，而不是仅仅突出很表面的业务需求，这样做会让你的数据库性能成倍提高，当然，丑陋的架构师是不会这样去考虑问题的。选择优化的数据类型 1 更小的通常更好更小的数据类型通常更快，因为他们占用更少的磁盘、内存和cpu缓存，
第一节 HTML概要学习 chenke html Web css
第一节 HTML概要学习 1. 什么是HTML HTML是英文Hyper Text Mark-up Language(超文本标记语言)的缩写，它规定了自己的语法规则，用来表示比“文本”更丰富的意义，比如图片，表格，链接等。浏览器（IE,FireFox等）软件知道HTML语言的语法，可以用来查看HTML文档。目前互联网上的绝大部分网页都是使用HTML编写的。打开记事本输入一下内
MyEclipse里部分习惯的更改 Array_06 eclipse
继续补充中---------------------- 1.更改自己合适快捷键windows-->prefences-->java-->editor-->Content Assist--> Activation triggers for java的右侧“.”就可以改变常用的快捷键选中 Text
近一个月的面试总结 cugfy 面试
本文是在学习中的总结，欢迎转载但请注明出处：http://blog.csdn.net/pistolove/article/details/46753275 前言打算换个工作，近一个月面试了不少的公司，下面将一些面试经验和思考分享给大家。另外校招也快要开始了，为在校的学生提供一些经验供参考，希望都能找到满意的工作。
HTML5一个小迷宫游戏 357029540 html5
通过《HTML5游戏开发》摘抄了一个小迷宫游戏，感觉还不错，可以画画，写字，把摘抄的代码放上来分享下，喜欢的同学可以拿来玩玩！ <html> <head> <title>创建运行迷宫</title> <script type="text/javascript"
10步教你上传githib数据张亚雄 git
官方的教学还有其他博客里教的都是给懂的人说得，对已我们这样对我大菜鸟只能这么来锻炼，下面先不玩什么深奥的，先暂时用着10步干净利索。等玩顺溜了再用其他的方法。操作过程（查看本目录下有哪些文件NO.1）ls （跳转到子目录NO.2）cd+空格+目录（继续NO.3）ls （匹配到子目录NO.4）cd+ 目录首写字母+tab键+（首写字母“直到你所用文件根就不再按TAB键了”）（查看文件
MongoDB常用操作命令大全 adminjun mongodb 操作命令
成功启动MongoDB后，再打开一个命令行窗口输入mongo，就可以进行数据库的一些操作。输入help可以看到基本操作命令，只是MongoDB没有创建数据库的命令，但有类似的命令如：如果你想创建一个“myTest”的数据库，先运行use myTest命令，之后就做一些操作（如：db.createCollection('user')）,这样就可以创建一个名叫“myTest”的数据库。一
bat调用jar包并传入多个参数 aijuans
下面的主程序是通过eclipse写的： 1.在Main函数接收bat文件传递的参数（String[] args）如： String ip =args[0]; String user=args[1]; &nbs
Java中对类的主动引用和被动引用 ayaoxinchao java 主动引用对类的引用被动引用类初始化
在Java代码中，有些类看上去初始化了，但其实没有。例如定义一定长度某一类型的数组，看上去数组中所有的元素已经被初始化，实际上一个都没有。对于类的初始化，虚拟机规范严格规定了只有对该类进行主动引用时，才会触发。而除此之外的所有引用方式称之为对类的被动引用，不会触发类的初始化。虚拟机规范严格地规定了有且仅有四种情况是对类的主动引用，即必须立即对类进行初始化。四种情况如下：1.遇到ne
导出数据库提示 outfile disabled BigBird2012 mysql
在windows控制台下，登陆mysql，备份数据库： mysql>mysqldump -u root -p test test > D:\test.sql 使用命令 mysqldump 格式如下： mysqldump -u root -p *** DBNAME > E:\\test.sql。注意：执行该命令的时候不要进入mysql的控制台再使用，这样会报
Javascript 中的 && 和 || bijian1013 JavaScript &&||
准备两个对象用于下面的讨论 var alice = { name: "alice", toString: function () { return this.name; } } var smith = { name: "smith",
[Zookeeper学习笔记之四]Zookeeper Client Library会话重建 bit1129 zookeeper
为了说明问题，先来看个简单的示例代码： package com.tom.zookeeper.book; import com.tom.Host; import org.apache.zookeeper.WatchedEvent; import org.apache.zookeeper.ZooKeeper; import org.apache.zookeeper.Wat
【Scala十一】Scala核心五：case模式匹配 bit1129 scala
package spark.examples.scala.grammars.caseclasses object CaseClass_Test00 { def simpleMatch(arg: Any) = arg match { case v: Int => "This is an Int" case v: (Int, String)
运维的一些面试题 yuxianhua linux
1、Linux挂载Winodws共享文件夹 mount -t cifs //1.1.1.254/ok /var/tmp/share/ -o username=administrator,password=yourpass 或 mount -t cifs -o username=xxx,password=xxxx //1.1.1.1/a /win
Java lang包-Boolean BrokenDreams boolean
Boolean类是Java中基本类型boolean的包装类。这个类比较简单，直接看源代码吧。 public final class Boolean implements java.io.Serializable,
读《研磨设计模式》-代码笔记-命令模式-Command bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.List; /** * GOF 在《设计模式》一书中阐述命令模式的意图：“将一个请求封装
matlab下GPU编程笔记 cherishLC matlab
不多说，直接上代码 gpuDevice % 查看系统中的gpu,,其中的DeviceSupported会给出matlab支持的GPU个数。 g=gpuDevice(1); %会清空 GPU 1中的所有数据,,将GPU1 设为当前GPU reset(g) %也可以清空GPU中数据。 a=1; a=gpuArray(a); %将a从CPU移到GPU中 onGP
SVN安装过程 crabdave SVN
SVN安装过程 subversion-1.6.12 ./configure --prefix=/usr/local/subversion --with-apxs=/usr/local/apache2/bin/apxs --with-apr=/usr/local/apr --with-apr-util=/usr/local/apr --with-openssl=/
sql　行列转换 daizj sql 行列转换行转列列转行
行转列的思想是通过case when 来实现列转行的思想是通过union all 来实现下面具体例子：假设有张学生成绩表(tb)如下: Name Subject Result 张三语文　　74 张三数学　　83 张三物理　　93 李四语文　　74 李四数学　　84 李四物理　　94 */ /* 想变成姓名 &
MySQL--主从配置 dcj3sjt126com mysql
linux下的mysql主从配置：说明：由于MySQL不同版本之间的(二进制日志)binlog格式可能会不一样，因此最好的搭配组合是Master的MySQL版本和Slave的版本相同或者更低， Master的版本肯定不能高于Slave版本。（版本向下兼容） mysql1 : 192.168.100.1 //master mysq
关于yii 数据库添加新字段之后model类的修改 dcj3sjt126com Model
rules: array('新字段','safe','on'=>'search') 1、array('新字段', 'safe')//这个如果是要用户输入的话，要加一下， 2、array('新字段', 'numerical'),//如果是数字的话 3、array('新字段', 'length', 'max'=>100),//如果是文本 1、2、3适当的最少要加一条，新字段才会被
sublime text3 中文乱码解决 dyy_gusi Sublime Text
sublime text3中文乱码解决原因：缺少转换为UTF-8的插件目的：安装ConvertToUTF8插件包第一步：安装能自动安装插件的插件，百度“Codecs33”，然后按照步骤可以得到以下一段代码： import urllib.request,os,hashlib; h = 'eb2297e1a458f27d836c04bb0cbaf282' + 'd0e7a30980927
概念了解：CGI，FastCGI，PHP-CGI与PHP-FPM geeksun PHP
CGI CGI全称是“公共网关接口”(Common Gateway Interface)，HTTP服务器与你的或其它机器上的程序进行“交谈”的一种工具，其程序须运行在网络服务器上。 CGI可以用任何一种语言编写，只要这种语言具有标准输入、输出和环境变量。如php,perl,tcl等。 FastCGI FastCGI像是一个常驻(long-live)型的CGI，它可以一直执行着，只要激活后，不
Git push 报错 "error: failed to push some refs to " 解决 hongtoushizi git
Git push 报错 "error: failed to push some refs to " . 此问题出现的原因是：由于远程仓库中代码版本与本地不一致冲突导致的。由于我在第一次git pull --rebase 代码后，准备push的时候，有别人往线上又提交了代码。所以出现此问题。解决方案： 1： git pull 2：
第四章 Lua模块开发 jinnianshilongnian nginx lua
在实际开发中，不可能把所有代码写到一个大而全的lua文件中，需要进行分模块开发；而且模块化是高性能Lua应用的关键。使用require第一次导入模块后，所有Nginx 进程全局共享模块的数据和代码，每个Worker进程需要时会得到此模块的一个副本（Copy-On-Write），即模块可以认为是每Worker进程共享而不是每Nginx Server共享；另外注意之前我们使用init_by_lua中初
java.lang.reflect.Proxy liyonghui160com
1.简介 Proxy 提供用于创建动态代理类和实例的静态方法（1）动态代理类的属性代理类是公共的、最终的，而不是抽象的未指定代理类的非限定名称。但是，以字符串 "$Proxy" 开头的类名空间应该为代理类保留代理类扩展 java.lang.reflect.Proxy 代理类会按同一顺序准确地实现其创建时指定的接口
Java中getResourceAsStream的用法 pda158 java
1.Java中的getResourceAsStream有以下几种： 1. Class.getResourceAsStream(String path) ： path 不以’/'开头时默认是从此类所在的包下取资源，以’/'开头则是从ClassPath根下获取。其只是通过path构造一个绝对路径，最终还是由ClassLoader获取资源。　　2. Class.getClassLoader.get
spring 包官方下载地址（非maven） sinnk spring
SPRING官方网站改版后，建议都是通过 Maven和Gradle下载，对不使用Maven和Gradle开发项目的，下载就非常麻烦，下给出Spring Framework jar官方直接下载路径: http://repo.springsource.org/libs-release-local/org/springframework/spring/ s
Oracle学习笔记(7) 开发PLSQL子程序和包 vipbooks oracle sql 编程
哈哈，清明节放假回去了一下，真是太好了，回家的感觉真好啊！现在又开始出差之旅了，又好久没有来了，今天继续Oracle的学习！这是第七章的学习笔记，学习完第六章的动态SQL之后，开始要学习子程序和包的使用了……，希望大家能多给俺一些支持啊！编程时使用的工具是PLSQL