Postgresql Repmgr 级联复制 及 PostgreSQL 故障转移

Postgresql Repmgr 级联复制 及 PostgreSQL 故障转移_第1张图片

PostgreSQL 使用repmgr 进行主从数据的Clone是可以进行级联复制的,使用过MYSQL的同学可能会觉得,没有什么了不起,MYSQL 多少级的级联复制都可以。但PostgreSQL 的级联数据复制有些不同 1 PostgreSQL 中的复制是stream replication 而不是类似MYSQL 的逻辑复制。2 这里的复制不是指的和 mysql 一样的 从库套从库的复制,而是从PG的从库进行数据的CLONE 制作新的从节点,然后在将从节点连接到主库,这点也和MYSQL不一样。

首先我们已经有两台机器,在repmgr 的管理中,从图中可以看到 110 ,111 两台机器已经在 repmgr 的管理中

我们安装另外一台 postgresql 的机器 112 并且安装 repmgr 软件。

注意不要进行数据的初始化,repmgr 的机器需要复制的机器的指定的数据目录必须为空。

repmgr -h 192.168.198.111 -U repmgr -d repmgr -f /etc/repmgr.conf standby clone --upstream-node-id=2 --verbose

Postgresql Repmgr 级联复制 及 PostgreSQL 故障转移_第2张图片

192.168.198.111 是从库,而复制直接是从从库进行复制,而不是主库。

开始将机器的信息加入到集群中这里首先需要的就是编辑好 repmgr.conf

具体如何编译,请参见前几天的 repmgr 的安装的文字内容。这里就不重复了

repmgr -f /etc/repmgr.conf standby register --upstream-node-id=2 

命令里面的 --upstream-node-id =2  指的是数据的初始复制是来自于 从节点而从节点的 node_id  是 2 ,之后的数据复制还是来自于从库而不是主库

Postgresql Repmgr 级联复制 及 PostgreSQL 故障转移_第3张图片

命令执行完毕后,可以在主机中找到新加入的节点信息。

我们下边可以来验证

select * from pg_stat_replication

通过执行语句在 110 ,111 上

在 110

Postgresql Repmgr 级联复制 及 PostgreSQL 故障转移_第4张图片

在 111

Postgresql Repmgr 级联复制 及 PostgreSQL 故障转移_第5张图片

相关的级联复制就OK 了。

而一个数据库系统的failover 其实是评判一个数据库是否靠谱的一个重要的指标。

PostgreSQL  数据库本身是可以进行 failover 切换的。在repmgr中我们可以通过见证服务器来做这件事。

1 首先将刚才的112 节点 脱离目前的集群

直接在 112 上执行命令

 repmgr standby unregister -f /etc/repmgr.conf 

Postgresql Repmgr 级联复制 及 PostgreSQL 故障转移_第6张图片

节点会直接在 110 111上的注册信息进行清除,但清除注册信息,不会将复制进行清除,如有必要还需要断掉 111 到 112 之间的复制连接。(如何停止复制,请百度或翻一下之前写过的关于复制的文字)

112 上停止复制后,停机,将原来的 /pgdata/data 下的数据清空

 重新初始化数据库

initdb -D /pgdata/data

启动数据库

pg_ctl -D /pgdata/data start

然后需要做以下工作,确认112 与其他111 110 两台服务器 SSH 免密登录 账号以启动 pg数据库的账号为免密对象

配置好 repmgr.conf 文件,并且对pg_hba.conf 文件进行修改,保证见证服务器上的repmgr 账号登录主机和从库都是OK 的

 repmgr -f /etc/repmgr.conf witness register -h 192.168.198.110  -d repmgr -U repmgr

执行上面的命令对112 注册witness 见证服务器

然后在112上查看相关的信息是否正确

可以从图中看到 112已经被注册为见证服务器

基本上我们的环境就搭建完毕了,下面需要实现的当主机DOWN 掉后,从库自动升级为主库的功能。

需要repmgr 的两点功能

1  监控功能,postgresql 服务状态

2  通过监控状态,触发脚本,进行从库转为主库的工作

这里我们要借助repmgr 中的监控程序 repmgrd 守护程序来对整体的集群进行一个监控。首先repmgrd守护程序需要对 /etc/repmgr.conf 中关于repmgrd 的设置进行相关配置。

下图是配置的选择项和相关的配置值

Postgresql Repmgr 级联复制 及 PostgreSQL 故障转移_第7张图片

failover=automatic            

priority=100                          

connection_check_type=ping          

#reconnect_attempts=6                   

#reconnect_interval=10                 

promote_command=repmgr standby promote -f /etc/repmgr.conf

follow_command=repmgr standby follow -f /etc/repmgr.conf -W --upstream-node-id=%n

在配置完毕后,就可以在 111 节点运行

repmgrd -f /etc/repmgr.conf --verbose --monitoring-history

在 111 节点运行 监控后,我们关掉 110 节点的 PG 服务,监控马上就开始反应,在尝试6次重新连接到 主节点失败后,开始进行从库 升级的操作

Postgresql Repmgr 级联复制 及 PostgreSQL 故障转移_第8张图片

Postgresql Repmgr 级联复制 及 PostgreSQL 故障转移_第9张图片

我们在从库和见证服务器可以运行相关查看集群状态的命令,可以看到111已经变为了主库。

Postgresql Repmgr 级联复制 及 PostgreSQL 故障转移_第10张图片

repmgr 作为FAILOVER 以及 switch over  standby to primary 的软件,其功能是强大的,完全满足企业或互联网企业在高可用中使用,辅助以一些脚本,就可以做到 MHA 一样的效果,或更好。

PG 有了repmgr 第三方软件的支持,如虎添翼。

Postgresql Repmgr 级联复制 及 PostgreSQL 故障转移_第11张图片

你可能感兴趣的:(Postgresql Repmgr 级联复制 及 PostgreSQL 故障转移)