作者:颜博 青云科技数据库研发工程师
目前从事 PostgreSQL 产品开发工作,热衷于 PostgreSQL 数据库的学习和研究
| REPMGR 简介
repmgr[1] 是一套开源工具,用于管理 PostgreSQL 服务器集群内的复制和故障转移。repmgr 支持并增强了 PostgreSQL 的内置流复制,它提供了一个单一的读/写主服务器和一个或多个只读备用服务器。
repmgr 流复制管理工具对 PostgreSQL 集群节点的管理是基于分布式的管理方式。集群每个节点都具备一个 repmgr.conf 配置文件,用来记录本节点的 ID、节点名称、连接信息、数据库的 PGDATA 目录等配置参数。在完成参数配置后,就可以通过 repmgr 命令实现对集群节点的 “一键式” 部署。
repmgr 架构图(图片来源:https://repmgr.org/ )如下:
集群节点部署完成后,每个节点都可通过 repmgrd 守护进程来监控节点数据库状态;每个节点元数据表可独立维护,这些元数据表将记录所有集群节点的信息。
选举原理
在发生 Auto Failover 时,备节点在尝试多次连接主节点失败后(尝试次数及尝试间隔可以通过 repmgr.conf 配置文件修改),repmgrd 会在所有备节点中选举一个候选备节点(选举机制参考下文)提升为新主节点,其他备节点去 Follow 到该新主上,形成一个新的集群。
repmgr 选举候选备节点按照以下顺序选举:LSN > Priority > Node_ID
- 系统将优先选举一个 LSN 较大的节点,作为候选备节点;
- 若 LSN 一样,会根据 Priority 优先级进行比较(该优先级是在配置文件中进行参数配置,如果 Priority 为 0,则代表该节点被禁止提升为主节点);
- 若优先级也一样,会比较节点的 Node ID,小者会优先选举。
两个工具
repmgr 主要提供了 repmgr 和 repmgrd 两个工具。
repmgr 是一个执行管理任务的命令行工具,方便进行 PostgreSQL 服务器集群的管理。具备以下功能特点:
- 设置备用服务器
- promote 备
- 主从切换
- 显示复制集群中服务器的状态
repmgrd 是一个守护进程,它主动监视复制集群中的服务器并支持以下任务:
- 监控和记录复制集群信息
- 故障检测、故障转移
- 集群中事件的通知(需要自定义脚本接受通知)
用户与元数据
为了有效地管理复制集群,repmgr 需要将集群中节点的相关信息存储在 repmgr 专用数据库表中。此架构由 repmgr 扩展自动创建,该扩展在初始化由 repmgr 管理的集群(repmgr primary register)的第一步中安装,并包含以下对象:
Tables:
repmgr.events
: records events of interestrepmgr.nodes
: 复制集群中每个节点的连接和状态信息repmgr.monitoring_history
: repmgrd 写入的历史备用监控信息
Views:
repmgr.show_nodes
: 基于repmgr.nodes
表,另外显示服务器上游节点的名称repmgr.replication_status
: 当启用 repmgrd 的监控时,显示每个 standby 的监控状态。repmgr 元数据信息可以存储在已有的数据库或在自己的专用数据库。
注意:repmgr 元数据信息不能存储在不属于 repmgr 管理的复制集群的 PostgreSQL 服务器上。repmgr 需要一个可以访问数据库和执行必要的更改的用户,该用户可以不是超级用户,但是某些操作(例如 repmgr 扩展的初始安装)将需要超级用户连接(可以在需要时使用命令行选项指定 --superuser)。
| 安装 repmgr
注意:必须在集群的所有节点安装相同的 “主要” repmgr 版本(例如 5.2.1.x)[2]。
repmgr 版本
repmgr 版本 | 支持的 PostgreSQL 版本 | 最新版本 |
---|---|---|
repmgr 5.2 | 9.4, 9.5, 9.6, 10, 11, 12, 13 | 5.2.1 (2020-12-07) |
repmgr 5.1 | 9.3, 9.4, 9.5, 9.6, 10, 11, 12 | 5.1.0 (2020-04-13) |
repmgr 5.0 | 9.3, 9.4, 9.5, 9.6, 10, 11, 12 | 5.0 (2019-10-15) |
repmgr 4.x | 9.3, 9.4, 9.5, 9.6, 10, 11 | 4.4 (2019-06-27) |
- repmgr 2.x 和 3.x 系列不再维持,不在此罗列。
- repmgr 5.0 发布之后,将不会再发布 repmgr 4.x 系列。
安装过程
以 repmgr 5.2.x 版本为例,从源码仓库,Clone 并安装 repmgr。
$ git clone https://github.com/EnterpriseDB/repmgr
$ git checkout REL5_2_STABLE
$ cd repmgr/
./configure
$ make install
make install 成功后,pg_bin_path 里会有 repmgr、repmgrd 两个可执行文件。
| 使用 repmgr
repmgr 工具的基本语法[3]:
repmgr [OPTIONS] primary {register|unregister}
repmgr [OPTIONS] standby {register|unregister|clone|promote|follow|switchover}
repmgr [OPTIONS] node {status|check|rejoin|service}
repmgr [OPTIONS] cluster {show|event|matrix|crosscheck|cleanup}
repmgr [OPTIONS] witness {register|unregister}
repmgr [OPTIONS] service {status|pause|unpause}
repmgr [OPTIONS] daemon {start|stop}
- 一般配置选项
-b, --pg_bindir=PATH PostgreSQL 二进制文件的路径(可选)
-f, --config-file=PATH repmgr 配置文件的路径
-F, --force 强制执行有潜在危险的操作
- 数据库连接选项
-d, --dbname=DBNAME 要连接的数据库(默认:“postgres”)
-h, --host=HOSTNAME 数据库服务器主机
-p, --port=PORT 数据库服务器端口(默认:“5432”)
-U, --username=USERNAME 要连接的数据库用户名(默认:“postgres”)
- 特定于节点的选项
-D, --pgdata=DIR 节点数据目录的位置
--node-id 通过id指定节点(仅适用于部分操作)
--node-name 按名称指定节点(仅适用于部分操作)
- 记录选项
--dry-run 显示动作会发生什么,但不执行它
-L, --log-level 设置日志级别(覆盖配置文件;默认值:NOTICE)
--log-to-file 记录到 repmgr.conf 中定义的文件(或记录工具)
-q, --quiet 禁止除错误之外的所有日志输出
-t, --terse 不显示细节、提示和其他非关键输出
-v, --verbose 显示额外的日志输出(用于调试)
常用操作
- 操作类
命令 | 描述 |
---|---|
repmgr primary register | 注册当前节点为 primary 节点 |
repmgr primary unregister | 注销 primary 主节点 |
repmgr standby clone | 当前节点使用 pg_basebackup 从 primary 主节点复制数据目录 |
repmgr standby register | 注册当前节点为 standby 节点 |
repmgr standby unregister | 注销 standby 节点 |
repmgr standby promote | 将 standby 节点提升为 primary 主节点 |
repmgr standby follow | 一主多从架构中,standby 节点重新指向新的 primary 主节点 |
repmgr standby switchover | 将指定 standby 节点提升为 primary 主节点,并将 primary 主节点降级为 standby 节点 |
repmgr witness register | 注册当前节点为见证服务器节点 |
repmgr witness unregister | 注销见证服务器节点 |
- 查看类
命令 | 描述 |
---|---|
repmgr node status | 查看各节点的基本信息和复制状态 |
repmgr node check | 高可用集群节点状态信息检查 |
repmgr node rejoin | 重新加入一个失效节点到集群 |
repmgr cluster show | 查看集群中已注册的节点基本信息与状态 |
repmgr cluster matrix | 查看集群中所有节点的 matrix 信息 |
repmgr cluster crosscheck | 查看集群中所有节点间两两交叉连接检测 |
repmgr cluster event | 查看集群事件记录信息 |
repmgr cluster cleanup | 清理集群监控历史 |
下期预告
下期我们将使用 repmgr ,带您一步步搭建一套 PostgreSQL 高可用集群。
参考
[1]. repmgr:https://github.com/Enterprise...
[2]. 5.2.1文档:https://repmgr.org/docs/5.2/
[3]. 常见操作:https://blog.csdn.net/weixin_...