参考文章:
https://yq.aliyun.com/articles/641773
https://blog.51cto.com/wn2100/2238996
https://note.qidong.name/2018/09/postgresql-hot-standby/
https://my.oschina.net/u/4206387/blog/3103570
Docker
Ubuntu/CentOS
PostgreSQL v9.4
使用的docker搭建postgres9.4主从环境(一主一从环境);
我的主节点:172.19.32.62 ,对外端口5500
从节点:172.19.32.73,对外端口5501
主库和从库执行docker命令,构建相应的容器。注意我的docker容器是在不同的主机节点上的。
docker run -d --name fct-pgmaster \
-p 5500:5432 \
-e POSTGRES_PASSWORD=postgres \
-v /root/fct/postgresql-cluster/pgmaster:/var/lib/postgresql/data \
-d postgres:9.4
docker run -d --name fct-pgslave1 \
-p 5501:5432 \
-e POSTGRES_PASSWORD=postgres \
-v /root/fct/postgresql-cluster/pgslave1:/var/lib/postgresql/data \
-d postgres:9.4
进入以上主、从库对应的实际挂载目录执行下面的操作
// replication_username: 复制账号; slave_ip: 从库所在的服务器ip
host replication replica 172.19.32.73/32 md5
其中,replication表示复制权限;
replica表示节点之间复制的账号;
172.19.32.73/32 表示要复制的账号是 172.19.32.73,即从节点的账号
listen_addresses = '*'
max_connections = 100 # (change requires restart)
wal_level = hot_standby # minimal, archive, hot_standby, or logical
# (change requires restart)
#fsync = on # turns forced synchronization on or off
synchronous_commit = local # synchronization level;
max_wal_senders = 32 # max number of walsender processes
# (change requires restart)
wal_keep_segments = 64 # in logfile segments, 16MB each; 0 disables
wal_sender_timeout = 60s # in milliseconds; 0 disables
synchronous_standby_names = '*'
hot_standby = on # "on" allows queries during recovery
注意,我配置的配置项中某些并不是必须的,每一项的含义需要自己按照提示去理解体会。
# 1.进入容器
docker exec -it fct-pgmaster /bin/bash
# 2.连接PostgreSQL
psql -U postgres -p 5500
# 3.创建用户
set synchronous_commit =off;
#replication_username: 对应上面设置的复制账号; replication_username_password: 认证密码
create role replica login replication encrypted password 'replica';
# 4.验证用户
\du
#重启容器
docker restart fct-pgmaster
#启动容器之后,需要查看容器的日志输出中是否有错误
docker logs fct-pgmaster
hot_standby_feedback = on
standby_mode = 'on'
#replication_username: 复制账号(同主库); master_ip: 主库所在的服务器ip; master_port: 主库端口; replication_username_password: 认证密码
primary_conninfo = 'host=172.19.32.62 port=5500 user=replica password=replica'
pg_basebackup命令
进入从节点容器中,执行直接执行,清除从节点中的数据(该步骤必须的!)
rm -rf /var/lib/postgresql/data/
如果出现如下错误:
root@f42b3ae4014c:/# rm -rf /var/lib/postgresql/data
rm: cannot remove '/var/lib/postgresql/data': Device or resource busy
则建议,直接删除容器外的挂盘目录,这里是/root/fct/postgresql-cluster/pgslave1,直接执行;
然后在容器中执行备份命令,此时会将主节点中的数据同步到当前从节点的数据目录中;
pg_basebackup -h 172.19.32.62 -p 5500 -U replica -F p -x -P -R -D /var/lib/postgresql/data/ -l postgresbackup20190129
执行完后结果如下,会有进度条显示执行成功!
root@29e514bcfa3c:/# pg_basebackup -h 172.19.32.62 -p 5500 -U replica -F p -x -P -R -D /var/lib/postgresql/data/ -l postgresbackup20190129
Password:
36643/36643 kB (100%), 1/1 tablespace
**注意事项1:**命令中的-U replica
执行的用户名是replica
,这是前面创建配置的节点数据复制的用户名角色和密码;不是使用的前面的postgres
的账号密码!切记!
(执行完之后,容器自动退出;)
此时在从库的外部容器挂载目录下会自动常见相应的pg_hba.conf文件和recovery.conf文件。
recovery.conf文件内容如下:
standby_mode = 'on'
primary_conninfo = 'user=replica password=replica host=172.19.32.62 port=5500 sslmode=prefer sslcompression=0 gssencmode=prefer krbsrvname=postgres target_session_attrs=any'
注意事项2:pg_basebackup命令从属于容器的命令,需要在容器内部执行,并且指明-U replica的复制权限的用户名;注意master节点的对外端口-p 5500也要指定正确。
每次修改相应的配置时候,要想使得配置生效,需要重启容器。
docker restart fct-pgmaster
docker restart fct-pgslave
注意:启动容器之后,需要查看容器的日志输出中是否有错误
docker logs fct-pgmaster
docker logs fct-pgslave
查看主从同步是否成功的命令psql -U postgres -x -c "select * from pg_stat_replication;"
操作步骤如下:
// 进入主库容器
docker exec -it fct-pgmaster /bin/bash
// 查看复制状态
root@e78673f448d0:/# psql -U postgres -h 172.19.32.62 -p 5500 -x -c "select * from pg_stat_replication;"
Password for user postgres:
-[ RECORD 1 ]----+------------------------------
pid | 838
usesysid | 16384
usename | replica
application_name | walreceiver
client_addr | 172.19.32.73
client_hostname |
client_port | 55582
backend_start | 2019-10-28 06:38:33.303482+00
backend_xmin |
state | streaming
sent_location | 0/3000138
write_location | 0/3000138
flush_location | 0/3000138
replay_location | 0/3000100
sync_priority | 1
sync_state | sync
root@e78673f448d0:/# psql -U postgres -h 172.19.32.62 -p 5500
Password for user postgres:
psql (9.4.21)
Type "help" for help.
postgres=# select client_addr,sync_state from pg_stat_replication;
client_addr | sync_state
--------------+------------
172.19.32.73 | sync
(1 row)
2.查看slave节点的外部挂载目录下时候有如下文件recovery.conf
standby_mode = 'on'
primary_conninfo = 'user=repl password=repl host=172.19.32.62 port=5510 sslmode=prefer sslcompression=0 krbsrvname=postgres target_session_attrs=any'
#或者自己配置:
standby_mode = 'on'
#replication_username: 复制账号(同主库); master_ip: 主库所在的服务器ip; master_port: 主库端口; replication_username_password: 认证密码
primary_conninfo = 'host=172.19.32.62 port=5500 user=replica password=replica'
recovery_target_timeline = 'latest'
FATAL: database system identifier differs between the primary and standby
DETAIL: The primary's identifier is 6752676860246843428, the standby's identifier is 6752661973687021603.
这是因为从库没有与主库的数据同步,导致启动时候报错!
确保数据同步,是必须做的步骤 !
FATAL: hot standby is not possible because wal_level was not set to "hot_standby" or higher on the master server
HINT: Either set wal_level to "hot_standby" on the master, or turn off hot_standby here.
修改配置文件中相关选项, 按照配置项提示修改即可。
补充知识:
pg_basebackup -h 172.19.32.62 -p 5500 -U replica -F p -x -P -R -D /var/lib/postgresql/data/ -l postgresbackup20190129
备份过程实际上就是从主库的data目录里物理拷贝数据的过程。
参数说明
-F 指定了输出的格式,支持p(原样输出)或者t(tar格式输出)。
-x 表示备份开始后,启动另一个流复制连接从主库接收WAL日志。
-p 表示允许在备份的过程中实时的打印备份的进度。
-R 表示会在备份结束后自动生成recovery.conf文件,这样就避免了手动创建。
-D 指定把备份写到哪个目录,注意:在做基础备份之前从库的数据目录需要手动清空。
-1 表示指定一个备份的标识。