我们目前的postgresql是主从流复制模式,standby没有对外提供服务,只当做热备用。


机器环境说明:

  postgres版本 10


切换前的拓扑关系:

  master: 10.0.20.25

  standby: 10.0.20.26



操作前,先切换到 postgres 账号:


10.0.20.25 停主库: 

psql 
select pid,datname,usename,client_addr,client_port, application_name from pg_stat_activity;  -- 查看当前连接

然后,通知SA 将当前主库从SLB上剔除掉,阻止用户新的连接进来。

select pg_terminate_backend(pid) from pg_stat_activity where usename='admin' ;  -- 杀死admin账户的当前连接(我这里业务账号用的是admin)

/usr/pgsql-10/bin/pg_ctl stop -m fast -D /var/lib/pgsql/10/data/    -- 关闭当前master节点的pgsql进程


10.0.20.26 激活成为新主库 :

/usr/pgsql-10/bin/pg_ctl promote -D /var/lib/pgsql/10/data/


10.0.20.26 检查 新主库是否提升成功:

/usr/pgsql-10/bin/pg_controldata  -D /var/lib/pgsql/10/data/ | grep cluster

Database cluster state:   in production   -- 说明: 如果值为 "in production" 说明是主库,如果值为 "in archive recovery" 说明是备库。



在 10.0.20.26 上创建一个测试表,用于稍后验证新的复制是否正常

create table test_t1(a int );
insert into test_t1 select 100;
select  * from test_t1;



10.0.20.25 使用pg_rewind 变成新的从库:

/usr/pgsql-10/bin/pg_rewind --target-pgdata  /var/lib/pgsql/10/data/  --source-server='host=10.0.20.26 port=5432 user=postgres dbname=postgres password=postgres' -P

-- 说明: 这里10.0.20.26上的postgres用户的密码是postgres,需要根据自己的情况来写pg_rewind的情况


10.0.20.25 上查看postgresql.conf 有几个地方要进行修改

max_connections = 200                   # 一般查多于写的应用从库的最大连接数要比较大
hot_standby = on                      # 说明这台机器不仅仅是用于数据归档,也用于数据查询
max_standby_streaming_delay = 30s             # 数据流备份的最大延迟时间
wal_receiver_status_interval = 10s             # 多久向主报告一次从的状态,当然从每次数据复制都会向主报告状态,这里只是设置最长的间隔时间
hot_standby_feedback = on                  # 如果有错误的数据复制,是否向主进行反馈


10.0.20.25 上编写 recovery.conf 文件 内容如下:

recovery_target_timeline = 'latest'
standby_mode = on
primary_conninfo = 'host=10.0.20.26 port=5432 user=replica password=replica'


10.0.20.25 新的从库上启动pgsql

/usr/pgsql-10/bin/pg_ctl start -D /var/lib/pgsql/10/data/


10.0.20.26 新的主库执行:

\x 
select * from pg_stat_replication;


10.0.20.26 新的主库执行插入操作:

insert into test_t1 select 1;
select  * from test_t1;


然后,在主库、从库 查询复制状态:

select txid_current_snapshot();