基于某某原因,我们的Greenplum需要卸载一个节点(测试环境的Greenplum集群),由于该集群使用了很久,里面有许多开发所需要的数据,所以在卸掉一个节点后,还要保证数据不会丢失。

经过搜索,在以下站点找到了解决方案
1)https://gp-docs-cn.github.io/docs/admin_guide/managing/restore-diff-system.html
2)https://yq.aliyun.com/articles/173472

当然,期间也遇到了点问题,在此也做个总结和记录。

1,备份数据【本次使用gp_dump备份】

gp_dump [-a | -s] [-c] [-d] [-D] [-n schema] [-o] [-O] 
    [-t table_name] [-T table_name] [-x] [-h hostname] [-p port] 
    [-U username] [-W] [-i] [-v] [--gp-c] [--gp-d=backup_directory] 
    [--gp-r=reportfile] [--gp-s=dbid [, ...]] database_name

gp_dump -? | --help 

gp_dump --version

该指令最简洁的使用方式为

gp_dump database_name ;

即直接跟要备份的数据库名即可。

Greenplum移除节点_第1张图片

如上图显示有文件上使用的时间错以及备份文件在各个节点上的存储位置。

2,将要移除节点上的备份文件拷贝到master节点上。

3,从集群中移除节点

Greenplum移除节点_第2张图片

1)关闭数据库

gpstop -M fast

2)以管理模式启动数据库

gpstart -m

3)在master节点上登录管理数据库

PGOPTIONS="-c gp_session_role=utility" psql -d postgres

Greenplum移除节点

4)查看当前节点

select * from gp_segment_configuration;

Greenplum移除节点_第3张图片

5)设置操作权限

set allow_system_table_mods='dml';

Greenplum移除节点_第4张图片

6)删除节点(161)

delete from gp_segment_configuration where dbid=2;
delete from pg_filespace_entry where fsedbid=2;

Greenplum移除节点_第5张图片

注意:这里很重要,我们需要将删除后不连续的索引通过update将其修改成连续的,不然启动的时候会报以下错误:

[gpadmin@ultra-hp-157 root]$ gpstart -a
20190427:13:45:19:002659 gpstart:ultra-hp-157:gpadmin-[INFO]:-Starting gpstart with args: -a
20190427:13:45:19:002659 gpstart:ultra-hp-157:gpadmin-[INFO]:-Gathering information and validating the environment...
20190427:13:45:19:002659 gpstart:ultra-hp-157:gpadmin-[INFO]:-Greenplum Binary Version: 'postgres (Greenplum Database) 5.0.0-alpha.8 build commit:548dc837c957d8c4834445b642cda1f0a5bf9b66'
20190427:13:45:19:002659 gpstart:ultra-hp-157:gpadmin-[INFO]:-Greenplum Catalog Version: '301705051'
20190427:13:45:19:002659 gpstart:ultra-hp-157:gpadmin-[INFO]:-Starting Master instance in admin mode
20190427:13:45:20:002659 gpstart:ultra-hp-157:gpadmin-[INFO]:-Obtaining Greenplum Master catalog information
20190427:13:45:20:002659 gpstart:ultra-hp-157:gpadmin-[INFO]:-Obtaining Segment details from master...
20190427:13:45:21:002659 gpstart:ultra-hp-157:gpadmin-[INFO]:-Setting new master era
20190427:13:45:21:002659 gpstart:ultra-hp-157:gpadmin-[INFO]:-Master Started...
20190427:13:45:21:002659 gpstart:ultra-hp-157:gpadmin-[INFO]:-Shutting down master
20190427:13:45:22:002659 gpstart:ultra-hp-157:gpadmin-[CRITICAL]:-gpstart failed. (Reason=''NoneType' object has no attribute 'valid'') exiting...

7)退出管理模式,正常启动数据库

gpstop –m
gpstart

8)将删除节点的备份文件使用psql恢复到当前数据,例如:

psql ioss_dns -f /data/greenplumdatabak/dump_161/gp_dump_0_2_20190427074146

其中ioss_dns为数据库名;gp_dump_0_2_20190427074146为备份的数据文件。

到此,移除节点成功。

以上是通过并行备份的方式来备份数据,在各个节点上都会备份各个数据库的数据,也就是数据备份文件是分散在各个节点上的。 除此之外还可以通过非并行的方式来备份数据,原理就是将所有的数据都备份到master节点上,在数据量较小的情况下还是比较实用,具体操作不在赘述,上面提供的参考连接中有详细介绍。