【经验分享】使用analyze收集统计信息的正确姿势

【经验分享】使用analyze收集统计信息的正确姿势_第1张图片

了解更多Greenplum相关内容,欢迎访问Greenplum中文社区网站

统计数据是描述存储在数据库中的数据的元数据,查询规划器需要最新的统计信息来为查询选择最佳的执行计划。通过执行analyze语句收集和更新统计信息。最近遇到gp5.x通过analyze收集统计信息慢、集群性能下降的现象。本文将分享统计信息收集的优化过程以及涉及到相关概念。

1. 问题说明

复现analyze AO表的效率低,实验的软硬件情况如下:

条目

说明

云服务器

2核/2GB/50GB SSD/密集计算型ic4

操作系统

CentOS / 8.2 x86_64 (64bit) 

Greenplum5.24

逻辑集群,master/standby和3primary/3mirror

表1实验环境

1.1 创建AO列存分区表

1)建表语句

【经验分享】使用analyze收集统计信息的正确姿势_第2张图片

图1 建表

2)表中记录数

【经验分享】使用analyze收集统计信息的正确姿势_第3张图片

图2 表记录

1.2 耗时和资源占用

1)在基表上执行统计信息收集

你可能感兴趣的:(Greenplum,大数据,数据库,python,java,mysql)