greenplum何时收集统计信息

在GP的postgresql.conf中有控制自动收集统计信息的参数 gp_autostats_mode设置,gp_autostats_mode有三个值:none、no_change、no_no_stats(默认)
none:禁止收集统计信息
no_change:当一条DML执行后影响的行数超过gp_autostats_on_change_threshold参数指定的值时,会执行完这条DML后再自动执行一个analyze的操作来收集表的统计信息
no_no_stats:当使用create table as select、insert、copy时,如果在目标表中没有收集过统计信息,那么会自动执行analyze来收集这张表的信息,gp默认使用on_no_stats,对数据库的消耗会比较小,但是对于经常变更的表,数据库在第一次收集统计信息之后就不会再收集了,需要人为定时执行analyze

现在生产环境下模型层表每天都在存储过程中全量刷新,先truncate table再insert,truncate table后pg_class.reltuples就为0了,这样就很容易导致大表出现广播的情况,那就导致跑报表很慢。为了不增加收集统计信息对数据库的消耗,决定每天跑完模型层表后,对表进行一次统计信息收集。

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/29989552/viewspace-2132381/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/29989552/viewspace-2132381/

你可能感兴趣的:(greenplum何时收集统计信息)