收集统计信息可以用dbms_stats包,通常用这样的语法:exec dbms_stat.gather_table_stats(ownname=>'xxx', tabname=>'xxx', estimate_percent=>xxx, method_opt=>'xxx', cascade=>xxx);
其中estimate_percent表示选择的采样比例,如果太低,收集速度会快,但可能不会很准确,如果太高,收集速度会慢,但比较准确,各有利弊。但同时也支持默认方式:exec dbms_stat.gather_table_stats(ownname=>'xxx', tabname=>'xxx');,那这里收集的采样比例是多少呢?
做个实验:
SQL> create table t2 as select * from dba_objects;
Table created.
SQL> select count(*) from t2;
COUNT(*)
----------
11218
SQL> create index idx_t2 on t2(object_id);
Index created.
SQL> exec dbms_stats.gather_table_stats(ownname=>'SYS', tabname=>'T2');
PL/SQL procedure successfully completed.
查询dba_tables表,看到NUM_ROWS值是11218,说明此处采样比例是100%。
再查询dba_indexes表,看到索引IDX_T2的相关统计列已经有值了,说明索引也进行了分析,即CASCADE默认值是TRUE。
再次查询dba_ind_columns表,看到列已经有了值,例如:COLUMN_POSITION、COLUMN_LENGTH等,也证明了CASCADE默认值是TRUE。
总结:
使用dbms_stats.gather_table_stats(ownname=>'SYS', tabname=>'T2');方式采集统计信息,
1、estimate_percent值默认是100%(其实estimate_percent可以设置为NULL,和100%作用相同,我理解NULL和不设这个值也相同,根据三段论传递,那么不设estimate_percent即默认是100%)。
2、CASCADE默认值是TRUE,即会对表、索引和列都会进行分析采集统计信息。