Oracle优化器和索引原理

Oracle优化器和索引原理

================ Oracle优化器
Oracle
的优化器(Optimizer)实际上是数据库环境的参数设置。可以在INITsid.ORA文件内的OPTIMZER_MODE=RULE或OPTIMZER_MODE=COST或OPTIMZER_MODE=CHOOSE来设置优化目标。用户也可以在会话和查询方式下更改优化器的默认操作模式。

如果OPTIMZER_MODE=RULE,则激活基于规则的优化器(RBO)。基于规则的优化器按照一系列的语法规则来推测可能执行路径和比较可替换的执行路径。
如果OPTIMZER_MODE=COST,则激活基于成本的优化器(CBO)。它使用ANALYZE语句来生成数据库对象的统计数据。这些统计数据包括表的行数、平均长度及索引中不同的关键字数等。基于这些统计数据,成本优化器可以计算出可获得的执行路径的成本。并选择具有最小的成本执行路径。在CBO模式下,需要经常运行ANALYZE
命令来确保数据的准确性。
如果OPTIMZER_MODE=CHOOSE,则在表被分析的情况下激活基于成本的优化器。但当一个查询分析的表是未被ANALYZE分析统计过的时侯,CBO优化器就决定进行全表扫描操作。所以为了减少可能的全表扫描,应该尽量避免使用OPTIMZER_MODE=CHOOSE选项。


Oracle 9i第二版将是最后一个正式支持CBO的版本。
Oracle推荐所有合作伙伴和客户验证使用CBO的应用程序,
尽管RBO在Oracle10i(现在称Oracle10G)仍然可用,但不受支持。
     作为每一个已发布的Oracle笔记中,RBO的存在妨碍了Oralce对查询处理引擎的关键增强.
     它的移除将允许Oracle提高数据库引擎查询处理组件的性能和可靠性。
     目前,Oracle 对RBO的支持仅仅用以有限的错误修正并且Oracle对RBO没有添加新的功能.

CBO主要获益如下:

    1.以后Oracle停止RBO环境的开发.

    2.随后的Oracle数据库将移除RBO

    3.同CBO相比,RBO的访问方法是有限数量的.

    4.所有新功能基于CBO,这些大多数新功能对于设置等等是重要的。簇索引表,位图索引,基于函数的索引,反向索引,哈希连接,物化视图,索引表,和并行查询, 星型连接等

    5.媒介链接支持.

    6.一旦RBO不受支持,Oracle支持也不可用。

    7.CBO已经成熟

     先前Oracle7中,RBO在某些场景胜过CBO,甚至CBO并不是如想像中完好,并且经常选择糟糕的执行计划。以后的发行版本中,CBO功能获得了提升,现在对于新功能,它提供了对考虑收益的较好交互性

    8.分布式和远程查询更加可靠

在RBO中,数据库链接,从本地到远程数据库多于一个表的查询调整相当困难.同样的工作,CBO胜过了RBO。本地优化器知道远程表的目前统计信息,并且对于执行计划能做出更好的决定.RBO可能考虑远程数据库的索引,但是CBO有权利统计远程数据库索引的信息并对查询计划做出决定.

=============== 关于 CBO
当系统使用CBO方式优化SQL的时候,要使其执行计划达到最优化,需要定期执行数据统计,必须保证统计数据的及时性,否则可能得不到预计的优化效果,或与预计的优化效果相差悬殊。

要对数据库对象生成统计信息,可以有以下方法:

完全统计法:analyze table table_name compute statistics;

抽样估计法:analyze table table_name estimate statistics sample 30 percent;
对表使用抽样估计法要比完全统计法的生成统计速度要快,但是统计数据可能不够精确。在开发过程中,我们可能要涉及很多的表的查询,而我们在使用CBO的时候就需要经常对这些表执行分析统计,得到CBO所需要的统计数据。通常有以下几种方法来收集统计信息:


1.导出所有需要分析的表的语句脚本,然后执行该脚本。
SQL> SPOOL OFF;
SQL> SPOOL C:/ANALYZE_TAB.SQL

SQL> SELECT 'ANALYZE TABLE '||OWNER||'.'||TABLE_NAME||' COMPUTE STATISTICS;' FROM ALL_TABLES WHERE OWNER NOT IN ('SYS','SYSTEM');

然后调整一下脚本,并执行:


SQL>@C:/ANALYZE_TAB.SQL

可以将该脚本放到服务器端并设置自动执行。

2.使用Oracle提供的过程:DBMS_DDL.ANALYZE_OBJECT,该过程可以对某个特定用户的特定表执行统计。例如:

完全统计:


SQL>execute dbms_ddl.analyze_object('TABLE','DINYAR','DINYA_TEST01','COMPUTE');

PL/SQL procedure successfully completed
50%抽样统计
SQL>execute dbms_ddl.analyze_object('TABLE','DINYAR','DINYA_TEST01','ESTIMATE',NULL,50);
PL/SQL procedure successfully completed
SQL>
可以使用该过程,生成分析统计数据库对象的脚本,并定时执行该脚本。

3.使用Oracle提供的过程DBMS_UTILITY.ANALYZE_SCHEMA该过程执行对某个特定用户下的TABLE,INDEX和CLUSTER的分析统计。如:
完全统计SCHEMA下的所有对象:

SQL> execute dbms_utility.analyze_schema('DINYAR','COMPUTE');
PL/SQL procedure successfully completed
Executed in 6.9 seconds

SQL>

抽样50%统计SCHEMA下的所有对象:
SQL> execute dbms_utility.analyze_schema('DINYAR','ESTIMATE',NULL,50);
PL/SQL procedure successfully completed
Executed in 1.933 seconds
SQL>
从执行的时间上看,抽样统计的时间要比完全统计所花费的时间要短,执行的更快。
4.使用Oracle提供的过程DBMS_UTILITY.ANALYZE_DATABASE,该过程可以对整个数据库中的对象进行分析统计。但需要当前登陆用户具备足够的权限,否则系统将提示出错。如:

SQL> execute dbms_utility.analyze_database('COMPUTE');
begin dbms_utility.analyze_database('COMPUTE'); end;


ORA-20000: You have insufficient privileges for an object in this database.

ORA-06512: at "SYS.DBMS_UTILITY", line 501

ORA-06512: at line 1

SQL>

改换有DBA权限的用户登陆:

SQL> execute dbms_utility.analyze_database('COMPUTE');

begin dbms_utility.analyze_database('COMPUTE'); end;

ORA-30657: operation not supported on external organized table

ORA-06512: at "SYS.DBMS_DDL", line 179

ORA-06512: at "SYS.DBMS_UTILITY", line 497

ORA-06512: at line 1

SQL>

从上面的错误信息可以看出,不支持对外部表的分析统计,查看Oracle的解决办法,Oracle称不要试图做这项操作。

DBMS_UTILITY.ANALYZE_DATABASE的抽样分析统计和上例中类似。

5.使用Oracle提供的过程:DBMS_STATS,该包中的过程dbms_stats.gather_index_stats,

DBMS_STATS.gather_table_stats,DBMS_STATS.gather_schema_stats,DBMS_STATS.gather_database_stats,DBMS_STATS.gather_system_stats分别执行对索引、表、某个schema、数据库、系统的统计信息。例如:

SQL> execute dbms_stats.gather_table_stats('DINYAR','DINYA_TEST01');

PL/SQL procedure successfully completed

Executed in 0.29 seconds

SQL> execute dbms_stats.gather_schema_stats('DINYAR');

PL/SQL procedure successfully completed

Executed in 7.07 seconds

SQL>

(该包中还有其他的一些过程,可以对数据库的对象进行操作,不在这里讨论。)

6.定时执行分析统计,使用DBMS_JOB包,创建一个JOB,定时执行过程,对数据库对象进行分析统计:

PL/SQL procedure successfully completed

Executed in 0.581 seconds

job_num
--------
41
SQL>

这样就可以在数据库中定时执行数据库对象统计信息的收集,保证了使用CBO优化器优化时优化路径的准确性。

 

=============== 关于索引

Oracle索引原理
                  栏 目 树 形 导 航

          没有公告
       解决方案首页 · 视频通信 · IPTV与流媒体 · 3G与移动多媒体 · 视频监控 

      标准专题首页 | 3G | VOIP | NGN | IPV6 | AVS | SIP | H.264 | H.323 | H.324M | QOS
      | MPEG | 音频编码 | 防火墙穿越| IPTV
      开发专题首页 · Visual C++ · 数据库技术 · 嵌入式操作系统 · Java · .Net · Jsp
      您现在的位置: 中国视讯技术网 >> 技术开发 >> 数据库 >> Oracle >> ORACLE应用 >> 文章正文 用户登录  新用户注册
            Oracle索引原理         
            Oracle索引原理
            副标题:
            作者:佚名 文章来源:不详 点击数:22 更新时间:2006-7-28 17:44:16
 

       Oracle提供了大量索引选项。知道在给定条件下使用哪个选项对于一个应用程序的性能来说非常重要。一个错误的选择可能会引发死锁,并导致数据库性能急剧下降或进程终止。而如果做出正确的选择,则可以合理使用资源,使那些已经运行了几个小时甚至几天的进程在几分钟得以完成,这样会使您立刻成为一位英雄。这篇文章就将简单的讨论每个索引选项。主要有以下内容:

                  [1] 基本的索引概念

                  查询DBA_INDEXES视图可得到表中所有索引的列表,注意只能通过USER_INDEXES的方法来检索模式(schema)的索引。访问USER_IND_COLUMNS视图可得到一个给定表中被索引的特定列。


                  [2] 组合索引

                  当某个索引包含有多个已索引的列时,称这个索引为组合(concatented)索引。在
                  Oracle9i引入跳跃式扫描的索引访问方法之前,查询只能在有限条件下使用该索引。比如:表emp有一个组合索引键,该索引包含了empno、
                  ename和deptno。在Oracle9i之前除非在where之句中对第一列(empno)指定一个值,否则就不能使用这个索引键进行一次范围扫描。

                  特别注意:在Oracle9i之前,只有在使用到索引的前导索引时才可以使用组合索引!

                  [3] ORACLE ROWID

                  通过每个行的ROWID,索引Oracle提供了访问单行数据的能力。ROWID其实就是直接指向单独行的线路图。如果想检查重复值或是其他对ROWID本身的引用,可以在任何表中使用和指定rowid列。


                  [4] 限制索引

                  限制索引是一些没有经验的开发人员经常犯的错误之一。在SQL中有很多陷阱会使一些索引无法使用。下面讨论一些常见的问题:
    4.1 使用不等于操作符(<>、!=)

 

        下面的查询即使在cust_rating列有一个索引,查询语句仍然执行一次全表扫描。

 

         select cust_Id,cust_name

 

         from   customers

 

         where  cust_rating <> 'aa';

 

         把上面的语句改成如下的查询语句,这样,在采用基于规则的

 

         优化器而不是基于代价的优化器(更智能)时,将会使用索引。

 

         select cust_Id,cust_name

 

         from   customers

 

         where  cust_rating < 'aa' or cust_rating > 'aa';

 

     特别注意:通过把不等于操作符改成OR条件,就可以使用索引,以避免全表扫描。

 

     4.2 使用IS NULL 或IS NOT NULL

                  使用IS NULL 或IS NOT
                  NULL同样会限制索引的使用。因为NULL值并没有被定义。在SQL语句中使用NULL会有很多的麻烦。因此建议开发人员在建表时,把需要索引的列设成NOT
                  NULL。如果被索引的列在某些行中存在NULL值,就不会使用这个索引(除非索引是一个位图索引,关于位图索引在稍后在详细讨论)。

                  4.3 使用函数

                  如果不使用基于函数的索引,那么在SQL语句的WHERE子句中对存在索引的列使用函数时,会使优化器忽略掉这些索引。
                  下面的查询不会使用索引(只要它不是基于函数的索引)
          select empno,ename,deptno

 

          from   emp

 

          where  trunc(hiredate)='01-MAY-81';

 

          把上面的语句改成下面的语句,这样就可以通过索引进行查找。

 

          select empno,ename,deptno

 

          from   emp

 

          where  hiredate<(to_date('01-MAY-81')+0.9999);

 

     4.4 比较不匹配的数据类型

 

         比较不匹配的数据类型也是比较难于发现的性能问题之一。

 

         注意下面查询的例子,account_number是一个VARCHAR2类型,

 

         在account_number字段上有索引。下面的语句将执行全表扫描。

 

         select bank_name,address,city,state,zip

 

         from   banks

 

         where  account_number = 990354;

 

         Oracle可以自动把where子句变成to_number(account_number)=990354,这样就限制了

 

          索引的使用,改成下面的查询就可以使用索引:

 

         select bank_name,address,city,state,zip

 

         from   banks

 

         where  account_number ='990354';

 

     特别注意:不匹配的数据类型之间比较会让Oracle自动限制索引的使用,

 

        即便对这个查询执行Explain Plan也不能让您明白为什么做了一次“全表扫描”。

 

[5] 选择性

                  使用USER_INDEXES视图,该视图中显示了一个distinct_keys列。比较一下唯一键的数量和表中的行数,就可以判断索引的选择性。选择性越高,索引返回的数据就越少。

                  [6] 群集因子(Clustering Factor)

                  Clustering
                  Factor位于USER_INDEXES视图中。该列反映了数据相对于已索引的列是否显得有序。如果Clustering
                  Factor列的值接近于索引中的树叶块(leaf
                  block)的数目,表中的数据就越有序。如果它的值接近于表中的行数,则表中的数据就不是很有序。

                  [7] 二元高度(Binary height)

                  索引的二元高度对把ROWID返回给用户进程时所要求的I/O量起到关键作用。在对一个索引进行分析后,可以通过查询DBA_INDEXES的B-
                  level列查看它的二元高度。二元高度主要随着表的大小以及被索引的列中值的范围的狭窄程度而变化。索引上如果有大量被删除的行,它的二元高度也会增加。更新索引列也类似于删除操作,因为它增加了已删除键的数目。重建索引可能会降低二元高度。


                  [8] 快速全局扫描

                  在Oracle7.3后就可以使用快速全局扫描(Fast Full
                  Scan)这个选项。这个选项允许Oracle执行一个全局索引扫描操作。快速全局扫描读取B-树索引上所有树叶块。初始化文件中的
                  DB_FILE_MULTIBLOCK_READ_COUNT参数可以控制同时被读取的块的数目。

                  [9] 跳跃式扫描

                  从Oracle9i开始,索引跳跃式扫描特性可以允许优化器使用组合索引,即便索引的前导列没有出现在WHERE子句中。索引跳跃式扫描比全索引扫描要快的多。下面的程序清单显示出性能的差别:
    create index skip1 on emp5(job,empno);

 

    index created.

 

 

 

    select count(*)

 

    from emp5

 

    where empno=7900;

 

 

 

    Elapsed:00:00:03.13

 

 

 

    Execution Plan

 

    0     SELECT STATEMENT Optimizer=CHOOSE(Cost=4 Card=1 Bytes=5)

 

    1  0    SORT(AGGREGATE)

 

    2  1      INDEX(FAST FULL SCAN) OF 'SKIP1'(NON-UNIQUE)

 

 

 

    Statistics

 

 

 

    6826 consistent gets

 

    6819 physical   reads

 

 

 

    select /*+ index(emp5 skip1)*/ count(*)

 

    from emp5

 

    where empno=7900;

 

 

 

    Elapsed:00:00:00.56

 

 

 

    Execution Plan

 

    0     SELECT STATEMENT Optimizer=CHOOSE(Cost=6 Card=1 Bytes=5)

 

    1  0    SORT(AGGREGATE)

 

    2  1      INDEX(SKIP SCAN) OF 'SKIP1'(NON-UNIQUE)

 

 

 

    Statistics

 

 

 

    21 consistent gets

 

    17 physical   reads

 

 

 

[10] 索引的类型

 

     B-树索引

 

     位图索引

 

     HASH索引

 

     索引编排表

 

     反转键索引

 

     基于函数的索引

 

     分区索引

 

     本地和全局索引

你可能感兴趣的:(Oracle优化器和索引原理)