ORACLE索引介绍与高性能SQL优化

什么是索引
  
  索引是建立在表的一列或多个列上的辅助对象,目的是加快访问表中的数据;
  
  Oracle存储索引的数据结构是B*树,位图索引也是如此,只不过是叶子节点不同B*数索引;
  
  索引由根节点、分支节点和叶子节点组成,上级索引块包含下级索引块的索引数据,叶节点包含索引数据和确定行实际位置的rowid。
  
  使用索引的目的
  加快查询速度
  减少I/O操作
  消除磁盘排序
  
  何时使用索引
  查询返回的记录数
  排序表<40%
  非排序表 <7%
  表的碎片较多(频繁增加、删除)
  
  索引的种类
  非唯一索引(最常用)
  唯一索引
  位图索引
  局部有前缀分区索引
  局部无前缀分区索引
  全局有前缀分区索引
  散列分区索引
  基于函数的索引
  
  管理索引的准则
  
  在表中插入数据后创建索引
  
  。在用SQL*Loader或import工具插入或装载数据后,建立索引比较有效;
  
  索引正确的表和列
  
  。经常检索排序大表中40%或非排序表7%的行,建议建索引;
  。为了改善多表关联,索引列用于联结;
  。列中的值相对比较唯一;
  。取值范围(大:B*树索引,小:位图索引);
  。Date型列一般适合基于函数的索引;
  。列中有许多空值,不适合建立索引
  
  为性能而安排索引列
  
  。经常一起使用多个字段检索记录,组合索引比单索引更有效;
  。把最常用的列放在最前面,例:dx_groupid_serv_id(groupid,serv_id),在where条件中使用groupid或groupid,serv_id,查询将使用索引,若仅用到serv_id字段,则索引无效;
  。合并/拆分不必要的索引。
  
  限制每个表索引的数量
  
  。一个表可以有几百个索引(你会这样做吗?),但是对于频繁插入和更新表,索引越多系统CPU,I/O负担就越重;
  。建议每张表不超过5个索引。
  
  删除不再需要的索引
  
  。索引无效,集中表现在该使用基于函数的索引或位图索引,而使用了B*树索引;
  。应用中的查询不使用索引;
  。重建索引之前必须先删除索引,若用alter index … rebuild重建索引,则不必删除索引。
  
  索引数据块空间使用
  
  。创建索引时指定表空间,特别是在建立主键时,应明确指定表空间;
  。合理设定pctfress,注意:不能给索引指定pctused;
  。估计索引的大小和合理地设置存储参数,默认为表空间大小,或initial与next设置成一样大。
  
  考虑并行创建索引
  
  。对大表可以采用并行创建索引,在并行创建索引时,存储参数被每个查询服务器进程分别使用,例如:initial为1M,并行度为8,则创建索引期间至少要消耗8M空间;
  
  考虑用nologging创建索引
  
  。对大表创建索引可以使用nologging来减少重做日志;
  。节省重做日志文件的空间;
  。缩短创建索引的时间;
  。改善了并行创建大索引时的性能。

  怎样建立最佳索引
  
  明确地创建索引
  create index index_name on table_name(field_name)
  tablespace tablespace_name
  pctfree 5
  initrans 2
  maxtrans 255
  storage
  (
  minextents 1
  maxextents 16382
  pctincrease 0
  );
  
  创建基于函数的索引
  
  。常用与UPPER、LOWER、TO_CHAR(date)等函数分类上,例:
  create index idx_func on emp (UPPER(ename)) tablespace tablespace_name;
  
  创建位图索引
  
  。对基数较小,且基数相对稳定的列建立索引时,首先应该考虑位图索引,例:
  create bitmap index idx_bitm on class (classno) tablespace tablespace_name;
  
  明确地创建唯一索引
  
  。可以用create unique index语句来创建唯一索引,例:
  create unique index dept_unique_idx on dept(dept_no) tablespace idx_1;
  
  创建与约束相关的索引
  
  。可以用using index字句,为与unique和primary key约束相关的索引,例如:
  alter table table_name
  add constraint PK_primary_keyname primary key (field_name)
  using index tablespace tablespace_name;
  
  如何创建局部分区索引
  
  。基础表必须是分区表;
  。分区数量与基础表相同;
  。每个索引分区的子分区数量与相应的基础表分区相同;
  。基础表的子分区中的行的索引项,被存储在该索引的相应的子分区中,例如:
  Create Index TG_CDR04_SERV_ID_IDX On TG_CDR04(SERV_ID)
  Pctfree 5
  Tablespace TBS_AK01_IDX
  Storage (
  MaxExtents 32768
  PctIncrease 0
  FreeLists 1
  FreeList Groups 1
  )
  local
  /
  
  如何创建范围分区的全局索引
  
  。基础表可以是全局表和分区表。
  create index idx_start_date on tg_cdr01(start_date)
  global partition by range(start_date)
  (partition p01_idx vlaues less than (‘0106’)
  partition p01_idx vlaues less than (‘0111’)
  …
  partition p01_idx vlaues less than (‘0401’ ))
  /
  
  重建现存的索引
  
  重建现存的索引的当前时刻不会影响查询;
  
  重建索引可以删除额外的数据块;
  
  提高索引查询效率;
  alter index idx_name rebuild nologging;
  
  对于分区索引:
  alter index idx_name rebuild partition partiton_name nologging;
  
  要删除索引的原因
  
  。不再需要的索引;
  。索引没有针对其相关的表所发布的查询提供所期望的性能改善;
  。应用没有用该索引来查询数据;
  。该索引无效,必须在重建之前删除该索引;
  。该索引已经变的太碎了,必须在重建之前删除该索引;
  。语句:drop index idx_name;drop index idx_name drop partition partition_name;
  
  建立索引的代价
  
  基础表维护时,系统要同时维护索引,不合理的索引将严重影响系统资源,主要表现在CPU和I/O上;
  
  插入、更新、删除数据产生大量db file sequential read锁等待;

  SQL优化器简介
  
  基于规则的优化器
  
  。总是使用索引
  。总是从驱动表开始(from子句最右边的表)
  。只有在不可避免的情况下,才使用全表扫描
  。任何索引都可以
  
  基于成本的优化器
  
  。需要表、索引的统计资料
  Analyze table customer compute statistics;
  Analyze table customer estimate statistics sample 5000 rows;
  。表中设置并行度、表分区
  
  优化器模式
  
  rule模式
  
  。总忽略CBO和统计信息而基于规则
  choose模式
  
  。Oracle根据情况选择rule or first_rows or all_rows
  first_rows 模式
  
  。基于成本,以最快的速度返回记录,会造成总体查询速度的下降或消耗更多的资源,倾向索引扫描,适合OLTP系统
  all_rows模式
  
  。基于成本,确保总体查询时间最短,倾向并行全表扫描
  
  例如:
  Select last_name from customer order by last_name;用first_rows时,迅速返回记录,但I/O量大,用all_rows时,返回记录慢,但使用资源少。
  
  调整SQL表访问
  
  全表扫描
  
  。返回记录:未排序表>40%,排序表>7%,建议采用并行机制来提高访问速度,DDS;
  
  索引访问
  
  。最常用的方法,包括索引唯一扫描和索引范围扫描,OLTP;
  
  快速完全索引扫描
  
  。访问索引中所有数据块,结果相当于全表扫描,可以用索引扫描代替全表扫描,例如:
  
  Select serv_id,count(* ) from tg_cdr01 group by serv_id;
  
  评估全表扫描的合法性
  
  如何实现并行扫描
  
  。永久并行化(不推荐)
  alter table customer parallel degree 8;
  
  。单个查询并行化
  select /*+ full(emp) parallel(emp,8)*/ * from emp;
  
  分区表效果明显
  
  优化SQL语句排序
  
  排序的操作:

你可能感兴趣的:(数据结构,oracle,sql)