浅析索引组织表那点事

Oracle索引组织表中逻辑ROWID的物理猜是如何实现的,而这次看的时候很自然的就想明白其中的实现。

Oracle的普通表即堆表,存储数据时没有顺序可言,而Oracle的索引组织表是根据主键顺序来存储表中的数据的。

如果表中的数据都是通过主键来访问,那么没有任何,可是很多时候,需要在表上建立除主键之外的索引,而这就导致了一个问题。

对于普通表而言,Oracle保证数据插入到表中之后,数据的物理地址ROWID不会再发生改变。当然对表进行MOVE,或者ENABLE ROW MOVEMENT之后对分区表的分区键值进行修改等明确导致表数据位置发生变化的操作除外。也就是说,普通的增、删、改不会导致现有记录的物理地址发生变化。即使记录的长度发生了变化,导致当前数据块中无法容纳这条记录,Oracle也会在原位置上留下一个ROWID信息,通过这个ROWID信息可以找到这条记录的新的位置。这也就是行迁移、行链接的实现方式。虽然增加了额外的IO,但是确保了ROWID不发生变化。

索引正是利用了这种特性。索引中包括被索引的字段和这条记录的ROWIDOracle在索引中找到对应的键值后,根据这个键值对应的ROWID,就可以找到表中的这条对应的记录。正是ROWID不发生变化的特性使得索引可以正常的工作。可以看到,前面提到的MOVE,以及一些导致ROWID发生变化的分区操作,在使得ROWID变化的同时,也会导致索引处于不可用状态。

那么现在存在一个问题,对于索引组织表而言,为了保证数据存储是根据主键顺序进行的,就必须根据数据的增、删、改随时调整表中数据的位置,这使得ROWID不发生改变这个前提无法实现。而对于索引组织表,第二个索引需要一个方法来找到表中数据的具体位置,因此也就有了逻辑ROWID

对于索引组织表,虽然存储位置可能会经常发生变化,但是主键是必须存在的。如果不能通过物理位置来寻找,那么通过主键来查找也可以找到这条记录。不过Oracle的实现并不是这么简单。




适用场合(信息获取、空间应用、OLAP应用特别有用):

1.保证数据存储某个位置,或数据以某种特定顺序物理存储;希望数据物理地共同存储在一处,父子关系表是这样一个经典例子。
如:create table emp as
               select object_id          empno,  
                          object_name    ename,
                          created             hiredata,
                           owner               job
           from all_objects;
   alter table emp add constraint emp_pk primary key(empno);
         create table  iot_address
           (empno    references  emp(empno)     on  delete   cascade,
            addr_type   varchar2(10),
            street            varchar2(20),
           city                varchar2(20),
           state             varchar2(2),
           zip                 number,
           primary key (empno,addr_type)
           ) organization   index
 /
测量select * from emp, iot_addresses where emp.empno=iot_addresses.empno 比较consistent gets 明显减少。每个I/O和每个“一致获取”都需访问缓冲区缓存,每个缓冲区缓存获取都需要缓冲区缓存的多个闩,闩是串行化设备。
IOT提供好处
#提高缓冲区缓存效率,因为给定查询在缓存中需要块更少
#减少缓冲区缓存访问,这会改善可扩展性
#获取数据工作问题更少,因为获取数据更快
#每个查询完成物理I/O更少(对任何给定查询,需要块更少,对地址记录的一个物理I/O可能可以获取所有地址)
2.经常在一个主键或唯一键上使用BETWEEN查询。
  如维护一股价表,每天收集数百支股票股价记录、日期、收盘价、当日最高、当日 最低等。
 create table stocks(
    ticker varchar2(10),    
    day  date,    value number,    change  number,  high number, vol number,primary key (ticker,day))   organization index  ;
经常一次查看一支股票几天内表现(如计算移动平均数)。如用堆组织表,对应记录的两行在同一块上几率为0.   考虑IOT中, 只需要读取相关索引块,这个索引块中已有所有数据。且一段时期内一记录所用行都物理存储在相互“邻近”位置引入逻辑I/O和物理I/O都更少。


IOT选项NOCOMPRESS、PCTTHRESHOLD、OVERFLOW、INCLUDING

【IOT是表,但是只是有其名而无其实。IOT段实际上是一个索引段】
OVERFLOW允许建立另一个段,如IOT的行数据变得太大,就可以溢出到这个段中(构成主键的列不能溢出,它们必须直接放在叶子块上)。
溢出段的条件可采用以下两种方式指定:
PCTTHRESHOLD:
行中数据量超出块的这个百分比,行中余下列存储在溢出段中。
INCLUDING:
   行中从 第一列直到INCLUDING子句所指定列 的所有列都存储在索引列上,余下列存储在溢出段中。
如:create table iot (x int ,   y      date, z  varchar2(2000), constraint iot_pk     primary key (x))
organization index pctthreshold 10 overflow;
     create table iot (x    int ,y date , z varchar2(2000) ,constraint iot_pk primary key (x) )
organization index including y overflow;
一旦确定平均索引块上可存储多少行,设置PCTTHRESHOLD就容易,如每个索引 块上存储20行,说明每行应该是1/20(50%),PCTTHRESHOLD是5.

索引组织表属性

1、OVERFLOW子句(行溢出)

   因为所有数据都放入索引,所以当表的数据量很大时,会降低索引组织表的查询性能。此时设置溢出段将主键和溢出数据分开来存储以提高效率。溢出段的设置有两种格式:

PCTTHRESHOLD n :制定一个数据块的百分比,当行数据占用大小超出时,该行的其他列数据放入溢出段

INCLUDING column_name :指定列之前的列都放入索引块,之后的列都放到溢出段

● 当行中某字段的数据量无法确定时使用PCTTHRESHOLD

     ● 若所有行均超出PCTTHRESHOLD规定大小,则考虑使用INCLUDING

createtablet88(

IDvarchar2(10),

NAMEvarchar2(20),

constraintpk_id primarykey(ID)

 )

organizationindex

PCTTHRESHOLD20

overflowtablespaceusers

INCLUDINGname;


● 如上例所示,name及之后的列必然被放入溢出列,而其他列根据PCTTHRESHOLD规则。



2、COMPRESS子句(键压缩)


   与普通的索引一样,索引组织表也可以使用COMPRESS子句进行键压缩以消除重复值。

   具体的操作是,在organization index之后加上COMPRESS n子句

● n的意义在于:指定压缩的列数。默认为无穷大。

   例如对于数据(1,2,3)、(1,2,4)、(1,2,5)、(1,3,4)、(1,3,5)时

   若使用COMPRESS则会将重复出现的(1,2)、(1,3)进行压缩

   若使用COMPRESS 1时,只对数据(1)进行压缩

索引组织表的维护

   索引组织表可以和普通堆表一样进行INSERT、UPDATE、DELETE、SELECT操作。

   可使用ALTER TABLE ... OVERFLOW语句来更改溢出段的属性。

altertable t88 addoverflow; --新增一个overflow

● 要ALTER任何OVERVIEW的属性,都必须先定义overflow,若建表时没有可以新增

altertable t88 pctthreshold15includingname; --调整overflow的参数

altertable t88 initrans2overflowinitrans4; --修改数据块和溢出段的initrans特性

● 关于initrans的概念参考 http://space.itpub.net/265709/viewspace-166534

索引组织表的应用


   Heap Table 就是一般的表,获取表中的数据是按命中率来得到的。没有明确的先后之分,在进行全表扫描的时候,并不是先插入的数据就先获取。数据的存放也是随机的,当然根据可用空闲的空间来决定。


IOT 就是类似一个全是索引的表,表中的所有字段都放在索引上,所以就等于是约定了数据存放的时候是按照严格规定的,在数据插入以前其实就已经确定了其位置,所以不管插入的先后顺序,它在那个物理上的那个位置与插入的先后顺序无关。这样在进行查询的时候就可以少访问很多blocks,但是插入的时候,速度就比普通的表要慢一些。
适用于信息检索、空间和OLAP程序。


索引组织表的适用情况:
1、 代码查找表。
2、 经常通过主码访问的表。
3、 构建自己的索引结构。
4、 加强数据的共同定位,要数据按特定顺序物理存储。
5、 经常用between…and…对主码或唯一码进行查询。
数据物理上分类查询。如一张订单表,按日期装载数据,想查单个客户不同时期的订货和统计情况。


本文出自 “算法之道” 博客,转载请与作者联系!

你可能感兴趣的:(oracle,索引组织表)