oracle索引碎片

author:skate

time:2010-05-31

 

 

索引页块碎片(Index Leaf Block Fragmentation)

 

这篇文章将会回答如下问题:

 

什么是索引页块碎片?什么时候被重用?
什么是半空索引碎片?什么时候被重用?

 

oracle的标准索引结构是B×tree结构,一个B×tree结构由三种block组成

 

 

根块(root block):在B×tree里有且只有一个block,所有访问索引都从这开始,root block下有很多child blocks。


分支块(Branch blocks):这是中间层,branch block是没有什么限制的,它是随着leaf block的增加而增加的,branch block一般是4层,如果多于4层,就影响性能了。在我们删除行时,branch block是不被删除的。


叶块(leaf block):叶块是最底层,上面存储着索引条目和rowid

 

索引和表数据是级联关系的,当删除表数据的时候,索引条目也会被自动删除,这样在index leaf
block就会产生碎片,这也就是在OLTP系统上有大量更新的表上不建议创建大量的索引,很影响性能
有的人说删除过的索引条目空间不会被再用,因为在应用中不会再有insert相同的数据。其实这个
说法不完全对的,除了半空叶块外,其他的删除的索引空间是可被再利用的。

 

eg:

 

本文的所有实验都是在如下平台测试:

 

SQL> select * from v$version;

BANNER
----------------------------------------------------------------
Oracle Database 10g Enterprise Edition Release 10.2.0.4.0 - Prod
PL/SQL Release 10.2.0.4.0 - Production
CORE    10.2.0.4.0      Production
TNS for 32-bit Windows: Version 10.2.0.4.0 - Production
NLSRTL Version 10.2.0.4.0 - Production

SQL>

 

 

SQL>  create table test_idx as select seq_test.nextval id,2000 syear, a.* from d
ba_objects a;

表已创建。

 

SQL> insert into test_idx  select seq_test.nextval id,2001 syear, a.* from dba_o
bjects a;

已创建50780行。

 

SQL> insert into test_idx  select seq_test.nextval id,2002 syear, a.* from dba_o
bjects a;

已创建50780行。

 

SQL> commit;

提交完成。

 

SQL> desc test_idx
 名称                                      是否为空? 类型
 ----------------------------------------- -------- ----------------------------

 ID                                                 NUMBER
 SYEAR                                              NUMBER
 OWNER                                              VARCHAR2(30)
 OBJECT_NAME                                        VARCHAR2(128)
 SUBOBJECT_NAME                                     VARCHAR2(30)
 OBJECT_ID                                          NUMBER
 DATA_OBJECT_ID                                     NUMBER
 OBJECT_TYPE                                        VARCHAR2(19)
 CREATED                                            DATE
 LAST_DDL_TIME                                      DATE
 TIMESTAMP                                          VARCHAR2(19)
 STATUS                                             VARCHAR2(7)
 TEMPORARY                                          VARCHAR2(1)
 GENERATED                                          VARCHAR2(1)
 SECONDARY                                          VARCHAR2(1)

 

SQL> create unique index idx_test on test_idx(syear,id) ;

索引已创建。

 

SQL>
SQL>   select segment_name , bytes/1024/1024 ,
  2             blocks, tablespace_name , extents
  3     from dba_segments
  4   where segment_name = 'IDX_TEST';

SEGMENT_NA BYTES/1024/1024     BLOCKS TABLESPACE_NAME                   EXTENTS
---------- --------------- ---------- ------------------------------ ----------
IDX_TEST                 4        512 USERS                                  19

SQL>

SQL> col object_name for a10
SQL>
SQL>  select object_name, object_id, data_object_id
  2                   from dba_objects
  3                 where object_NAME='IDX_TEST' ;

OBJECT_NAM  OBJECT_ID DATA_OBJECT_ID
---------- ---------- --------------
IDX_TEST        59545          59545 ---------Used to join X$BH table(从x$bh查询缓存blocks,要用DATA_OBJECT_ID)

SQL>

 

查看系统现在缓存多少,这个要用sysdba用户执行


SQL> select count(*) from x$bh where obj=59545 ;

  COUNT(*)
----------
        17

 

查看执行计划:
SQL> set autot trace exp
SQL> select syear,id from test_idx where syear>=2000 and syear<=2002;

执行计划
----------------------------------------------------------
Plan hash value: 285868359

--------------------------------------------------------------------------------

-

| Id  | Operation            | Name     | Rows  | Bytes | Cost (%CPU)| Time
|

--------------------------------------------------------------------------------

-

|   0 | SELECT STATEMENT     |          |   181K|  4613K|   102   (5)| 00:00:02
|

|*  1 |  INDEX FAST FULL SCAN| IDX_TEST |   181K|  4613K|   102   (5)| 00:00:02
|

--------------------------------------------------------------------------------

-


Predicate Information (identified by operation id):
---------------------------------------------------

   1 - filter("SYEAR">=2000 AND "SYEAR"<=2002)

Note
-----
   - dynamic sampling used for this statement

SQL>


执行一次查询,让oracle缓存相应的索引block

 

SQL> set autot trace statis
SQL> select syear,id from test_idx where syear>=2000 and syear<=2002;

已选择152340行。


统计信息
----------------------------------------------------------
          0  recursive calls
          0  db block gets
      10562  consistent gets
        411  physical reads
          0  redo size
    2964382  bytes sent via SQL*Net to client
     112105  bytes received via SQL*Net from client
      10157  SQL*Net roundtrips to/from client
          0  sorts (memory)
          0  sorts (disk)
     152340  rows processed

 

SQL> select syear,id from test_idx where syear>=2000 and syear<=2002;

已选择152340行。


统计信息
----------------------------------------------------------
          0  recursive calls
          0  db block gets
      10562  consistent gets
          0  physical reads
          0  redo size
    2964382  bytes sent via SQL*Net to client
     112105  bytes received via SQL*Net from client
      10157  SQL*Net roundtrips to/from client
          0  sorts (memory)
          0  sorts (disk)
     152340  rows processed

SQL>


这个时候再看看oracle缓存了多少

 

SQL> select count(*) from x$bh where obj=59545 ;

  COUNT(*)
----------
       438

 

由原来的17增加到438

 

SQL> analyze index idx_test validate structure;

索引已分析

 

SQL> select height, blocks, lf_blks, lf_rows, br_blks, br_rows  , del_lf_rows
om index_stats;

    HEIGHT     BLOCKS    LF_BLKS    LF_ROWS    BR_BLKS    BR_ROWS DEL_LF_ROWS
---------- ---------- ---------- ---------- ---------- ---------- -----------
         2        512        418     152340          1        417           0

SQL>

 

这个索引idx_test共有418个叶块都已经被缓存里了,和预期的是一样的,下面删除三分之一的数据

 

SQL> delete from test_idx where syear=2001;

已删除50780行。

 

SQL> commit;

提交完成。

 

SQL>

 

清空数据缓存

 

SQL> alter system flush buffer_cache;

系统已更改。

 

SQL> alter system flush buffer_cache;

系统已更改。

 

SQL> alter system flush buffer_cache;

系统已更改。

 

再次查询,发现缓存数有所下降了,从438到396


SQL> select count(*) from x$bh where obj=59545 ;

  COUNT(*)
----------
       396

 

再次执行查询,让其缓存索引块


SQL> set autot trace stat
SQL> select syear,id from test_idx where syear>=2000 and syear<=2002;

已选择101560行。


统计信息
----------------------------------------------------------
          0  recursive calls
          0  db block gets
       7186  consistent gets
        425  physical reads
          0  redo size
    1976416  bytes sent via SQL*Net to client
      74870  bytes received via SQL*Net from client
       6772  SQL*Net roundtrips to/from client
          0  sorts (memory)
          0  sorts (disk)
     101560  rows processed

SQL>

 

这次查询缓存的数量发现突然增加很多,从438增加到774
SQL> select count(*) from x$bh where obj=59545 ;

  COUNT(*)
----------
       774

 

突然增加这么多,推测是因为删除的那些空索引块需要重新从磁盘加载到buffer cache中,所以
缓存的会突然增加,用alter system flush buffer_cache不能完全清楚data cache,下面我reboot
数据库,再来查看下

 

重启数据库是为了完全清空缓存的索引

 

SQL> shutdown immediate;
数据库已经关闭。
已经卸载数据库。
ORACLE 例程已经关闭。

 

SQL> startup
ORACLE 例程已经启动。
Total System Global Area  574619648 bytes
Fixed Size                  1297944 bytes
Variable Size             192938472 bytes
Database Buffers          373293056 bytes
Redo Buffers                7090176 bytes
数据库装载完毕。
数据库已经打开。

 

执行查询,使索引缓存
SQL> select syear,id from test_idx where syear>=2000 and syear<=2002;

已选择101560行。

 

再来看缓存的多少
SQL> select count(*) from x$bh where obj=59545 ;

  COUNT(*)
----------
       425

 

我可以从查询结果中看到,缓存结果425和删除前的438,没有太大的变化,而我删除了三分之一的
数据,按理论说应该缓存的表很少了啊,我们在查看现在的叶块是多少

 

SQL> analyze index idx_test validate structure;

索引已分析

 

SQL> select height, blocks, lf_blks, lf_rows, br_blks, br_rows  , del_lf_rows fr
om index_stats;

    HEIGHT     BLOCKS    LF_BLKS    LF_ROWS    BR_BLKS    BR_ROWS DEL_LF_ROWS
---------- ---------- ---------- ---------- ---------- ---------- -----------
         2        512        418     152340          1        417       50780

SQL>

 

从结果来看,叶块和删除前一样418没有变化,这就进一步证明索引叶block虽然被删除了,但是并没有
释放空间,而查询语句并不会跳过这些删除的索引块,所以这些碎片对性能产生很多的影响。

 

那如何完全删除索引叶块呢?


SQL> alter index idx_test rebuild nologging online;

索引已更改。

 

SQL> analyze index idx_test validate structure;

索引已分析

 

SQL> select height, blocks, lf_blks, lf_rows, br_blks, br_rows  , del_lf_rows fr
om index_stats;

    HEIGHT     BLOCKS    LF_BLKS    LF_ROWS    BR_BLKS    BR_ROWS DEL_LF_ROWS
---------- ---------- ---------- ---------- ---------- ---------- -----------
         2        384        276     101560          1        275           0

SQL>


SQL> select count(*) from x$bh where obj=59545 ;

  COUNT(*)
----------
       139

SQL>

 

通过以上结果可以看到删除的索引叶块的空间被释放了

 

在删除了2001年后 在insert2003年的

 

SQL>  insert into test_idx  select seq_test.nextval id,2003 syear, a.* from dba_
objects a;

已创建50781行。

 

SQL> commit;

提交完成。

 

SQL>   select segment_name , bytes/1024/1024 ,
  2             blocks, tablespace_name , extents
  3     from dba_segments
  4   where segment_name = 'IDX_TEST';

SEGMENT_NAME
--------------------------------------------------------------------------------

BYTES/1024/1024     BLOCKS TABLESPACE_NAME                   EXTENTS
--------------- ---------- ------------------------------ ----------
IDX_TEST
              4        512 USERS                                  19


SQL> analyze index idx_test validate structure;

索引已分析

 

SQL> select height, blocks, lf_blks, lf_rows, br_blks, br_rows  , del_lf_rows fr
om index_stats;

    HEIGHT     BLOCKS    LF_BLKS    LF_ROWS    BR_BLKS    BR_ROWS DEL_LF_ROWS
---------- ---------- ---------- ---------- ---------- ---------- -----------
         2        512        403     152341          1        402           0

SQL>

 

从查询结果来看,索引的总的块数为512,在delete和insert后没有增长,说明索引删除的空间
被重用了啊


什么是半空叶块(Half Empty Leaf Blocks)

 

一个叶块( Leaf Block)是用索引键值初始化的,当某些键值被删除后,这个叶块即包含删除的
索引键值,也包含未删除的索引键值,这时这个块就被称为”Half Empty Leaf Blocks“。

 

下面还是以test_idx为例


SQL>  insert into test_idx  select seq_test.nextval id,2005 syear, a.* from dba_
objects a ;

已创建50781行。

 

SQL>  insert into test_idx  select seq_test.nextval id,2005 syear, a.* from dba_
objects a ;

已创建50781行。

 

SQL>  insert into test_idx  select seq_test.nextval id,2005 syear, a.* from dba_
objects a ;

已创建50781行。

 

SQL>  insert into test_idx  select seq_test.nextval id,2005 syear, a.* from dba_
objects a ;

已创建50781行。

 

SQL> commit;

提交完成。

 

SQL>   select segment_name , bytes/1024/1024 ,
  2             blocks, tablespace_name , extents
  3     from dba_segments
  4   where segment_name = 'IDX_TEST';

SEGMENT_NAME
--------------------------------------------------------------------------------

BYTES/1024/1024     BLOCKS TABLESPACE_NAME                   EXTENTS
--------------- ---------- ------------------------------ ----------
IDX_TEST
              9       1152 USERS                                  24


SQL> delete from test_idx where syear=2005 and mod(id,2)=0;

已删除101562行。

 

SQL> commit;

提交完成。

 

在重新插入101562行数据


SQL>  insert into test_idx  select seq_test.nextval id,2006 syear, a.* from dba_
objects a ;

已创建50781行。

 

SQL>  insert into test_idx  select seq_test.nextval id,2006 syear, a.* from dba_
objects a ;

已创建50781行。

 

SQL>  select segment_name , bytes/1024/1024 ,
  2             blocks, tablespace_name , extents
  3     from dba_segments
  4   where segment_name = 'IDX_TEST';

SEGMENT_NAME
--------------------------------------------------------------------------------

BYTES/1024/1024     BLOCKS TABLESPACE_NAME                   EXTENTS
--------------- ---------- ------------------------------ ----------
IDX_TEST
             11       1408 USERS                                  26


SQL>

删除了101562行数据,再重新添加101562行数据,可索引块却增加了1408-1152=256个数据块,所以说半空块
索引并没有被重用。从下面的trace也可以看出

 

SQL> select object_id from dba_objects where object_name='IDX_TEST';

 OBJECT_ID
----------
     59545

 

得到tree的dump的命令如下


SQL> alter session set events 'immediate trace name treedump level 59545';

会话已更改。

 

然后查看对应的trace文件,如下所示:

 

branch: 0x100972c 16815916 (0: nrow: 3, level: 2)
   branch: 0x1007fe5 16809957 (-1: nrow: 511, level: 1)
      leaf: 0x100972d 16815917 (-1: nrow: 378 rrow: 378)
      leaf: 0x100972e 16815918 (0: nrow: 378 rrow: 378)
      .
      .
      .
      leaf: 0x1007ff2 16809970 (14: nrow: 400 rrow: 400)
      leaf: 0x1007ff6 16809974 (15: nrow: 400 rrow: 332)
      leaf: 0x1007ffa 16809978 (16: nrow: 400 rrow: 200)
      leaf: 0x1007ffe 16809982 (17: nrow: 400 rrow: 200)----------------- Half empty blocks
      leaf: 0x1008002 16809986 (18: nrow: 400 rrow: 200)
      .
      .
      .
      leaf: 0x1009f86 16818054 (19: nrow: 400 rrow: 200)
      leaf: 0x1009f4b 16817995 (20: nrow: 400 rrow: 400)
      .
      .
      .
      leaf: 0x1009f4f 16817999 (21: nrow: 400 rrow: 400)
      leaf: 0x100a15f 16818527 (274: nrow: 56 rrow: 56)

 

leaf: 0x1007ffe 16809982 (17: nrow: 400 rrow: 200)
解释: leaf block包含400行,这个块已经删除了200行的键值

 

识别索引是否有碎片

 

获得关于索引的信息,用下面的命令


analyze index index_name validate structure 或validate index index_name

 

analyze index index1 validate structure:是用来分析索引的数据块是否有坏块,以及根据分析得到的
数据(存放在index_stats)來判断索引是否需要重新建立。


运行命令后,然后在视图 index_stats查询,这个视图记录索引的一些信息,这个视图只有一个记录,所以在同一时间
只能分析一个索引。

 

1.删除的行数如占总的行数的30%,即del_lf_rows / lf_rows > 0.3,那就考虑索引碎片整理
2.如果”hight“大于4,可以考虑碎片整理
3.如果索引的行数(LF_rows)远远小于‘LF_BLKS’ ,那就说明有了一个大的删除动作,需要整理碎片

 

索引碎片整理方法

 

1. recreate index
2. alter index skate.idx_test rebuild nologging parallel 4 online ;
3. 如果叶块是half-empty or near empty,可以运行“alter index coalesce”来合并

 

 

 


参考文档:

http://oracleact.com/papers/index_leaf_block_frag.html
http://www.devx.com/gethelpon/10MinuteSolution/16596/0/page/2

 

 

 

 

----end----

 

 

 

 

 

 

 

 

你可能感兴趣的:(oracle,sql,object,insert,branch,structure)