教你创建Oracle复合索引(精)

什么是复合索引?

复合索引顾名思义,区别于单列索引,是由两个或多个列一起构成的索引。其在B树上的数据结构是什么样?如下图,是一个包含两列的复合索引。
教你创建Oracle复合索引(精)_第1张图片
如果你观察仔细,还会发现它的叶子节点是ASC递增排序的。现根据第一个值排序,然后根据第二个值排序。查的时候也一样,先查第一个值,在查第二个值。你可以想象以下,三个列组成的复合索引数据结构该是什么样的。

在实际开发中,我们经常会遇到创建表的情况。一开始,只会创建一个主键id,oracle会为主键默认创建索引。随着经验的增加,开始心有余力去考虑性能,会开始研究索引,比如查询报表、订单等业务场景。这时候多多少少都会创建索引了,然后开始研究复合索引。复合索引首先带来的问题是你如何在脑海中构建一个B树上的复合索引结构?接下来就到了如何创建复合索引的问题。
索引的建立,是为了提高查询效率,但索引设计不合理,又很影响写性能,这就像CAP只能满足其中两个条件一样。所以完美的东西不存在,万物是在矛盾中前行。说白了,就是要用最少、结构最简单的索引来达到目标。

实例

我们有这样一张表

id a b c
1 1 201 7
2 1 202 6
3 1 203 43
4 1 204 23
5 1 204 33
6 0 208 31
7 0 202 34

这张表有什么特点?
第一、经a、b和c都经常要被查询,并且有经常a、b、c组合查询的可能性。这就给了我们建索引的理由。
第二、a列区分度不大,b和c都有区分度。请问这种场景如何建索引?

下面看我们思考的逻辑:

  1. 很直观的想法,分别在a、b和c上分别建单列索引,即我们最终有三个索引,分别是(a)、(b)、(c)。这当然可以。但还有没有更好的?
  2. 比如在(a、b)、(b、c)、(a、c)上建复合索引。这样当然也可以。但维护起来开销比较大,还有没有更好的?
  3. 在(a、b、c)上建复合索引。这样维护起来开销也很大。并且a作为先导列,区分度不大,不是一个很好的选择。
  4. 最好的,应该是在(b、c)上建立复合索引,在c上建单列索引,这样(b、c)索引可以覆盖到a and b和b and c查询,c单列索引可以覆盖到a和b查询。当然口说无凭,最终的效果还要看oracle的执行计划。这里不在贴执行计划了,感兴趣可以自己尝试以下。

2018.11.29补充执行计划

首先创建表

CREATE TABLE sunyang_test( 
        id number, 
        a number, 
 b number, 
 c number 
)tablespace ebiz; 
alter table sunyang_test add constraint pk_sunyang_test primary key (id) using index tablespace ebiz; 

插入数据

begin 
        for i in 1 .. 100000 loop 
                insert into sunyang_test values(i,mod(i,2),mod(i,20000),mod(i,20000)); 
        end loop; 
        commit; 
end; 

创建索引

create index idx_sunyang_test_bc on sunyang_test(b,c) tablespace ebiz; 
create index idx_sunyang_test_c on sunyang_test(c) tablespace ebiz; 

我们开始执行下面的SQL
1.

select * from sunyang_test where b=5000; 

执行计划:
在这里插入图片描述
2.

select * from sunyang_test where c=5000; 

执行计划:
在这里插入图片描述
3.

select * from sunyang_test where a=1 and b=5000; 

执行计划:
在这里插入图片描述
4.

select * from sunyang_test where a=1 and c=5000; 

执行计划:
在这里插入图片描述
5.

select * from sunyang_test where b=5000 and c=5000; 

执行计划:
在这里插入图片描述
6.

select * from sunyang_test where a=1 and b=5000 and c=5000; 

执行计划:
在这里插入图片描述

可以看到,在a列区分度不大,且需要a、b、c单列查询或组合查询时,这样建索引将所有查询情况都覆盖到了,并且索引不复杂。

结束语

复合索引的设计,对于前导列的选择(也就是复合索引中的第一个列)非常重要,至少不应该在这里选择a作为一个复合索引的前导列,因为a的区分度太低了。有人说,不是有INDEX SKIP SCAN吗?这个确实要看a的实际值,如果a的取值很少,比如这里的两个,那么可以走INDEX SKIP SCAN,否则开销是很大的,往往Oracle直接去FULL TABLE SCAN了,也不会去INDEX SKIP SCAN,因为其涉及到索引分裂。

你可能感兴趣的:(oracle,索引,复合索引,数据库)