聚集索引与非聚集索引

聚集索引与非聚集索引

        数据库索引在物理存储层面可以分为两类:聚集索引、非聚集索引。

1. 聚集索引(聚簇索引)

1.1 特性

        聚集索引可以类比字典中的A-Z的排序,字和字母的顺序一致(物理顺序与列值逻辑顺序相同),数据行的物理顺序与列值(一般是主键的那一列)的逻辑顺序相同。

1.2 规则

        因为聚集索引绑定了数据行的物理顺序,所以一个表中只能拥有一个聚集索引
        ==注:推荐建表时设置聚集索引,如果后期才添加聚集索引,数据量很大的时候,效率会很低, 因为需要移动数据行来维持聚集索引的逻辑顺序。==

MySQL中聚集索引的规则如下:

  • 如果一个主键被定义了,那么这个主键就是作为聚集索引
  • 如果没有主键被定义,那么该表的第一个唯一非空索引被作为聚集索引
  • 如果没有主键也没有合适的唯一索引,那么innodb内部会生成一个隐藏的主键作为聚集索引,这个隐藏的主键是一个6个字节的列,改列的值会随着数据的插入自增
聚集索引示意图

2. 非聚集索引

2.1 特性

        非聚集索引的逻辑顺序与磁盘上行的物理存储顺序不同,一个表中可以拥有多个非聚集索引,可以类比字典中的偏旁排序,字与偏旁顺序不一致。
        除了聚集索引,其他的索引都是非聚集索引,非聚集索引包括:普通索引、唯一索引、全文索引等。

非聚集索引示意图

2.2 非聚集索引的二次查询问题

        非聚集索引叶节点仍然是索引节点,只是有一个指针指向对应的数据块(上图中LeafLevel模块),此如果使用非聚集索引查询,而查询列中包含了其他该索引没有覆盖的列,那么他还要进行第二次的查询,查询节点上对应的数据行的数据。
        ==因为非聚集索引叶子节点除了会存储索引覆盖列数据,也存放聚集索引所覆盖的列数据。==

id userName score
1 张三 60
2 李四 70
3 王五 80
... ... ...

其中id为聚集索引(主键),userName为非聚集索引

-- 这两种sql,可以直接拿到结果值,不需要二次查询
select id, username from t1 where username = '小明';
select username from t1 where username = '小明';
-- 下面的sql需要二次查询去获得 score 的数据
select username, score from t1 where username = '小明';

2.3 优化二次查询问题

非聚集索引会存放索引覆盖的列及聚集索引覆盖的列,若要查询这些之外的数据,就需要进行二次扫描,降低了查询效率。解决方案就是对于频繁查询的列创建联合索引。
参照上例:
给 username 和 score 两列创建联合索引index(username,score),再执行下面的sql就不需要进行二次扫描:

select username, score from t1 where username = '小明';

==注:复合索引需要满足最左侧索引原则,如果查询条件中没有最左边的一列或者多列,那么符合索引不起作用。==

条件:

  • 最多可以把16个列合并成一个单独的复合索引
  • 构成复合索引的列的总长度不能超过900字节,复合列的长度不能太长
  • 所有的列必须来自同一个表中,不能跨表建立复合列
  • 在复合索引中,列的排列顺序是非常重要的,应该首先定义最唯一的列

3. 参考文章

  • 聚集索引和非聚集索引(整理)
  • mysql索引实现原理
  • MySQL聚集索引和非聚集索引
  • 索引原理

你可能感兴趣的:(聚集索引与非聚集索引)