索引是怎么工作的


相关于数据库表索引,一直没有仔细阅读相关的资料。上周,在网上看到一篇博客, 看Sybase官方手册学索引工作原理,其总结的是SAP ASEv12,读后收获不小,特地也找了下SAP ASEv16.0的 Performance and Tuning Series- Locking and Concurrency Control文档,试着翻译了一部分,以备学习。

7 索引

索引是用于提升数据库性能的重要设计要素,它可以明显地加速数据检索过程(增删改查):

  • 避免表扫描。
  • 不访问数据行,而从非聚集索引中获取数据。
  • 聚集索引有助于随机插入数据从而避免在表的最后页插入。
  • 如果索引的顺序匹配了order by子句的列顺序,索引有助于避免排序。
  • 对于大多数分区域的表,用户可以使用一个覆盖全表的带有索引树的全局索引,或者创建多个带有索引树的本地索引,其中每一个索引覆盖表的一个分区。

虽然索引加速了数据检索,但是它们也可能减慢数据的修改,因为对于大多数据修改需索引更新。优化索引有必要理解如下内容:

  • 对于不同索引表类型的查询行为。例如,无索引的堆表,带有聚集索引的表及带有非聚集索引的表。
  • 混合查询。
  • 在分区表上的本地和全局索引的彼此相对优势。
  • SAP ASE的优化器。

7.1 索引类型

SAP ASE 提供的两种通用索引类型:

  • 聚集索引,数据在物理上依照索引键的顺序存储:
  • 对于全页锁类型(allpages-locked,事务处理时,既锁数据页,又锁索引页,且只有表锁和页锁。)的表,在页上的行依照索引键的顺序保存,并且页也依照索引键的顺序链接。
  • 对于数据锁类型(data-only-locked,事务处理时,只锁数据页,不锁索引页,具有表锁、页锁和行锁)的表,索引被用于指引存储在行和页上的数据,但严格的键顺序不被维护。
  • 非聚集索引,表上的数据存储顺序与索引的键无关。

用户只能在一个表或分区上创建一个聚集索引,因为只可能有一种数据行的顺序。用户在每个表上可以创建249个费聚集索引。
没有聚集索引的表也叫做堆。这样的表中的行没有指定顺序,所有新增加的行都被增加到表的最后。
基于函数的索引是一种非聚集索引,它使用一个或多个表达式作为索引的键。

7.1.1 索引页

索引实体在索引页上作为行保存,其格式近似于在数据页上数据行。索引实体保存健值和指针,这些指针指向的是更下一级的索引、数据页、或者单独的数据行。
SAP ASE 使用B-tree索引,在其索引结构中每一节点都可以有多个子节点。
索引实体通常比数据页中的数据行更小,并且索引页也显然比数据页排布地更紧密。假设数据行有 200 bytes(包括行的基本开销),在页大小为2K的服务器上,每一页就有10行。然而同样页大小(2K)的条件下,一个基于15-byte行域大小的索引在每个索引页上有会有100行(每个行指针需要 4-9 bytes,依赖于其索引类型和索引等级)。
索引可以有多个等级:

  • 根等级(Root level)
  • 叶等级(Leaf level)
  • 中间等级(Intermediate level)

7.1.1.1 根等级

根等级是索引最高等级。只有唯一一个根索引页。
如果全页锁类型(allpages-locked)的表非常小,则整个索引容纳于单索引页,没有中间等级索引及叶等级索引,根索引页保存了指向数据页的指针。
数据锁类型(data-only-locked)的表在根索引页和数据页之间一直有叶等级索引。
对于比较大的表,根等级索引页保存的指针,指向中间等级索引页或是叶等级索引页。

7.1.1.2 叶等级

索引最低等级是叶等级
在叶等级,对应一个数据表中每一行的健值包含一个索引中,并且这些行依照索引键的顺序保存:

  • 对于在全页琐类型的表上的聚集索引,叶等级索引就是数据。没有其他等级的索引包含对应每一数据行的某一索引行。
  • 对于在数据锁类型表上的非聚集索引和聚集索引,叶等级索引包含的的健值,对应每一行,每一个指向页的指针,以及包含有特定健值的行。
    叶等级仅仅是在数据上的等级;它对于每一数据行都有一个索引行。在索引页上的索引行都以键值顺序保存。

7.1.1.3 中间等级

所有在根等级和叶子等级间的等级都是中间等级。在大表上索引或是使用了长键的索引都有很多中间等级索引。在非常小的表上很可能没有中间等级索引,即根索引页直接指向了叶索引等级。

7.1.2 索引大小

针对于APL(allpages-locked)和DOL(data-only-locked)表的索引大小限制:

页大小 用户可见的索引行大小限制 内部额索引行大小限制
2K(2048 bytes) 600 650
4K(4096 bytes) 1250 1310
8K(8192 bytes) 2600 2670
16K(16384 bytes) 5300 5400

用户可以创建表,其列的宽度比其索引的键的限制宽,然而这些列却是不可索引的。例如,用户执行如下语句在2K大小页的数据库服务器上,那么创建一个在c3上的索引,执行命令会失败,并且SAP ASE报出一个错误信息,即由c3超出索引行的大小限制(600 bytes):

create table t1 (c1 intc2 intc3 char(700))

用户可以为不可索引的列创建统计数据,或者包含在搜索结果中。并且如果用户把这样的列包含在了where语句中,那么它会在优化阶段被评估。
一个索引行的大小过大会导致频繁地使索引页分拆。索引页分拆可以使得索引等级随着表中数据行数的增加而线性增长,如此的话,由于索引遍历费时费力致使索引失去有效性。SAP ASE限制索引的大小,最多到数据库服务器设定的页大小的1/3,这样每一索引页都包含至少三个索引行。

未完待续……

你可能感兴趣的:(索引是怎么工作的)