SQL Server性能调教系列(6)—Index Structure and Tuning

一:前言

Index对数据库性能有着举足轻重的作用。Index设计的优劣直接影响到DB执行的效率。所以在做DB Tuning时,一部分会从Index着手处理,SQL Server也提供了很好的工具Database Engine Tuning Advisor,会给出一些建Index和优化方面的建议。

 

二:Index概述

这方面在各个博客论坛上面已经讲的比较多了,在此大致总结一下:

1. 数据表的基本结构

当建立一个新表时,系统将在磁盘中分配一段以8K为单位的连续空间;当第一个8K用完的时候,SQL Server指针会自动分配8K的空间。每个8K空间成为一个数据页(Page),又称页面或者数据页面,并分配0-7的页号,每个文件的第0页记录引导信息,叫文件头(File Header);每8个数据页(64K)的组合形成扩展区(Extent),成为扩展。全部的数据页的组合形成堆(Heap)。

 

2. 索引的基本概念

建立索引的目的就是提高数据检索效率,改善数据库工作性能,提高数据访问速度。系统表sysindexes存储Index的重要信息。以B-Tree为存储结构。

 

3. 数据表扫描与索引的使用

没有索引时,访问表的数据时按照Table Scan,平均效率比较低。

建立索引时,访问表的数据时按照Index Scan/Seek,平均效率很高。

image

 

4. 聚集索引和非聚集索引(Clustered Index and Non Clustered Index)

相同点:

  • 以B-Tree为存储结构存放的一组数据页
  • 不同阶的节点包含指向另一个阶的数据页
  • 子节点包含所有的键值
  • 在sysindexes中可以找到索引的大小和内容分布
  • 都会提高数据查询的效率

不同点:

  • 叶子节点存放什么:聚集索引存放实际的数据页;非聚集索引存放指针

image 

注意:子叶层级存放的内容不一样。

 

5. 覆盖索引(Covering Index)

索引覆盖是指建索引的字段正好是覆盖查询条件中所涉及的字段,这里需要注意的是,必须是从第一个开始覆盖。

 

6. 死锁(DackLock)

请参照

http://www.cnblogs.com/changbluesky/archive/2010/06/10/1753021.html

 

三:性能简述(Performance)

1. Index碎片

1.1 查询碎片

sys.dm_db_index_physical_stats可以用来检测特定索引、表或索引视图的所有索引、数据库中所有索引或所有数据库中所有索引中的碎片。

捕获2

重要栏位:

avg_fragmentation_in_percent 逻辑碎片(索引中的无序页)的百分比
fragment_count 索引中的碎片(物理上连续的叶页)数量
avg_fragment_size_in_pages 索引中一个碎片的平均页数

 

1.2. 重建索引与重组索引(rebuild and reorganize)

无论何时对基础数据执行插入、更新或删除操作,SQL Server 数据库引擎都会自动维护索引。随着时间的推移,这些修改可能会导致索引中的信息分散在数据库中(含有碎片)。当索引包含的页中的逻辑排序(基于键值)与数据文件中的物理排序不匹配时,就存在碎片。碎片非常多的索引可能会降低查询性能,导致应用程序响应缓慢。通过重新组织索引或重新生成索引来修复索引碎片,提高性能。

  • ALTER INDEX IX_IndexName ON dbo.TableName REBUILD WITH (ONLINE=ON)
  • ALTER INDEX IX_IndexName ON dbo.TableName REORGANIZE

 

两种方法的区别:

  • 重新组织索引是通过对叶页进行物理重新排序,使其与叶节点的逻辑顺序(从左到右)相匹配,从而对表或视图的聚集索引和非聚集索引的叶级别进行碎片整理。
  • 重新生成索引将删除该索引并创建一个新索引。此过程中将删除碎片,通过使用指定的或现有的填充因子设置压缩页来回收磁盘空间,并在连续页中对索引行重新排序(根据需要分配新页)。这样可以减少获取所请求数据所需的页读取数,从而提高磁盘性能。

 

建议根据碎片程度,使用修复碎片的最佳方法:

image

 

2. 选择正确而的Index

2.1 主要的考量

以范围查询

常常需要排序的数据

2.2 次要考量

栏位长度要短

  • 会影响所有的非聚集索引
  • 非聚集索引的子也曾都包含所有聚集索引的键值

数据的类型

 

3.建立索引的方针

所有SQL语法的优先性

优先建立多个查询语法可以共通使用的索引

建立符合索引时,最佳的栏位顺序

 

四:总结

 

与书中的索引一样,数据库中的索引使您可以快速找到表或索引视图中的特定信息。索引包含从表或视图中一个或多个列生成的键,以及映射到指定数据的存储位置的指针。通过创建设计良好的索引以支持查询,可以显著提高数据库查询和应用程序的性能。索引可以减少为返回查询结果集而必须读取的数据量。索引还可以强制表中的行具有唯一性,从而确保表数据的数据完整性。

设计良好的索引可以减少磁盘 I/O 操作,并且消耗的系统资源也较少,查询优化器也能够很好的利用索引,提高查询性能。

 

>>>SQL Server性能调校系列入口地址

你可能感兴趣的:(SQL Server)