理解SQL Server统计信息

 

英文原文:

http://blog.idera.com/sql-server/understanding-sql-server-statistics/

 

“统计信息提供了对你听到或看到的信息作出智能反应的工具”-- David Lane,2003

 

使用Idera的免费工具识别过期的SQL Server统计信息 – SQL Update Statistics!

 

如果有一个即将到来的选举,你正在竞选并准备带着传单走遍乡村和城市,你想知道大概要带多少传单。

 

如果你是一个运动队的教练,在决定谁、什么时候参加比赛、对谁之前,你想了解选手的状态。你常玩一个配对游戏,即使你有20个选手,你可能允许同时玩5次,你想知道你的哪位选手最匹配其他队伍的球员清单。你不想在比赛时一个个看(表扫描),你想基于他们的统计信息知道,谁最适合。

 

就像选举候选人和运动队教练,SQL Server尝试使用统计信息在它的查询优化中“智能感知”。了解到行数、页密度、直方图,或可用索引帮助SQL Server优化器更精准判断它如何最好的获取数据。有一个通常的误解是,如果你有索引,SQL Server会在查询中使用索引获取记录。不一定。如果你在小于90%的值为“Vancouver”的City列上创建索引,SQL Server如果知道这些统计信息,最可能表扫描而不是使用索引。

 

大多数时候,我们最起码要保持统计信息更新(基于你的配置),但是更好的理解统计信息是为了帮助我们更好的理解SQL Server优化。

 

如果创建统计信息?

 

统计信息可以以不同的方式创建:

n 统计信息在创建每个索引的时候自动创建。

理解SQL Server统计信息_第1张图片c

n 如果数据库将自动创建统计信息设置为启用,那么SQL Server会对查询中使用的非索引列自动创建统计信息。

理解SQL Server统计信息_第2张图片

n CREATE STATISTICS语句。

理解SQL Server统计信息_第3张图片

 

统计信息是什么样的?

 

如果你好奇,有很多方法你可以看到统计信息是怎样的。

方法1 – 你可以在SSMS中“Statistics”节点,右击属性,然后选择“Details”。下面是一个从我的数据库的一个表收集的统计和直方图的示例。

理解SQL Server统计信息_第4张图片

方法2 – 你可以使用DBCC SHOW_STATISTICS WITH HISTOGRAM

理解SQL Server统计信息_第5张图片

直方图是可视化表中数据分布的很棒方式。

 

统计信息如何更新?

 

在SQL Server中的默认设置是自动创建和自动更新统计信息。

理解SQL Server统计信息_第6张图片

 

注意Auto Update statistics有两个选项。

n Auto Update Statistics意思是,如果你有一个查询而统计信息陈旧,SQL Server会在生成执行计划前先更新统计信息。

n Auto Update Statistics Asynchronously意思是,如果有一个查询而统计信息陈旧,SQL Server使用陈旧的统计信息去生成执行计划,然后再更新统计信息。

 

然而,Idera提供了很酷的免费工具,简化了查找和更新过期SQL Server表统计信息的过程,使用UI界面易于理解。在这里可以找到:

https://www.idera.com/productssolutions/freetools/sql-server-statistics

 

我们如何知道统计信息正在被使用?

 

当生成查询的执行计划时,你可以做好如下检查:

检查“Actual Number of Rows”和“Estimated Number of Rows”。

如果数量(持续的)相当接近,很有可能你的统计信息是更新的,并被优化器用于查询。如果不是,你应该重新检查统计信息创建或更新的频率。

 

我们应该如何设置该配置?

 

可能的情况是当你正在对一个表做大量更新时,你想临时禁用统计信息更新,你不想被自动更新减慢执行速度。

然而,对大多数情况,你会去保持设置:

n Auto create statistics

n Auto update statistics

 

参考:

Rob Carrol. http://blogs.technet.com/b/rob/archive/2008/05/16/sql-server-statistics.aspx

Elisabeth Redei有关于SQL Server统计信息的3篇出色系列文章:

http://sqlblog.com/blogs/elisabeth_redei/archive/2009/03/01/lies-damned-lies-and-statistics-part-i.aspx

http://sqlblog.com/blogs/elisabeth_redei/archive/2009/08/10/lies-damned-lies-and-statistics-part-ii.aspx

http://sqlblog.com/blogs/elisabeth_redei/archive/2009/12/17/lies-damned-lies-and-statistics-part-iii-sql-server-2008.aspx

 

关于统计信息的出色的书籍:

n Apress. Grant Fritchey & Sajal Dam. 《SQL Server 2008查询性能调优精华》

n RedGate. Holger Schmeling. 《SQL Server 统计信息》

 

更多资源:

白皮书 – Waiting on Wait Stats

Webcast – What Are You Waiting For?

Idera免费性能监控工具 – SQL check

Idera性能调优产品试用版 – SQL doctor

 

译者推荐:

在SQL Server 2008中被查询优化器使用的统计信息

https://msdn.microsoft.com/en-us/library/dd535534%28SQL.100%29.aspx