理解SQL Server统计信息
英文原文:
http://blog.idera.com/sql-server/understanding-sql-server-statistics/
“统计信息提供了对你听到或看到的信息作出智能反应的工具”-- David Lane,2003
使用Idera的免费工具识别过期的SQL Server统计信息 – SQL Update Statistics!
如果有一个即将到来的选举,你正在竞选并准备带着传单走遍乡村和城市,你想知道大概要带多少传单。
如果你是一个运动队的教练,在决定谁、什么时候参加比赛、对谁之前,你想了解选手的状态。你常玩一个配对游戏,即使你有20个选手,你可能允许同时玩5次,你想知道你的哪位选手最匹配其他队伍的球员清单。你不想在比赛时一个个看(表扫描),你想基于他们的统计信息知道,谁最适合。
就像选举候选人和运动队教练,SQL Server尝试使用统计信息在它的查询优化中“智能感知”。了解到行数、页密度、直方图,或可用索引帮助SQL Server优化器更精准判断它如何最好的获取数据。有一个通常的误解是,如果你有索引,SQL Server会在查询中使用索引获取记录。不一定。如果你在小于90%的值为“Vancouver”的City列上创建索引,SQL Server如果知道这些统计信息,最可能表扫描而不是使用索引。
大多数时候,我们最起码要保持统计信息更新(基于你的配置),但是更好的理解统计信息是为了帮助我们更好的理解SQL Server优化。
如果创建统计信息?
统计信息可以以不同的方式创建:
n 统计信息在创建每个索引的时候自动创建。
n 如果数据库将自动创建统计信息设置为启用,那么SQL Server会对查询中使用的非索引列自动创建统计信息。
n CREATE STATISTICS语句。
统计信息是什么样的?
如果你好奇,有很多方法你可以看到统计信息是怎样的。
方法1 – 你可以在SSMS中“Statistics”节点,右击属性,然后选择“Details”。下面是一个从我的数据库的一个表收集的统计和直方图的示例。
方法2 – 你可以使用DBCC SHOW_STATISTICS WITH HISTOGRAM
直方图是可视化表中数据分布的很棒方式。
统计信息如何更新?
在SQL Server中的默认设置是自动创建和自动更新统计信息。
注意Auto Update statistics有两个选项。
n Auto Update Statistics意思是,如果你有一个查询而统计信息陈旧,SQL Server会在生成执行计划前先更新统计信息。
n Auto Update Statistics Asynchronously意思是,如果有一个查询而统计信息陈旧,SQL Server使用陈旧的统计信息去生成执行计划,然后再更新统计信息。
然而,Idera提供了很酷的免费工具,简化了查找和更新过期SQL Server表统计信息的过程,使用UI界面易于理解。在这里可以找到:
https://www.idera.com/productssolutions/freetools/sql-server-statistics
我们如何知道统计信息正在被使用?
当生成查询的执行计划时,你可以做好如下检查:
检查“Actual Number of Rows”和“Estimated Number of Rows”。
如果数量(持续的)相当接近,很有可能你的统计信息是更新的,并被优化器用于查询。如果不是,你应该重新检查统计信息创建或更新的频率。
我们应该如何设置该配置?
可能的情况是当你正在对一个表做大量更新时,你想临时禁用统计信息更新,你不想被自动更新减慢执行速度。
然而,对大多数情况,你会去保持设置:
n Auto create statistics
n Auto update statistics
参考:
Rob Carrol. http://blogs.technet.com/b/rob/archive/2008/05/16/sql-server-statistics.aspx
Elisabeth Redei有关于SQL Server统计信息的3篇出色系列文章:
http://sqlblog.com/blogs/elisabeth_redei/archive/2009/03/01/lies-damned-lies-and-statistics-part-i.aspx
http://sqlblog.com/blogs/elisabeth_redei/archive/2009/08/10/lies-damned-lies-and-statistics-part-ii.aspx
http://sqlblog.com/blogs/elisabeth_redei/archive/2009/12/17/lies-damned-lies-and-statistics-part-iii-sql-server-2008.aspx
关于统计信息的出色的书籍:
n Apress. Grant Fritchey & Sajal Dam. 《SQL Server 2008查询性能调优精华》
n RedGate. Holger Schmeling. 《SQL Server 统计信息》
更多资源:
白皮书 – Waiting on Wait Stats
Webcast – What Are You Waiting For?
Idera免费性能监控工具 – SQL check
Idera性能调优产品试用版 – SQL doctor
译者推荐:
在SQL Server 2008中被查询优化器使用的统计信息
https://msdn.microsoft.com/en-us/library/dd535534%28SQL.100%29.aspx