一个最重要的性能指标是延迟(等待时间),延迟度量系统运行状况及系统资源可用性,延迟取决于队列。存储系统类似于杂货店收银台排队,每个组件都有确定的性能最大值,系统趋近最大性能会增加延迟。延迟小于10毫秒的目标并非偶然。SQL Server最佳实践提倡延迟不超过20毫秒。如果你实施AlwaysOn Availability Groups同步数据复制,就不能容忍超过10毫秒的延迟,并且很多应用系统甚至对延迟更敏感。下面将会探索如何准确测量性能及延迟。
存储性能计数器
Windows Performance Monitor(perfmon)允许Windows Server用户捕获存储性能指标。为了监视存储,你要利用LogicalDisk性能监视器对象。逻辑和物理磁盘计数器都提供存储性能指标。逻辑磁盘计数器一个特定分区的性能,而物理磁盘计数器覆盖整个LUN(Logical Unit Number是一个术语,它描述存储控制器上所承载的存储卷)。可用的Windows存储性能计数器如下:
Average Disk Sec/Read和Write计数器用来衡量I/O操作从服务器发送到存储系统并返回所花费的时间。这个延迟度量是I/O系统运行状况的一个最大的指示器。分别对待读和写,是因为大多数存储系统执行一个操作比另一个操作更快。延迟计数器以毫秒度量。0.001是1毫秒,0.01是10毫秒,0.1是100毫秒。SQL Server最佳实践提倡延迟低于20毫秒。但是,这不是必须遵守的规则,因为很多应用系统不能容忍超过几毫秒的延迟。理解基本的硬件配置,应用系统及工作负载是件重要的事。一些情况,例如SQL Server标准备份,大量的I/O会大幅增加延迟。如果你把备份I/O大小改为8MB,那么延迟就会增加,但是你仍然可以完成很多工作。
Disk Reads/sec和Disk Writes/sec两个计数器用来显示每秒钟产生多少I/O(IOPS)。Disk Read Bytes/sec和Disk Write Bytes/sec显示存储系统的吞吐量。要计算平均的I/O大小,只需通过每秒字节数除以每秒操作数。I/O的大小可以反映应用程序的行为。执行高度随机的I/O访问时,SQL Server会写入8KB数据页并从数据文件中读取64KB的数据区。执行连续操作,如表扫描,会产生8KB到512KB的I/O。动态的I/O大小,也被称为预读。增加I/O大小能减少I/O数并提高效率。
磁盘驱动器性能
磁盘驱动器(如图4-12)是由外部逻辑电路板和内部硬盘驱动器组成。逻辑板提供磁盘和主机之间的连接。每个驱动器接口支持多种可用通信协议之一。现代的接口使用高速串行连接。最常用的数据库应用程序接口是SATA(串行高级技术附件),FC(光纤通道)和SAS(串行连接SCSI)。
物理读写数据是通过磁头。每个驱动器盘片有一个专有的驱动磁头,磁头能够来回移动。SATA磁盘容量比FC或SAS大,转速为5400~7200RPM。FC和SAS是企业级的磁盘驱动器,有7200、10000和15000RPM等型号。NL-SAS驱动提供了高可靠性的使用SAS接口的企业SATA。驱动器制造商提供了一个称为最大寻道时间的度量,它反映了驱动器磁头从最内层轨道移动到最外层轨道所需要的时间。制造商还提供了平均寻道时间,即驱动器磁头移动到磁盘上的任何位置所要花费的平均时间。
磁盘驱动器延迟
磁盘在一毫秒极限内旋转的次数限制了驱动器产生的数据量,有个限制叫旋转延迟。要计算一个硬盘能执行多少随机I/O,可采用如下公式:
IOPS = 1,000 ÷ (Seek Time + ((60,000 ÷ RPM) ÷ 2)
最常用的磁盘驱动器的IOPS如下:
7,500 RPM SATA: 80 = 1,000 ÷ (8.5 + ((60,000 ÷ 7,500) ÷ 2))
15,000 RPM SAS: 185 = 1,000 ÷ (3.4 + ((60,000 ÷ 15,000) ÷ 2))
如果你需要更多的IOPS,那么只需增加更多的磁盘。RAID导致空间和性能开销(overhead),表4-2提供了计算常见RAID开销的指南,请记住,每个系统是不同的,因人而异。
连续磁盘访问
连续的磁盘访问比随机磁盘访问要高效很多,因此,SQL Server设计特别,以便优化连续磁盘访问。最坏的情况下,SQL Server读取64KB数据区,写入8KB数据页。当SQL Server探测连续访问,它可以动态地将请求大小增加到最大值512KB,这会产生使存储更有效的效果。混配的有更大I/O的连续操作甚至更给力。如果RPM为15000的磁盘执行64KB的随机读,它将生产大约12MB/s,同样的驱动能执行88MB/s的连续64KB读。把I/O大小改为512KB将立即能促使磁盘驱动器冲击600MB/s的最大传输速率。增加I/O大小有其局限性,大部分硬件RAID控制器设计为128KB I/O。产生他打的I/O会使系统资源紧张,并增加延迟。例如,SQL Server备份能产生1000KB的I/O,对于多数磁盘阵列来说,这会引起很多压力和高延迟。把备份改为使用512KB的I/O,通常会降低延迟,也会降低完成备份所需的时间。每种存储阵列都是不同的,因此一定要尝试不同的I/O大小,以确保备份最佳运行。Henk Van Der Valk写了几篇文章,强调备份优化:
http://henkvandervalk.com/how-to-increase-sql-database-full-backup-speed-using-compression-and-solid-state-disks
http://henkvandervalk.com/how-to-increase-the-sql-database-restore-speed-using-db-compression-and-solid-state-disks
这里的备份说明中把最大传输大小设置为512KB:
BACKUP DATABASE [DBName] TO DISK = N'E:\dump\BackupFile.bak' WITH MAXTRANSFERSIZE=524288, NAME = BackupName GO
服务器队列
每个物理磁盘驱动器都能执行和排队一个操作。把磁盘聚集到RAID集,能增加可能的I/O池。比如,一个RAID集包含10个磁盘驱动器,它就能优化运行20个未解决的(outstanding)I/O。流式I/O需要I/O队列,以便继续以高速率运作。检查服务器的HBA设置,确保它们最大化地用于应用程序产生的I/O。多数HBA由厂商设置为一个队列32个未处理的I/O。把该值提高到最大,常常能实现更高的性能。SQL Server FAST Track程序锐减队列的深度设置为64。记住,在一个共享存储SAN环境中,实现一个应用系统的性能增益是以整体性能为代价的。