一、 VNX性能收集

1、打开管理控制台system->monitoring and alters

EMC VNX点检向导_第1张图片

2、选择statistics for block

EMC VNX点检向导_第2张图片

3、点击performance data logging弹出对话框,在stop automatically after填写信息收集的天数,最少1天,最多7天,然后点击start。再定义的天数之后收集工作自动停止

EMC VNX点检向导_第3张图片

4、获得日志,点击Retrieve archive弹出对话框,选择收集的日志(可根据日期来确定),然后选择retrieve到本地电脑上

EMC VNX点检向导_第4张图片

EMC VNX点检向导_第5张图片

二、 VNX性能分析

1、存储各部件性能分析关注点:

? SP:Utilization, dirty pages, watermarks

? LUN:Ownership, forced flushes, throughput, I/O size

? DISK:IOPs, MB/s, Service Time, Queue Lengths

2、存储性能监控点:

? LUN Utilization: <50%

? Response Time: <10ms

? Average Queue Length: (视具体情况而定)

? Forced Flushes: 10/s

3、性能参数详解

? Utilization:利用率。对于存储来说,SP的利用率不差过70%,LUN的利用率不超过50%,那么我们认为该部件不存在性能问题。

? Watermarks:存储写内存的一个水位线参数,用于管理write cache flushing。EMC VNX存储默认的水位线为60%-80%。当cache usage超过80%,就会触发forced flushes。最佳状态是没有forced flushes,如果当每秒forced flushes数量超过10次,就存在性能问题。当cache usage长期低于60%,说明cache usage过低,可以通过适当的提高内存的利用率来提高性能。

? Response Time: RT = Service Time * Queue depth一般我们认为LUN的RT低于10ms,该设备没有性能问题。

? IOPs:对于VNX存储常用的磁盘类型,我们粗略定义如下:

SAS 15k rpm 180

SAS 10k rpm 150

NL-SAS 7.2k rpm 90

当我们发现存在性能问题时,我们检查磁盘的IOPs,如果磁盘非常繁忙,IOPs接近磁盘的理论上限,那么我们初步认为,目前的磁盘数量配置已经不能满足应用需求,需要扩容更多的磁盘。

? LUN Ownership:由于VNX存储的架构,每个LUN在某一时刻只能属于一个SP。故我们建议在创建LUN的时候手工将LUN Ownership平分到2个SP控制器上。当存储发现2个控制器的工作压力不平均或有一个控制器发现故障时,会切换LUN的ownership。正常切换不会影响生产应用和性能。但是如果发现非正常切换,例如短时间内一个LUN反复在2个SP上来回切换,这将导致严重的性能问题。LUN的ownership切换可以在存储的log里查看。

三、 VNX日常巡检

1、登录到VNX5500的Control Station,打开初始界面,在Dashboard上面可以查看部分告警信息及系统信息:

EMC VNX点检向导_第6张图片

2、也可以在system目录下选择Monitoring and Alerts,查看关于文件系统或者后端存储的事件信息:

EMC VNX点检向导_第7张图片

3、查看后端存储SP的事件日志:

EMC VNX点检向导_第8张图片

EMC VNX点检向导_第9张图片

4、查看文件系统的事件日志:

EMC VNX点检向导_第10张图片

EMC VNX点检向导_第11张图片

5、查看后端存储的故障信息:

EMC VNX点检向导_第12张图片

6、查看后端存储的主机连接信息:

EMC VNX点检向导_第13张图片

7、查看后端存储的LUN Trespass信息:

EMC VNX点检向导_第14张图片

8、若有故障需要深入分析还需要获取存储上的诊断信息:生成方法如下图示:

EMC VNX点检向导_第15张图片

9、上传生成的诊断信息到本地:如有需要在传给EMC support

EMC VNX点检向导_第16张图片