SCOM 2012 监控实践

最近做项目中,使用到system center 的 scom 2012 产品, 去监控客户的服务器和网络设备, 其中客户提到需要这个产品要做到

能够识别监控过程中,服务器或者网络设备的性能瓶颈, 我刚开始感觉, scom对这种需求很无能无力, 首先这个产品定位是监控, 并不是分析,

所以它的一切重心在于搜集设备信息, 供客户去参考判断是否为正常状态, 所以它的使用场景一般在于, 保存监控数据, 以便在发生异常的时候可以及时

去寻找问题根源, 第二个重要点在于警报, 在设定一系统的指标后, 对超出这些指标的对象示警。

客户的最理想状态是, 它的设备或者应用发生问题的时候, 不必再去看监控数据, 就可以得知哪里出现问题。这其实是可以通过设定一些监视器去解决用户的问题,

客户想知道数据库脚本运行缓慢,想知道原因

我的步骤是这样的:

1. 首先考虑会影响数据库脚本运行缓慢的原因, 可以根据Query-Performance-Tuning-Start-To-Finish-Rally这本书里面的要素定下监视指标

2. 根据监视指标,做多个监视器,如SQL脚本编译时间监视器, SQL缓存命中率, SQL 文件读写速度, 然后对这些监视指标做知识库, 方便问题查找。

这样,运行监控, 当监视出现异常的时候, 就可以立刻发现数据库脚本是哪里出现问题, 如脚本没有使用索引,导致大量表查询, 或者脚本没有使用变量, 导致重复编译等等情况。

 

你可能感兴趣的:(2012)