IT 投资明察秋毫,方为明智之举。您的网络,需要系统管理,还是设备管理?这里需要耐心、细致地辨析。今天,来听听湖北电力信息系统专家周主任的见解 —— 系统管理不等于 SNMP
        系统管理对象为服务器、网络设备、数据库、中间件、 OA ERP 、拨测等应用系统,保障网络、业务、应用系统正常运行;而设备管理监测对象为网络设备和打开 SNMP 的服务器,只能监测服务器简单指标。系统管理可按任务计划定期模拟检测各种系统应用可用性,对其各种性能指标进行监测;设备管理并无此功能。周主任强调说: 设备管理不等同于网络管理,更不等同于系统管理,很多运维工作是 SNMP 无法胜任的。
        SNMP 最初的标准确定之后,很快被众多的厂商设备所支持,并且发展到并不 简单 的地位。经过三次的版本演化,它在网管人员和系统工程师的心中可以说根深蒂固。很多管理员甚至将 SNMP 管理视为发现和解决一切故障的法宝,但随着网络和系统管理任务的增多,自己编写脚本就显得越发的复杂和吃力,例如操作系统、数据库和邮件系统的更新换代,以及跨平台数据库的统一管理,都使得很多人已经陷入了系统管理的泥潭,无法自拔。也正是在这种情况下,湖北电力开始认真寻求满足自身需求的解决方案。
        “ 企业信息系统管理是一项庞大而复杂的工程。功能的实现往往需要借助于多种措施和设置,而导致故障发生往往由于多种原因,既可能是 一因多果 ,也可能是 一果多因 周主任说: 所以系统管理绝对不是依据 SNMP 来随时观察系统的工作状态,而是用全面、动态和联系的眼光分析问题,进行逻辑推理,从纷繁复杂的现象中发现事物的本质。
        比如我们对 CPU 的理解, SNMP 只会告诉我们它工作的状态,但不会告诉我们资源的使用应该如何优化。以 Oracle 数据库管理为例,为了对 CPU 故障进行定位,用户首先必须能够准确的评估出系统所用 CPU 资源的总量,随后,用户还必须确定系统是否具有充足的 CPU 资源,并识别出何时系统所消耗 CPU 资源的总量最多。如果性能故障的主要原因归结于当前系统的配置(服务器不具备足够的 CPU 和内存资源来运行程序),单一的系统管理方案只能提供升级配置或减少应用占用两种方案。如果单纯的依靠 SNMP 管理模型,那么后续的工作将依然受到一定程度的限制。
        游龙为湖北电力开发的综合运维管理系统,提供了 400 多种监测器,可以对服务器、网络设备和应用系统进行深入细致的监测和管理,非常方便运维人员的管理。网络管理员看到系统界面颜色提示和报表数据统计,就知道哪里出现故障或存在故障隐患。同时,这是个智能化的运维平台,一旦出现异常,控制中心就可以给相应网管工程师发派工单,该工程师完成技术问题后即可反馈完成任务,并把解决的问题放到知识库当中共享。
        虽然系统管理和 SNMP 的重心都同样在于装置的监看和控制,但系统管理将装置视为是整体,或是一群相关服务的集合。而 SNMP 很多时候将提供服务的设备视为是系统的一小部份。你也可以这样来看待两者的差别:一者是只关心特定装置的顺利运转( SNMP ),另一者是关心整体网络的健全运作与长远发展。