四大利器帮你走出IT运维管理的困境


2008-10-07 17:27:05
 标签: IT 运维 管理 网络拓扑图    [ 推送到技术圈]

最近给客户做咨询时,跟行业客户谈起关于 IT 运维管理在各业的运用,关于 IT 运维管理方面有一些总结,跟大家分享一下。先讲一个大家都有可能经历过的故事,一位叫 Mark 的客户说他所在的公司承接了一个×××交易公司的网络运维服务。顺便介绍一下 Mark ,名校计算机专业毕业,是大家公认的技术专家,手下十来号人,技术底子也不差。项目运作初期,感觉很良好,蛮轻松自在的,而用户对 Mark 团队的服务也比较满意。但是,最近一段时间经常出现故障,用户网络连不上×××交易系统,导致用户向 Mark 的上司进行了投诉。 Mark 亲自现场,把所有故障征兆都详细分析了一遍,也搜出了几个故障点,情况虽然有改善,但还是没有把故障根本排除。整个团队都加班加点地在现场进行故障分析, Mark 觉得很郁闷。
Mark 苦况之后,其他几位客户也感同身受。纷纷说起了自己的不幸,经常碰到莫名其妙的故障,加班加点排除故障,忙忙碌碌,象消防队员一般不停地出现在解决问题的现场 …..
听到这些,我深表同情,他们都是在 IT 运维管理过程中深受其害的人。说起 IT 运维管理,大家都有所了解,但是要真正理解 IT 运维管理过程中的一些有效解决故障的方法,客户的感觉是没有很好的工具,只能在自己的负责区域里面用一些小聪明去解决一次两次的问题,所谓的“投机取巧”。
其实,在 IT 运维管理过程中,主要的故障征兆表象就是一句话“网络不通,服务连接不上”,但造成这个表象的原因却有很多,整个网络运维可以出现故障点的地方应该说数不胜数。单纯依赖 IT 运维管理人员人工地去监测、排除故障,效率实在有点低。鉴于这些故障的原因,大体总结几点,主要包括:网络拓扑不清晰、故障定位难、异常流量监控困难、没有行之有效的体制约束使用人员。
在此,我总结了几个在 IT 运维管理过程中可以的借用的几大利器,帮助我们 IT 运维管理人员走出困境。
利器之一,网络拓扑图。在日常的 IT 运维工作中,运维管理人员对网络的监控只是单点地针对设备进行观察以及排错,无法对网络整体进行有效的认识或监控,好一些的可以在自行画制的静态拓扑图上简单描绘着网络的连接状态。但仅有静态的逻辑拓扑图,对于日常 IT 运维还是远远不够的。我们所需要的是一张能够实在现实网络中所有设备工作状态、线路流量状态并可以智能进行告警通知的拓扑图。我们称之为物理拓扑图,所谓的物理拓朴图是能真实地体现网络中的物理运行状态。北塔 BTNM 物理拓扑图真实呈现网络设备状态,通过物理拓扑图的展示, IT 运维管理人员可以及时地知道网络中发生的故障所在,网络的压力点所在,并且可以对网络中的所有设备进行快速的浏览以及配置,可有效提高工作效率。
利器之二, IP 地址簿。当网络出现故障时, IT 运维管理人员为了查找一个故障源 IP 需要先查找多台路由器的 arp 表和交换机的 mac 表,最后定位到故障源 IP 所在端口位置。这个过程花费我们管理人员较长的时间,如果出现多个故障源时,情况会更加地恶劣。如果我们把整个网络中所有 IP 地址、 MAC 地址、交换机端口的对应关系实时地整理成一个表格,当网络中出现故障,需要查找故障源时,便可以快速浏览这个表格以进行故障定位。我们称这个表格为 IP 地址簿。
利器之三,数据流分析。在网络中所传输的流量,对于 IT 运维管理人员来说往往是不可见的,这其中包含有日常办公所产生的合法流量。但是,有另外一部分的非法流量如互联网下载、网络病毒、******也会混入其中。过去,大家对应非法流量都无法进行监控的,让非法流量占用了大部分的网络带宽以及造成服务器主机的崩溃都是有可能的事情。因此,我们需要对这些非法的流量进行监控,监控网络中有可能产生非法流量的网络线路。当网络中出现匹配非法规则的数据流时,系统可以对产生非法流量的源头进行定位,并且产生告警信息通知 IT 运维人员,或者更加智能化地对非法流量源头进行堵截。以保证我们网络的正常应用不受非法流量影响。
利器之四,行之有效的行政体制。有了以上三种必选利器后, IT 运维管理人员可快速地对故障进行排查,也可以对造成故障的源头进行跟踪,但是,现有的状况往往是这样:“当 IT 运维人员发现故障源机器,是由于使用者不当地对网络进行使用,在互联网上任意下载文件耗损网络带宽、下载文件中有病毒导致病毒爆发、任意拔插网线导致网络阻断等等”。但又苦于 IT 运维部门是一个对内服务的部门,没有相应的规章制度对使用人员进行约束。因此只能对使用人员说明故障原因,希望不要再犯。但是不久,又有另外一个人犯同样的问题,又导致同样严重的网络故障。”为了改善这种对 IT 运维管理人员不利的状况,需要企业管理人员对现有的 IT 运维工作进行高度的重视,制定一套行之有效的网络使用规章制度,并且严格进行落实。
相信拥有上述的四大利器后可以解决日常 IT 运维管理的需要,我们在选择网络管理软件的时候,也不妨以上述四大利器为鉴定的标准,来对网络管理软件进行对比。