IT运维管理简单说就是在故障出现以前对网络运维实施的管理。那为何需要管理呢? 这是我要跟大家闲谈的关于网络运维管理的那些事儿,从头开始说起。
   网络发展了十几年,我们的网络产品的性能、种类和网络规模都不尽相同。这种情况下,我们需要一个综合的管理系统,这是非常重要的。另外就是不同性能的要求。早期的网络是一个数据共享、数据访问的问题,随着网络的进一步发展,我们在各个行业都看到网络逐渐成为了多媒体的载体,语音图像在网络上越来越多。 在这种情况下,不同的用户和业务需要有差别的服务,怎么样实现这个有差别的服务?我们需要对网络进行评估。从性能和要求上来说,我们也需要进行综合的管理。
    怎么样提高效率是非常重要的。
    网络平时不出问题我们也无法预计,网络一旦出问题,这是在预想之外的,等出了问题再解决,往往会影响我们的速度,比如说有病毒,如果在早期发现就可以防范于未然,记得 03 年冲击波病毒发作,当时如果有合理的工具在网络上发现它,就不会造成很多的损失。可当时我们的电力企业、能源企业因为没有事先管理机制,在处理冲击波的影响时花了两三周的时间,这就是没有进行事先故障发现最好的例子。
    降低管理成本,也是非常重要的。
    早期企业在硬件平台上的花费非常多,可业务系统没跟上,就算现在开始应用了,每年还是需要大量的投入。企业也在考虑硬件已经做完了,为什么每年还要投入呢? 因为我们的 IT 管理部门承载的网络是提供服务的服务部门,效果不像企业的生产部门那么易于显现,我们必须要有综合管理系统来量化 IT 管理的成本的问题,让企业看到实际的效果,否则 IT 运维管理部门只会成为一个不重要的部门,或者很难引起企业的重视。 我常在一些行业中听到这样的说法“信息化部门是以后指导生产发展方向的比较重要的部门,但是目前在生产系统中影响非常小”。
    我们如何提高自身的地位非常重要。
    企业里新业务的拓展,提高服务水平是非常关键的。既然 IT 运维管理部门是一个为业务系统提供服务的服务部门,怎么提高我们自身的服务水平呢?这对于我们来说非常重要。 如果 IT 运维管理部门没有服务水平和服务质量,对用户的影响非常大。 很多用户都考虑到企业自身是需要管理的,而且迫切性非常大。事实上,我们需要一种很好的管理手段,管理一直伴随着网络的发展而进行。早期的管理是和系统集成商的选择来提供的,用户在系统集成的时根据厂商来选择系统,购买哪家硬件就买哪家的管理软件。其实,这是把硬件配置软件和网络管理混为一谈,大家误认为这就是网络运维管理。 实际上很多用户在具体工作中发现,采用这些管理系统不能解决所有问题。因为硬件厂商提供的管理平台解决的是简化配置的工具,从早期开始的目的就是每个硬件平台都是一个专用的系统,为了简化不用执行这么多的命令,其作用最多只可查看设备的具体配置和运行状态。
   运维管理过程中需要关心的是什么?业务系统在运行的好不好?有没有病毒等。这些是用户关注的问题,恰恰相反是硬件厂商不关心的问题,因为这个和硬件平台没有关系。而对于我们用户来说,如果无法确保网络正常运行,你的硬件再好有什么意义呢? 很多的用户包括国有大企业发现这些问题之后,开始改成了工具类的东西。它的目的是什么呢?解决某一类简单的问题。在早期的网络管理中,我要有个工具,这类工具的管理软件是解决一些简单的问题的。这些产品给用户造成了什么概念呢?就是深度管理。你首先告诉我什么地方有问题,然后我再解决。因为我们的网络越来越重要了,不要有中断和延误等,我不能预期问题在什么地方,这就造成了事后管理的概念。也有一些大型企业,比如医保、社保、电力、石油石化等行业,发现有这样的问题后,到国外考察,发现了一些大而全的系统,投资很多资金去构筑平台,后来发现效果不好。  
   用户不禁要问了,买国外的产品在国内就用不好吗?
   我们需要思考,这些大而全的产品立足什么?国外的软件提倡的是一种概念,我们的服务部门应该怎么管理的?忽视了基础设施的关系。 举个简单的例子,我在北京的一个大型保险企业管理系统招标会上了解到,招标结果是上了 ITSM 的系统。用户问怎么发现问题?厂商介绍说网络里都是思科的设备,就用这个系统来发现问题,而用户又问“这套系统的运行对路由器的性能影响很大,平时是不打开的,怎么知道呢”?结果他们说你看到有问题就打开好了。这是悖论! 用户需要的就是要系统来告知问题,而当我们都看到问题了才打开,这有什么意义呢?没有意义,最后还是用不起来。 后来用户到国外考察,发现为什么国外这些系统用得很好而在国内不好呢?国外这些部门为什么会强调 IT 服务管理,实际上这些系统卖给用户而不是自己用的,而是卖服务的,这些系统卖给你了,是我代你管理网络的而不是你自己管理。国外的一些中型企业网络不设专人来管,而是外包的。他们重视服务,因为每年都要向人家交服务费。而在国内连问题发现的机制都没有的情况下,我们要这个管理有什么意义呢?好比连房子都没有,装修有什么意义呢?
    来电响应式的管理成为企业信息网络管理的实质。
    企业信息管理员成为救火队员,在早期搭建很少用到网络的时候没有人知道信息部门的存在,认为信息部门就是一个可有可无的部门,但是当我们的应用系统上得多了,大量的系统在上面走了,网络出问题,天天有人找你,天天有人埋怨你。我们说我们考虑网络管理应该考虑哪些层面呢?有两个,一个是 IT 基础设施运维管理,这是早期做的事情,就是及时的进行事件的发现和处理,既然我们不能预期网络在什么地方什么时候可能出问题,我们是实现基础设施的透明化管理,把原来是黑箱子的网络透明化管理。我们的考虑是预防为主、事先管理,这是非常重要的。它的概念就在这里,在这个基础上还有一部分,是发展方向体现价值的问题。当企业信息化发展较快,管理人员比较多时,我们为了实现管理的标准化和流程化,保证流程质量,需要考虑 IT 服务管理,这是非常重要的。
    从我们对用户和行业的了解看,实现服务管理的标准化和流程化是需要分步走的, IT 基础设施和运维管理是基础,是确保服务质量的前提。如果我们连问题都不能发现还怎么保证质量呢?在中国 IT 管理处在建设性阶段,这是我们 需要优先考虑的目标。
   今天先闲谈到这里,下期接着跟大家侃。