完善服务管理 提升IT部门管理效率

    我们已经谈到过企业在面对网络管理时应注意的细节,在大多数网络管理程度较高的企业里这些问题已逐渐得到改善。除此之外,完善服务管理更好地为业务部门服务成为IT管理部门热议的话题。
    服务管理也即是对构成企业核心业务系统的服务器、数据库、中间件等的管理,随着业务在IT管理中的应用的不断融合,管理员发现CIO更加关注企业的应用和业务能否良好运行,这些设备为业务系统的相关应用提供了硬件支撑平台,对其管理工作也成为IT部门与业务融合的手段因而提上了重要的议事日程。
 
从管理维度出发 监控各项服务指标
    要谈到服务管理,首先人们想到的就是能够监测到多少KPI,能够确保对于服务器、数据库、中间件等的完善管理吗?一款好的运维管理软件给出的答案必然是肯定的,针对不同的管理对象,都有着全面的指标监控功能。这里强调的是针对不同的管理对象,有着不同的可控指标,拿服务器举例来说,如果一款软件能够全面支持对Windows、AIX、HP-UNIX、Solaris、Linux、FreeBSD、CentOS、Novell TUR64等众多操作系统的管理,则从广度上来,它是属于优良的管理软件。此外,对于中间件、数据库、标准应用等,软件也能够提供详细的指标监控,唯有以全面的管理对象为基础,以全方面的服务指标进行监控,才有可能为用户提供最完善的服务管理功能。
    在有了充足的监控指标之外,监控方式同样也是服务管理的重点,有Agent和非Agent两种模式,为了满足客户的管理需求,管理软件应该融合两种监控手段。简单来说,用于能够在被管对象端安装软件的用户,采用Agent采集数据方式,从而可以可以采集更多的关键指标,同时其监控数据在私有加密通道传输,安全性更高;而对不允许在管理对象端软件的客户,则应该具备非Agent取数方式,通过SNMP和SSH来实现对于设备数据的采集,从而降低了被管对象的资源利用。单独有两种取数方式还不能满足要求,若能够实现复合采集,则可以全面满足服务管理的取数复杂度的要求,同时根据用户的需求进行灵活实现,才是最适宜用户的精品运维软件。
 
直观数据展现 实现可用性管理
    在有了广度和监控方式的支持上,可以说先决条件已经得到了解决,那管理软件取数能否经历有效的归并分析,最终呈现给管理人员。这就是服务管理的第二个判断标准,管理员需要查看的是服务器、中间件、数据库等的各项数据反馈,所以管理软件的数据展现功能是另一重要的评判标准。拿服务器管理举例,对于用户全网的所有服务器能够做到全面监控,同时对于单个点,比如说IBM Aix主机,管理员希望通过管理项查看其交换区大小、CPU占用率、内存使用率、主机连续运行时间等参数,因为这些指标可以具体衡量这台主机运行的状况,如果是企业的核心主机,则管理员可以实时查看具体细节,所以直观的数据展现是最为关键的监控环节。
    同时,能够监测到关键数据之外,管理人员还需要实现对主机的可用性管理。即通过管理层面,对主机进行可用性关联、ping测试、snmp连接测试等一系列的操作,这些操作的意义在于更加主动地掌控主机的运行情况,当有故障发生时,通过关联性的测试可以迅速定位故障根源,从而采取措施排除故障恢复服务运行,对于核心业务起到了良好的保障作用。
 
历史数据分析 衡量运行状况
    故障的发生总是捉摸不定,如何将不可预计的IT故障发生几率尽可能的控制在一个很小的范围之内。这就需要管理软件的历史数据分析功能,通过对于主机的服务指标连续性记录和分析,能够帮助管理人员掌握服务器在一个时间段的运行情况,当有告警发生时,能够及时调用历史数据进行对比,确定其故障发生时的主机性能参数,第一时间明确了设备的运行状况。对于以后的告警处理和故障预防有着积极的参考价值,同时对历史数据的分析有助于衡量整体的服务器运行水平,为管理员提升服务器性能和最大化利用IT资源提供了重要的数据依据。
    服务管理正逐步成为IT运维管理中一个重要的环节,从CIO到管理员都认识到管理好服务器、中间件、数据库等对于企业有着至关重要的作用,不仅能够提高应用服务和业务系统的运行效率,而且将大大提升企业的生产力和核心竞争力,创造最具优势的IT发展动力。

你可能感兴趣的:(职场,网络管理,休闲,运维管理,IT管理)