前言:IT监控运维系统,起源于各设备厂家的网元网管等监控工具,伴随着信息化的发展而升级换代,经历了大数据、虚拟化、云计算等技术革命的考验逐渐完善成熟。IT监控运维系统从最开始的解决故障,到提供高效的运维服务,已逐渐成为IT运维部门日常运维工作中必不可少的工具。
随着企事业单位IT系统规模不断扩大,构成IT基础的设施呈现出规模庞大、结构复杂、品牌众多的特点,为实现信息资源合理配置、有效管理,确保系统安全可靠运行,IT集中监控系统的建设成为企业信息化运维工作的重点之一。同时,运维活动也缺少管控,如没有构建服务台、知识库、CMDB、事件管理等基本流程。此外,监控运维并不是简单的“监控+流程”,两者的有效结合也是一个难点。
传统运维面临的问题
错综复杂的IT元素难以有效监控
从宏观上看,IT设施种类各异,组成复杂,从最基础机房动力环境->基础网络->存储->X86(小型机平台)->系统->应用;从硬件到软件;从后台应用支撑服务到前台页面服务,这些错综复杂的IT元素很难有效整合监控。
从微观上细究,特定IT设施种类各异,品牌繁多。以存储为例,品牌涉及IBM、HP、EMC、Netapp 日立、华为、浪潮等,监控对象指标包含磁盘阵列的各个组件,指标包括风扇、电源、电池、控制器、硬盘的状态、实时性能,以及交换机的各温度、电池、主机映射关系等,获取这些指标并非易事。
传统运维工具单一,无法集中管控
企事业单位用户可以通过厂家提供的管理工具,如vmware 的VC客户端,存储的管理客户端,硬件服务器的web管理控制台,或者通过查看日志/硬件设备的指示灯等方式查看运行状态和性能指标。显然,这些零散的方式会增加运维工作量,影响故障发现的及时性,IT运维人员迫切需要一个统一集中的平台将以上监控任务有效整合。同时,由于缺少有效的流程管控机制,运维工作总是处于“救火式”状态。事前无准备,事中无跟踪,事后无法追溯,运维经验无法沉淀积累与复用。
运维过程无流程或流程不成体系
随着信息化及互联网+普及推广,企事业单位已经从大规模的信息化建设向信息化运维转变,运维团队不断扩大,信息化管理流程日益复杂,之前的纸制化审批流程效率低,难以适应新环境下的流程管理,需建立统一、规范、层次化的服务管理流程和服务管理体系。面对复杂的IT环境,缺乏规范化、自动化的运维处理流程,缺乏完善的故障处理和快速修复机制。
看OneCneter如何破局?
勤智运维磨砺多年,深刻理解IT运维“建设易,管理难”的特点和ITaaS背景下的服务转型阵痛,结合多年运维实践及对ITSS国家标准的制定与理解,推出OneCenter一体化智能运维管理平台,将“监控、管理、治理”三方面有机融合。
OneCenter一体化智能运维管理平台可以让IT监控运维智能、高效、简单、统一,帮助运维团队实时、全面掌握IT运行态势,及时响应和处理IT故障,为各企事业单位业务提供强有力的IT支撑和质量保障。
一体化IT设施监控体系
勤智OneCenter的ITManager监控模块,可对业务系统及支撑业务系统的所有IT资源进行7*24小时全面监控,提供性能监控与分析、资源可用性监控与分析、资源拓扑关系管理、故障监控、故障分析及定位,帮助IT运维人员提升工作效率。
开放式的一体化运维平台
平台将机房环境、IT基础资源、应用系统情况进行统一展示、告警和管理,告别不同资源的离散管理模式。
多维度可视化视角
平台通过网络拓扑、业务系统、机房环境、虚拟化结构等多维度视角进行可视化展现,使资源全方位信息一目了然。
基于业务级运维
支撑企业运营的是各个核心业务系统,所以IT组织的视角逐步从资源级运维向业务级运维转变,从业务角度出发,在可视化的业务视图上业务架构、服务和所依赖组件一目了然。
更加聚焦故障管理
平台通过极简的界面和简单的操作结合系统强大的后台算法和分析能力,提供专业简单的智能化故障处理引擎。
自学习的运维知识库
帮助运维人员建立更加快速、高效地构建丰富的知识库,利用知识库快速对运维管理中发现的故障给出解决方案,恢复系统,确保业务正常运行。
一体化运维平台大数据分析能力
ITBA运维大数据分析系统是大数据技术在IT运维领域的应用。该系统运维内部整合了Hadoop、Spark、Kafka、MongoDB、Solr、Flume等多种大数据架构技术,提供多种类型数据接口的采集方式,实现多平台/多业务的监控、流程等运维工具的数据整合和统一管理。同时,提供对于第三方业务平台的数据展现、数据统计、告警分析和业务分析功能,可以将多个系统在门户内进行统一登录展现;也可以与其他系统对接,从第三方系统登录至运维系统平台。一方面ITBA大数据作为统一运维监控的工具,可以采集各家数据,将非标准数据变为标准数据;另一方面可以提炼数据,进行检索,做海量日志分析。
丰富的监控模型库
全面灵活的监控方式(SNMP、WMI、SSH、TELNET、SHELL、IPMI、HTTP、Agent、syslog、SMI-S 、JMX、GB/T28181、SDK、TCPDUMP等),使得系统具备全范围的监控能力。OneCenter一体化智能运维管理平台能够监控各种操作系统、服务器硬件、网络设备、各种WEB应用、数据库、中间件、存储、虚拟化、WEB站点等IT资源,还支持灵活的自定义脚本监控。
告警集中展现
OneCenter 一体化智能运维管理平台提供统一的告警管理,通过性能指标采集轮询、调用厂家网管告警接口、网元Trap/Syslog主动推送、第三方系统轮询获取等多样化的来源方式,获得整个网络系统中各种事件、设备故障、网络异常等告警信息。当出现故障后,OneCenter一体化智能运维管理平台能通过预置的报警方式,以邮件、短信、电话自动拨打等“告警必达”方式及时通知指定用户,并能生成告警分析统计报告,提供主动式的故障解决方案。
统一的运维管理平台,规范日常处理流程
OneCenter 一体化智能运维管理平台 基于ITIL标准形成了一套结合服务台、知识库、CMDB、事件管理、问题管理等流程的统一运维管理平台,可以和监控系统做无缝衔接,日常告警事件可直接触发工单运维,提高工作效率。OneCenter系统采用多层架构及模块化的设计,系统功能全面,模块功能独立,可根据不同需求自由组合。同时,OneCenter 一体化智能运维管理平台具备良好的扩展性,通过第三方数据接口和数据总线以及门户Portal,与第三方产品可进行无缝集成。
另外,OneCenter 移动终端运维管理,提供移动服务台、告警列表、工单待办列表、工单查询及处理操作、设备巡检、系统公告接收和知识查询等功能,为运维工程师提供了一种便捷的运维模式,有效提高IT部门整体运维能力。
IT监控运维系统已逐渐成为IT运维部门日常运维工作中必不可少的工具,并在很多已建成的运维项目中发挥着不可替代的作用。如国家核电统一运维项目,实现了统一监控、统一运维、统一展现等“七个统一”;湖北省公安厅智能IT统一管理平台项目,实现全网上千种IT资源的统一管理和IT资源故障告警自动流转进入服务流程;湘潭大学一体化运维项目,支持复杂环境的大规模监控,有效提升IT运维管理和服务能力。