一个完善的运维自动化体系包括,系统预备、配置管理以及监控报警3个功能模块 :

1. 系统预备

自动化安装操作系统及常用软件包

自动化安装与升级系统补丁

自动化升级相关软件


2. 配置管理

自动化部署业务系统软件包并完成配置

远程管理服务器(开关服务等 )

变更回滚


3. 监控报警

服务器可用性、性能状态、安全监控

向管理员发送报警信息等


1.事前预警

在故障出现之前,管理人员应该能在任何时间,任何地点接收到告警信息,并及时处理问题,把故障隐患扼杀在摇篮中。(强大的监控与报警机制)


2.事中恢复

即使是再完美的运维方案,也可能有预料之外的故障。为保证在最短时间内恢复业务,关键数据不因故障丢失,我们需要有完整备份方案来应对自如。(强大的备份与恢复机制)


3.事后存档

这里更加强调运维管理的方法,针对处理过的故障,应该记录在案,在处理过程当中运用过的处理技术,处理方案,应该形成经验文档,以供知识分享。(强大的FAQ机制)


要实现以上三个要求,并不是一件容易的事情。需要一个经验丰富且高效的运维团队,随着我们的业务系统不断增加,业务量的不断上升,传统依靠纯手工的运维方式,逐渐被淘汰。高效的运维自动化方案正在逐渐形成规模。(不仅大公司在部署,小公司也开始逐渐部署)