云平台下的运维体系搭建

环境配置
应用部署:一键编译、打包、部署常见的应用、实现方式:源+shell/python脚本、镜像+开机执行、容器服务docker
运维管理:结合puppet/saltstack实现批量管理
一键更新:使用rsync等方式实现本地和远程服务器间文件上传、下载的功能


故障排查
日志:部署时定义一致的日志文件,便于管理分析
监控平台:Opentsdb、Zabbix、 Nagios、云监控、自定义监控程序
告警: 邮件、短信、电话
分析故障的表现、故障发生时间、持续时间、是否可重现、是否有出现规律,最近一次更新内容、受影响的范围,快速定位问题


安全运维
访问控制:集中管理用户,以及控制用户可以访问资源的权限
操作审计:记录用户资源操作,提供操作记录查询,保存记录文件,实现安全分析、资源变更追踪以及合规性审计
安全防护:DDOS防护、应用防火墙、弱点分析、防密码暴力破解、端口扫描
可靠性保证:安全组规则、弹性伸缩、持续监控、渗透测试


数据迁移
数据迁移工具DTS/ETL
镜像上传下载
备份还原
容器服务

你可能感兴趣的:(运维)