从0到1的运维自动化平台

回到首页☞
企业以前的核心资源可能是生产制造,盈利模式,而今可能是数据。
现在对于一个集团不能数据化的业务可能没必要做了,不能上云的系统也没必要留了。
随着企业的扩大,数据的闭环入湖,系统的自动化运维很重要。

记录下自动化运维平台从0到1的大概流程,因为信息安全不展示架构图,只记录心路历程。

1、自动化平台缘起

一个企业在壮大,一个跨国集团在发展,BU增加,背后软助力就是N多的IT系统。HR,IOA,MSR,CBG,HIS等等。从生产制造,客户服务,人力资源管理,货物配送,全球到货管理,远程交付,云服务,移动支付,生活生态等等。有一堆软件来负责产业的方方面面,同样也会有大量的OS来运行这些系统。

目前应用服务器有两类 linux和windows,这些服务器需要日常运维。当一个企业规模很小的时候,我们几台服务器,IT部门手工运维下即可,但是随着产业的扩大,百万千万服务器运维,手工去搞需要多人人力成本。

以100万服务器为基准,日常有哪些工作:

  • 应用部署
  • SQL脚本执行
  • 安全监测
  • 补丁升级
  • 部署各种中间件
  • 大数据等其他业务脚本运行等等
  • 云租户申请服务器,自动创建虚拟机等等。

上面只是简单的场景,我们会发现只要能手工进行的OS部署,升级等等处理,都可以通过自动化实现。可以是shell、bat,powershell,python等。
定时全量系统或者指定业务领域OS检测补丁,自动打补丁。
不定时的IT系统自动化发包部署等等。
时不时的有用户购买云服务,需要提供OS,存储空间,DB,消息网格,或者redis等服务,时不时可以自动化完成在物理机上创建虚拟机,完成DNS,IP,主机名的注入,自动化安装相关中间件,分配nas盘等等。
当体量够了,自动化平台的创建就很有必要了。

2、自动化能力确认

紧急电话,有空在做笔记…

回到首页☞

你可能感兴趣的:(问题笔记)