对运维工作的理解

https://blog.csdn.net/icansoicrazy/article/details/130349481

运维行业的核心问题

  • 对运维行业而言,其所面临的问题本质上都是系统工程问题。是为了解决 IT 系统快速交付的问题、解决伸缩性的问题、解决稳定性的问题、解决运行维护成本不断提高的问题。
  • 目前来看,云计算、微服务对于运维行业的改变,要比ChatGPT来的要更实质性一些。

运维部门的定位

  • 在合理的成本范围内,最大限度的保障系统可用性和服务能力。
  • 建立一套持续改进机制,不断提高运维效率,不断降低运维成本。
  • 运维的工作职责
    经典的运维领域,最主要的几个工作职责
    代码发布和交付(delivery),做好最后一公里的价值交付;
    提升架构的可伸缩性(scalability)并付诸实施;
    保障系统的稳定性(reliability)并不断改善;
    在满足前三项目标的同时,不断优化并降低系统的运行成本(finops);

    高效运维的要求:效率、稳定、成本、安全和体验
    运维可以在哪些事情上发力,更好的呈现运维价值?

    效率
    运维自动化,目标就是解放运维的生产力,提升运维效率,降低人为失误,让运维的同学可以有更多的精力去做更有价值的事情。
    如资源分配&回收、域名配置、VIP配置、持续集成&发布、应用部署、应用扩容&缩容等
    开发环境和测试环境,由开发或测试发布新版本?
    稳定(质量)
    让业务运行更加稳定,目标是最大程度的保障系统的稳定和运行质量,即使出现问题,也能够快速发现、快速响应、快速(自动)恢复。
    如监控(仪表盘)、全链路、强弱依赖、限流降级、容量评估、预案平台等
    怎么保证比业务部门先发现问题?业务监控?短信、电话、飞书、钉钉告警?
    成本
    成本问题,也就是技术ROI(投入产出比)的问题,当系统规模和体量变大之后,掌控在运维手中的各类资源,将占整个研发团队支出的大头。如果没有很好的成本控制意识和策略,资源体量将会持续增大,甚至是翻倍或指数级的增长,对于公司成本会是非常大的负担和压力。
    安全
    安全是与运维同等级别的一块专业领域,但同时又是跟运维紧密相关的,运维同样要关注安全,因为安全出现导致的问题,往往也会给运维带来沉重地防护和修复成本。
    如各类主机安全、DB安全、Web安全、应用安全等,与此相关的还有漏洞、DDos、CC等关键词。
    体验
    这里提到的体验,指的是终端用户的访问体验,非功能或产品使用体验,对于运维来说就是要关注访问速度。作为开发的同学来讲,可能更多的注意力会放在自己负责的代码以及该部分的性能问题,不会关注到端到端全流程的性能和体验。但是运维可以站在全局的角度来审视和治理整个端到端全链路的性能情况,并给出对应的性能优化建议。

你可能感兴趣的:(运维)