现在,云计算运维工程师由于需求量大,薪资待遇不错,职业周期长,已经成为一个热门职业。但要知道什么是云计算运维之前,我们需要先知道什么是运维。为此,整理了一些学习笔记,分享给大家,共同了解学习。
按照字面意思来理解,运维即运行维护,以此保障各类设备,系统,网络正常运行和可用。运维人员在公司里属于技术团队的一部分,与研发/测试不同的是,运维核心任务是保障产品上线后的稳定运行,并在日常工作中不断优化系统架构和部署的合理性,以提升系统服务。
因此,在一个科技公司中, 运维具有独立而且重要的职责,并不亚于任何开发类工程师。
有软件开发的地方,就需要有软件部署和保证软件正常运行的运维工程师。
国内运维工程师的兴起还得从08~09年开始说起。那时候中国互联网刚开始火热,水大鱼大的互联网行业,到处是拓荒者的舞台。各个公司竞争的关键是要有自己的互联网产品,能搭建起互联网平台的开发岗位很重要。
但随着时间推移,互联网人口不断增多,而互联网产品大浪淘沙从多到少,二者共同作用的结果就是留存下来的产品负载越来越大。可能早期每日也就几十几百人上线,到后期可能要面临着上百万上千万的访问量(比如小米秒杀,淘宝双十一,春运12306抢票),开发或测试人员已经无法兼职来解决大负载大并发问题,此时就慢慢的诞生了一个新的岗位——运维工程师。
如今,无论是电商平台淘宝、京东,还是媒体平台如新浪、网易;无论是视频网站如优酷、斗鱼,还是游戏公司如腾讯、盛大,他们都要有自己的运维团队。而随着运维工程师群体的不断发展,我们也能看到一些运维大神浮出水面,比如《鸟哥的Linux 私房菜》作者蔡德明,阿里“道哥”吴瀚清,京东商城 前台技术服务负责人 徐奇琛,原阿里巴巴 基础架构事业群运维中台架构师毛茂德等。
广义上的运维人员是一个大类,从维护对象来看,其职责可分为 IT运维,业务运维和日常管理运维三类。
IT运维是IT管理的核心和重点部分,也是内容最多、最繁杂的部分。这类运维人员管理的内容可细分为六个子系统:
设备管理:对网络设备、服务器设备、操作系统运行状况进行监控。
应用/服务管理:对各种应用支持软件如数据库、中间件以及各种通用或特定服务的监控管理,如邮件系统、DNS、Web等的监控与管理。
数据/存储/容灾管理:对系统和业务数据进行统一存储、备份和恢复。
目录/内容管理:管理企业需要统一发布或因人定制的公共信息。
资源资产管理:管理企业中各IT系统的资源资产情况,这些资源资产可以是物理存在的,也可以是逻辑存在的,并能够与企业的财务部门进行数据交互。
信息安全管理:该部分包含了许多方面的内容,如企业安全组织方式、资产分类与控制、人员安全、物理与环境安全、通信与运营安全、访问控制、业务连续性管理等。
与IT运维不同,业务运维更多是从组织和业务的层面出发,基于各类组织运转(而不是机器设备)设定的指标对系统进行优化和调整,最终使得系统设备运转目标与业务目标对齐。
业务运维包含以下六个方面:
(1)业务管理:包含对企业自身核心业务系统运行情况进行监控与管理,对于业务的管理,主要关注该业务系统的CSF(关键成功因素Critical Success Factors)和KPI(关键绩效指标Key Performance Indicators)。
(2)从整个组织的角度,针对各业务系统提供业务需求整理、需求变更和用户体验优化的加载、维护、配置、升级、补丁等方面的实现服务;
(3)面向整个组织提供各业务系统的问题受理、响应、处理和转交等方面的服务;
(4)面向整个组织的各级机构和各业务部门提供各类业务系统的操作指导、数据应用、模块分配、参数设置等;
(5)面向整个组织提供客户端安装、配置、升级等技术支持;
(6)面向组织以外的部门提供相关信息(按机关相关部门要求)、回答网站税务咨询、局长信箱和纳税人电话提出的各类业务问题。
这部分工作是针对公司各组织的业务系统自顶向下设计的运行维护方案。是为了解决各部门系统统一化管理的需求,面向业务部门或管理层,与客户体验有一定距离。
核心是日常工作管理:主要用于规范和明确运维人员的岗位职责和工作安排、提供绩效考核量化的依据。以此完善企业的 IT 运维管理能力。
具体来说包括如下三个部分:
(1)面向整个组织提供针对各业务系统的运行状况监控、问题定位、故障排除等方面的运维服务;
(2)面向整个组织提供针对各业务系统的需求变化,即数据项 、元数据 、管理流程 、数据空间等方面的管理和标准化;
(3)面向整个组织提供针对各业务系统的运行状态和需求变化和不同的记录、跟踪、保存、分析的方面的管理。