2020-03-14

一、何为DevOps (研发运营一体化)平台?

从企业信息系统规模、复杂程度变化及对信息通信技术应用的深入等方面考虑,IT 运维的发展可以分为以下五个阶段:


随着企业对云计算、大数据、微服务、容器化等新技术的应用逐渐深入,相关业务架构复杂度提升,产品迭代快速、频繁,IT 运维进入 DevOps 阶段。

Dev Ops (研发运营一体化)助力企业实现软件生命周期的全链路打通,持续运营与优化 。

在此阶段,通过对持续集成、自动化测试、持续交付、持续部署等多种相关技术的运用,版本发布周期大幅缩短,效能获得提升。与此同时,IT 运维通过监控管理、事件管理、变更管理、配置管理、容量和成本管理、高可用管理、业务连续性管理以及体验管理等技术运营手段,实现了信息系统的质量提升与业务优化。DevOps 将软件全生命周期的工具全链路打通,结合自动化、跨团队的线上协作能力,实现了快速响应、高质量交付以及持续反馈。

二、Devops 生态体系

我国 IT 运维生态体系总体可分为基础设施层、平台与软件层、服务层和应用层四层以及研究机构组成。以下是中国 IT 运维生态体系示意图:

基础设施层的主体为基础设施提供商,主要提供网络设备、存储设备、服务器等硬件设备。其中,服务器是提供计算服务的核心设备,也是计算机硬件领域的重要组成部分,从市场规模来看,随着云计算、大数据等业务的迅猛发展,对服务器的需求也在快速增长。

平台与软件层为上层提供软件产品,可分为基础软件提供商及平台和应用软件供应商。基础软件提供商提供操作系统、数据库、中间件、开发工具等基础软件。应用软件提供商为企业用户提供 ERP、CRM 等应用系统,其中包括 IT运维管理(ITOM)软件。平台软件提供商则为上层提供 DevOps 一体化平台、运营管理支撑系统等平台类软件。从 2013 年至今,我国软件市场规模每年已增长超过 500 亿元。服务层由原厂运维服务提供商、第三方运维服务提供商、系统集成商和IT 运维解决方案提供商组成。系统集成商将软硬件资源集成为满足需求的统一系统作为服务提供给用户,其中也包括数据中心的设计、集成、运维等服务原厂运维服务商即为软硬件提供商,其在提供软硬件的同时也搭配提供相应产品的运维服务。第三方运维服务提供商则指可为企业用户提供多个软硬件提供商间的专业 IT 运维支持服务。IT 运维解决方案提供商提供了全面、整体的 IT运维解决方案,包括了软硬件集成与实施,直接为最终用户解决 IT 运维相关问题。

除此之外,研究机构进行产业研究,为生态体系提供有力技术、科研支撑。

三、Devops 运维商业模式

当前,由于存在行业、企业规模以及企业决策差异,IT 运维具有多种商业模式,主要有如下四种。

(1) 免运维 模式 ,高度成熟的商业产品往往具备免运维的特点。例如:除了具备高度的可配置化能力以外,还需具备守护进程实现自监控、日志回收、常见故障处理以及自我优化功能。所以,当企业购买、安装部署以及联调后,基本不需要提供后续运行维护支持。

(2) 外包 运维 模式 ,是指 IT 系统由 IT 运维服务提供商提供日常监控、运行维护、升级等保障服务。在单体应用、私有云以及公有云等不同建设场景下,分为 IT 运维服务外包和购买云服务两种模式。在单体应用、私有云建设模式下,企业通常采用运维服务外包的模式,大多采取驻场服务,部分企业会采取定期或者按需到场、远程运维;对于使用公有云服务、部署在公有云的场景,则通常选择购买云服务来解决一站式运维保障。中型以下规模、安全等级不高或受限于行业特性的企事业单位,往往会采取 IT 运维外包模式。

(3) 自有团队运维 模式,是指 IT 系统由内部人员来完成日常监控、运行维护、升级等保障服务。互联网企业、大中型传统企业或者安全等级较高的企事业单位,即使采购了第三方的运维工具,也要求组建企业自有的运维团队。在这种模式下,随着运维经验、运维团队以及能力建设的提升,通常会持续开发出适配企业自身情况的运维工具。有的企业会将运维前置到需求评审环节,实现开发运维一体化。例如:对于运营商等超大规模企业,甚至会考虑跨域的能力规划、平台建设和能力建设,提高 IT 运维的自主、可控、高效以及集约化运维。

(4 ) 混合运维模式 。是指企业和 IT 运维服务提供商都参与到 IT 上线前后的运维工作中。通常情况下,服务提供商是系统集成商或软件原厂商;当项目完成交付时,他们与企业共同提供运维服务。企业主要任务是运维管理,而 IT 运维服务提供商的主要任务是运维执行,两者共同目标是提供可持续的运维服务和运维的持续优化。

四、平台落地-移动智慧运维体系和技术运营中台建设

随着移动“大链接”战略的深入落实、业务规模高速增长、内外部竞争日趋激烈复杂、IT 技术发展演进日新月异等,北京移动公司上下和内外客户对 IT 运维管理执行效率和运营精细化管理能力的提出了更高的要求和挑战:为适应新业务层出不穷、瞬息万变的市场局面,2018 年集团公司提出“厉行节约、降本增效”活动,引入人工智能技术,构建低成本、高效率的运营体系,加快“以 IT 换人”战略的实现,以期在日益激烈的同质化竞争中赢得主动权。

集团公司在 2019 年 IT 工作思路中提出了 “以 IT 主动赋能发展为主线,大力推动从 IT 支撑到 IT 运营转变”、“着力提升智慧运营能力、运维保障能力、创新发展能力”等要求,为 IT 运营能力的关键发展目标明确了方向。 随着信息部系统云化、容器化、中心化、微服务等架构调整,带来了“系统架构和业务调用关系复杂,运维管理难度增加”的痛点因此运维体系也要实时跟进,不断调整自身发展规划,向“大运维、集操作、专业务、践敏捷、智运营、优体验“思路演进,为生产系统提供更优的运维支撑服务。

【痛点难点 】

运维系统存在重复建设;各个域间隔离运维,响应不及时;云化之后的 IT 运维的智能化程度不高,仍在演进之中。5G 时代对 T ICT 融合运维挑战:5G 网元的控制面、传输解耦,传统(2G/3G/4G)运维平台,无法支撑 5G 网络资源的集中统一的配置管理和运维;5G 网络实现 SDN 提供的行业切片服务,现有运维平台,无法实现端到端的部署、运维和交付;5G 网络的多层编排、协作,目前没有可视化的运行管理、维护;对于垂直应用,无法从行业应用、业务以及网络的端到端客户体验、智能运维;5G 大量商用,缺乏 AI 手段,实现网络故障预警、服务切换以及故障恢复。

【 实践路径 】

信息系统部对本省运维领域工作进行了能力梳理和方向规划,提出了 1 个愿景、3 个核心、5 个阶段、3 块基石的“1+3+5+3” 智慧运维能力体系。

(1)1 个愿景:IT 运营创造价值是智慧运维体系建设的根本愿景。

(2)3 个核心:稳定准确、用户满意和风险防控是智慧运维体系建设的三大价值核心导向。

(3)5 个阶段:“初始阶段-标准化阶段-自动化/可视化阶段-初级智能阶段-高级智能阶段”是智慧运维体系建设中各项能力演进路线。

(4)3 块基石:岗位规划、文化培育和能力提升是智慧运维体系建设的三大基石。

【 实际效果 】

在自动化、智能化的运维能力和运维场景的建设决策过程中,基于事件管理流程回顾,建立了矩阵式评估模型决策体系,同时在开发、上线、运行、优化环节对运维痛点关联指标进行跟踪式管理,形成闭环的效能评估体系。上述体系实现了有限资源的科学合理利用和运维能力、场景建设收益的最大化。

(1)“微服务+能力开放”化的 Paas 级平台,可快速构建对全局支撑能力。

(2)一站式自助化配置的场景建设,大幅解放人工成本。

(3)“百花齐放”的运维场景成果,成为运营降本增效的催化剂,实现对核心业务系统运维管理的 100%覆盖。

(4) 团队软实力筑基,组织文化发展与技术创新打通形成合力

想了解更多精彩内容,快来关注云原生

你可能感兴趣的:(2020-03-14)