蓝鲸平台作为当下最受企业欢迎的研运一体化平台,已经在很多企业内落地实施,在银行业也得到了广泛的推广,但实施的规模,建设内容,推广方式以及应用效果却各有不同。本文以两个典型银行为例,对比分析蓝鲸建设方式区别和原因,同时基于平台特性,对蓝鲸在银行的应用方式给出相关的建议。



银行业务运维现状分析


随着互联网的快速发展,银行从单一的网点渠道服务到如今的多渠道和全渠道业务,但是银行的中心仍然是基于网点的设计。与其他服务平台一样,银行来到了一个需要不断改变以适应客户需求的世界。即将迎来银行4.0时代,基于5G、大数据、云计算、人工智能等新兴技术,银行全面开展数字化转型。

【银行运维】落地平台化管理,大步迈向银行4.0_第1张图片

新时代同样也带来了新挑战,银行业务更趋于敏态化,敏捷、开放、高效等成了业务运维的重要需求。同时,传统金融业务等稳态业务对安全、稳定、可控的要求也仍然存在。新时代下,如何做好双态运维成为了银行IT运维的巨大挑战。同时,随着业务及运维的持续建设,部分问题和困惑也逐渐暴露出来。



1、问题与困惑


烟囱运动

  • 运维工具在各自能力范围内能够较好的满足使用需求,但由于各运维工具基本独立建设,运维工具之间缺乏服务调用、数据交换等方面的标准,难以形成合力提供服务, 不便于运维工具使用效率的提升。

  • 运维工具一般由工具建设方维护,受限于日常工作的负载,在需求的应对与功能开发方面速度较慢,工具使用人员对运维工具的了解程度也有限,该情况不利于运维工具使用场景的推广。


能力缺失

  • 部分运维工具为早年建设,产品服务和发展前景不明朗,特别是厂商服务能力的下降,严重影响了现有工具的使用。

  • 随着新技术的引进,原有“监”、“管”、“控”产品,无法支持MySQL、Tomcat等开源技术产品,对部分软件产品新版本也不支持。

  • 现有运维工具的覆盖面不全,现有功能点无法跨多个系统进行场景式的编排,闭源产品改造难度大,开源产品维护成本高。


转型需求

  • 银行运维正在从手工化自动化演进的过程中,未来需要进一步实现“数据化、智能化”的目标。

  • 通过经验的积累、同业与互联网企业的调研可知,系统运维中心的转型不是单靠引入系统、建设平台即可达成目标,系统与平台的建设只是打造一个转型的基础,而更为关键的是运维人员的培养及管理的配套。


针对上述问题,银行IT从业者不得不思考如何进行烟囱治理,如何建设工具以及如何促进运维转型。


2、建设与转型


平台化建设

  • 亟需建设统一运维平台,将API网关引入到运维工具建设中,把数据流与控制流统一,将分散的运维工具有机结合,发挥合力。

  • 引入成熟的运维开发框架,通过PaaS技术实现运维开发人员与底层运维工具的解耦,简化运维开发的学习成本和开发成本。


持续性工具建设

  • 全面梳理现有运维工具,评估其使用现状和未来发展性,持续进行优化、整合,将跨系统的功能串联起来,实现更高阶的自动化,甚至实现智能化无人值守。

  • 深化运维工具的应用场景,覆盖运维到运营的各类场景,实现运维自动化、工具化。


运维开发转型,建设人才队伍

  • 为运维人员提供简单易用的开发平台,帮助运维人员了解、熟悉、掌握一定的程序开发技巧,实现产品引入自主开发的逐步转变。

  • 配套建设完善的运维开发培养及管理的落地方案,为运维开发转型积累人才梯队。


针对上述问题,笔者针对银行业通常的运维建设现状和互联网企业运维现场进行调研后,比对如下:


3、银行和互联网企业对比

系统监控

银行业:工行自研系统监控工具,招行、浦发、华夏使用传统商业监控产品(面临功能及服务问题)。


互联网企业:自研系统监控工具,灵活满足自身需求。


配置管理

银行业:普遍存在配置数据准确性、及时性问题,影响配置数据的使用。


互联网企业:运维技术体系自主研发,运维工具合作密切,配置数据准确性、及时性较好。


运维自动化

银行业:工行、招行的应用变更自动化比例≥90%,华夏银行应用变更自动化比例也处于较高水平。


互联网企业:应用变更自动化比例≥90%,故障自愈比例≥90%,实现了跨系统全流程调度自动化,以及无人值守。


运维大数据

银行业:工行、招行建成运维大数据平台,许多银行尚未建成运维大数据平台。


互联网企业:已建成运维大数据平台,基于平台实现从“系统运维”转向“业务运营”转型。


运维开发

银行业:工行、招行等同业正在积极推进运维工具自主研发的路线,并努力推进运维工具与技术的整合,华夏银行则通过引入腾讯蓝鲸平台来推广运维开发理念,目前实现小范围小工具的自研。


互联网企业:2016年实现基于PaaS的运维一体化,帮助运维团队成功转型;并继续基于平台低成本、体系化推进DevOps、AIOps,形成“研发运维运营”一体化中台。


相较互联网公司,银行业运维仍然较为传统。工行、招行、浦发、华夏等银行已经开始探索新的运维模式。银行业亟需顺应时代的发展,推进运维的数字化转型。



银行运维建设方案调研

 
1、银行运维体系

分别对A、B、C三家大型银行运维体系进行调研,得到如下信息:


A银行

基于智能化、PaaS化构建运维开发平台,承载运维管理的新理念新思路,促进组织的产能升级和人员技能转型 。利用平台PaaS化架构,突破常规,构建数字化研运体系,同时打破烟囱壁垒,构筑中台能力池。

【银行运维】落地平台化管理,大步迈向银行4.0_第2张图片


B银行

规划运维技术蓝图,实现系统运维中心“提产能、促转型”的总体目标 通过平台建设实现传统运维向运维开发转型;通过API的建设,降低工具使用门槛;运用开发手段,灵活应对复杂应用场景。

【银行运维】落地平台化管理,大步迈向银行4.0_第3张图片

C银行

建设开放平台,制定产品规范,再提升架构能力,对接流程管控,实现运维工具的自动接管、运营数据分析和挖掘,形成持续改进循环。以非功能管理为抓手,推动应用运维的持续改进和自动化的改进。

【银行运维】落地平台化管理,大步迈向银行4.0_第4张图片

2、银行运维体系建设宗旨

对比分析三家银行的建设思路,不难发现银行运维体系建设的宗旨主要包括:

平台+应用的构建模式

  • 全面支撑以系统为视角的全生命周期安全运行管理;

  • 建立一体化研发运营平台,运用场景输出模式,对应用功能进行解耦;

  • 提供便捷快速服务组合功能,保留未来的充分扩展性。


功能覆盖率要求

  • 构建运维、运营于一体的统一管理;

  • 功能设计覆盖CMDB、监控、自动化、数据分析、AIops场景;

  • 为未来智能化业务场景预留扩展能力。


技术架构先进性要求

  • 构建一套高可用、高性能安全运行系统;

  • 摈弃传统单体设计模式,采用业界先进微服务设计模式;

  • 利用分布式、高可用技术实现平台高可用、高性能;

  • 采用开放式标准化的平台接口设计,实现与外围系统的灵活集成。


蓝鲸平台落地方式对比分析


蓝鲸平台作为企业IT运维、运营的“大杀器”,得到了很多银行的认可,A、B、C三家银行中,A和B均通过蓝鲸自主建设了运维平台,但建设方式、推广路线等均有所不同。其中,A银行更多从工具层开始建设,而B更多从平台层和能力层开始。

【银行运维】落地平台化管理,大步迈向银行4.0_第5张图片

A银行

由于总行已建设部分运维系统,考虑充分复用,总行平台推广当前仅在运维团队内部,而分支行由于缺少运维管理工具,平台得到全面推广,并且认可度极高。


同时平台建设从场景层入手,优先建设运维工具,快速填充运维工具缺口,建设速度快,效率高,但工具相对分散,烟囱治理相对不充分,虽立竿见影,但后续持续建设需做相应的攻坚。


B银行

先进行顶层设计,规划IT蓝图,基于蓝图,先打基础,优先建设平台能力,如配置、监控管理等,夯实平台基础,总体建设周期长,初期见效慢,但更利于一体化实现,实现厚积薄发。


蓝鲸落地方式建议


蓝鲸既可以作为开箱即用的运维工具,又可以作为承载一切研运能力和场景的平台,平台+场景但构建方式,充分保证了建设的灵活性。同时平台强大的API Gateway能够有效的做到“海纳百川”式的集成对接,企业不必担心因蓝鲸的建设实施而推翻已有的运维管理系统,对于“老”、“旧”、“难”银行可以通过平台进行相应的提换,但对于“好”、“新”、“专”类的运维系统和工具,银行可以通过集成的方式实现能力对接,并通过平台实现一体化运维和管理。

【银行运维】落地平台化管理,大步迈向银行4.0_第6张图片

如监控故障管理,可以使用蓝鲸平台的监控告警,也可以与现有的监控工具集成对接。

【银行运维】落地平台化管理,大步迈向银行4.0_第7张图片

配置平台,可以复用现有的CMDB,但不能完全替换蓝鲸本身的配置平台,需要进行相关的数据同步和集成。

【银行运维】落地平台化管理,大步迈向银行4.0_第8张图片


作业及管控,作为蓝鲸的核心驱动能力模块,蓝鲸通过唯一以1个Agent实现海量节点的运维管理,包括文件分发,数据提取和命令执行,所以作业平台以及Agent需要使用蓝鲸平台自身功能。



总结

在银行4.0时代下,平台化运维运营管理已成为主流趋势,蓝鲸PaaS平台以其灵活的建设架构和强大的集成能力,为银行IT运维转型提供源源不断动力,企业可以结合自身特性,或基于顶设从能力层逐步建设,或为补足工具,立竿见影;或大刀阔斧推翻重构,或兼容并包重复复用现有工具;嘉为蓝鲸解决方案,是银行IT运维转型的首选。


作者:李方园


其他优质文章


弹性(Flex)布局的使用

运维转型 | 运维人不再只是“救火英雄”

嘉为科技荣获ITSS【2019中国卓越智能运维服务商】

企业上云如何优化性能?

jmeter集群下脚本日志和报告处理