2个兼职运维太空中拯救5258条生命(中篇)

——从电影《太空旅客(Passengers)》看数字化企业的自动化管理





那么,数字化企业应该如何有效的进行数字化管理呢? 让我们先看看阿瓦隆号飞船的“实践”。

  

阿瓦隆号飞船的数字化管理

阿瓦隆号飞船管理的终极成果之一是实现了全程自动无人驾驶:

2个兼职运维太空中拯救5258条生命(中篇)_第1张图片

▲ 飞船飞行控制室

长达120年的飞行全程依靠自动驾驶,全体职员处于休眠状态。


在无人自动驾驶背后,是众多自动化模块支持。飞船实现了全息监控,并提供立体化展示:

2个兼职运维太空中拯救5258条生命(中篇)_第2张图片


一旦监控发现故障,立即进行自动修复:

2个兼职运维太空中拯救5258条生命(中篇)_第3张图片


随时能够对系统运行情况和故障历史进行可视化数据分析:

2个兼职运维太空中拯救5258条生命(中篇)_第4张图片


进一步根据时间线自动分析未来运行风险:

2个兼职运维太空中拯救5258条生命(中篇)_第5张图片

 

自动化管理的缺陷导致飞船差点机毁人亡

读到这里,大家不仅要问,阿瓦隆号飞船构建了如此强大的数字化管理系统,为什么还是差点灰飞烟灭、毁于一旦?

 

阿瓦隆号飞船管理失效的根源在于管理体系设计者和管理层对自动化管理系统的自负,没有将系统性风险纳入考虑设计、实现和管理的范围,而是不断的强调“飞行几千次从未出现事故”,对于已经发现的意外,例如机器人酒保对意外苏醒的男主说“你不应该这时出现在这里”,而不是启动对该“意外”的根源调查,很可能就避免了灾难处置的拖延。


阿瓦隆号飞船由于受到意外陨石击穿,很多系统包括动力系统、通信系统和监控系统等集中损坏,整个体系已经无法独立正确工作,因此也就无法探知并处理故障。


任何一种技术或者系统,永远有天然或者实现的缺陷,或者是盲点。如果独立的数字化管理系统架构和机制如果不能充分管理系统性风险,那么灾难后果将不可避免。可以通过下面两个方面解决:


1管理系统架构对内冗余,保证高可用


管理系统应考虑不同子系统自身高可用,单个模块或者其运行环境发生故障时,能够自动在其他安全环境中启动并接管该模块职责,并立即向管理系统中枢报告该故障,及时诊断分析。管理中枢系统也应该监控不同模块的存活情况,发现联系中断应立即启动替代管理模块和通信方式。关键模块之间应该有多种冗余的异构的通信方式,如有线的、无线的、不同运营商的。阿瓦隆号飞船被击穿后,不同系统已经无法依靠原有的报告故障信息,但是管理控制台并没有当做重大问题隐患进行处理,似乎也没有启动应急措施,因此导致了管理失效。


2管理系统对外校验,实现交叉检查


很多时候高冗余的成本非常高,系统性风险可能完全破坏所有的高可用设计,所以应该设立其他独立的校验系统,与核心的管理系统并行工作,交叉检查数字化系统的运行状态和效果。例如对于一个数字化渠道系统,内部组件监控、用户端体验监测、用户交易数据异动、客服系统用户投诉和社交媒体舆情追踪等利用不同技术原理、依赖不同通信通道、监测不同关键指标可以构成可以互相交叉验证的有效管理,防止系统单点的意外失效。

 

另外,来自人工的巡检、抽查等也能够有效的防止体系失效的方式。在阿瓦隆号飞船中,如果能够将乘客休眠仓提前开启、机器人在非预定时间遇到乘客等异常情况能够及时报告给中央控制台,通过分析发现重大系统性故障或隐患,及时唤醒机组相关人员,也能够避免失效。我也认为,安排机组人员进行现场轮流值守(比如一年期),也是性价比极高的可选方案。

 

 

企业如何构建数字化管理系统

阿瓦隆号飞船的数字化管理虽然是虚拟的,但是仍然能为企业构建和优化数字化管理体系、管控数字化风险提供了很多有益的启示。


综合全球企业数字化管理的实践与探索,一个典型的企业数字化综合治理管控框架如下所示。
 

2个兼职运维太空中拯救5258条生命(中篇)_第6张图片

企业数字化综合治理管控参考框架

 

数字化治理管控框架主要分成三大部分:


1高阶治理


负责设定企业数字化相关事务的决策机构与职责分配,管理发展战略、投资和绩效等;


2运作管理


数字化Operation部分,包括5个方面。
数字化业务创新管理:管理数字化的创新研究、设计和市场测试推广,直到形成可运营的业务或产品;


数字化业务运营管理:利用数字化系统和商业模式进行日常运营管理,实现商业价值;


数字化服务管理:技术层面管理技术的实现、运行和服务支持,满足业务运营的质量要求、成本要求和速度要求。引用ITILv3对于IT服务管理的全生命周期管理框架,使得框架更加清晰和全面;同时在具体贯穿执行方面,可以参考Devops、Agile、Lean、ITIL、SRE等参考实践根据实际需求调整全流程或者局部的效率和效果;


数据管理与运营:数字化的核心是收集或者产生大量数据,数据能够有效的流动,并基于数据形成业务决策、用户交互和商业价值。因此数据的管理和运营其实在上述3个方面都会涉及,特别在业务运营管理方面。另外这些数据和企业已有的传统管理系统可以共享、整合,进而实现更大的商业价值;


自动化体系:自动化体系是数字化管理中保证效率的重要手段,为数字化战略的落地执行、业务创新管理、业务运营管理、服务管理和数据管理与运营、内控等提供重要支持。下文详述自动化体系的构建与价值。

日常运作管理要强化跨团队紧密协作。负责日常运作管理的各个团队部门需要实现跨团队的紧密协作,企业的机构设置、协作流程和绩效考核应有助于打破小团体壁垒,快速的持续的利用数字化技术进行业务的创新与运营。


日常运作管理同时强调快速迭代发展,缩短试错周期,通过快速获取市场反馈、快速回馈到运作各个环节,提升产品和业务对市场的适应和满足程度,快速的变现商业价值,形成快速正向的创新循环。


3内控职能


内控职能为业务创新和运营守护安全和合规底线,并确保流程和制度得到遵守。
○风险管理
○合规管理
○审计稽核

 


>>未完待续

2个兼职运维太空中拯救5258条生命(上篇)

2个兼职运维太空中拯救5258条生命(下篇)



你可能感兴趣的:(cio,数字化,科幻,自动化,运维)