互联网系统稳定性笔记1 - 视角

系统稳定性对于外卖和新零售系统相当重要,有甚于电商系统,主要原因是业务连续性,和业务闭环的时效性特征。30分钟送达已经是新零售物流系统的标准。因此,任何稳定性故障都会导致按时送达率掉底。其他场景,还可以列出,类似共享单车,定时促销活动等。这也是阿里毕玄在几次演讲中所提到的。

作为全面的认识,我们从不同视角来观察全局稳定性这个题目。

【上帝视角】 - 自主运行的目标

我们想象一下,如果一个系统可以自我管理,自我治愈,自我升级,这个系统是否是可以算作动态稳定?作为愚蠢的人类,我们只需要关注和微调,一切就运行正常,这简直就是上帝。如同凯文.凯利所描述的自反应系统里,即便不是上帝,那也不需要我们操心多少。那将是一个理想世界,技术乌邦托。也是全局稳定性的目标,一切都是自主运行。

【治理视角】- 无奈的方式

治理是一个被迫的管理动作。可以自我治理的系统,不需要人为介入的。但是目前看来,没有。管理关注在人和事,而治理只关注事。治理是把事理清楚,推进事情按照系统结盟的节奏来进行,最后交付系统自我治理能力。因此,治理的结果是横平竖直,接口归接口,数据归数据,干净整洁。这是全局稳定性的前提。

【管理视角】 - 全局的协调器

管理目标是对于管理行为的消除。是个自我毁灭的过程。虽然说管理要管人理事,但真正的落脚点在于管理人。管理上下左右的人:向上管理期望,向下管理成长,向左右管理共赢。如果我们仔细观察,会发现销售,管理,技术中,真正有杰出贡献的人,只有1%。这些人之所以与众不同,在于管理的开放程度与众不同。仔细理解一下瑞.达里奥关于“极度开放”的论述,对于这种与众不同在就会有粗略的结论,既能把握细节和,又有足够的大局观。管理是全局稳定性的协调器。

【细节视角】- 决策的来源

架构和管理的本质都是在于决策。决策的来源在于细节。竭尽全力了解细节,然后用全局的观点去矫正目标。细节的表现多数都是我们思考盲点,漏掉一个细节,就会漏带来一个坑。接口的兼容性,版本,边界情况,这些都是以往出现过的细节陷阱。稳定性细节的相关性不言而喻,80%的稳定性故障来源于细节不清。

【技术视角】 - 效率的本质

技术的本质多少年来并没有发生大的变化。本质在于效率:系统运行效率,工作效率,沟通效率……工具化是效率的第一个呈现形态,进而自动化是工具化的集合,智进而能化是自动化的自我进化。从手工到工具化的升级在于业务熟悉能力,从工具化到自动化的升级在于系统容错能力,从自动化到智能化化的升级在于系统自我治理能力。全局稳定性的持续运行是建立在技术的持续进步上。而技术的选择要有妥协,技术的落地在于实事求是。另,如果一个研发组织的工具太多而不统一,恐怕是有问题的。

【困难视角】 - 能力的完整性

全局稳定性最大的困难是系统能力的完整性的匮乏。目前所有的互联网系统从一个单体Java/Python/Php应用成长为存在分布式公共服务的过程中,服务规范,标准,调用统一性,业务适应能力,基础算力整合,成熟程度参差不齐,进度不一。拔剑四顾,没有人和你Align……同时,建设全局稳定性的困难在于意识的不断进化。

【系统工程视角】 - 内部稳定和动态平衡

全局稳定性是一个系统工程。经典的控制理论中,多级子系统稳定性取决于子系统的稳定性;新经典控制理论中,耗散结构是一个非平衡系统取得稳定状态的一种方式,要保持与外界的信息物质能量交换。回头看一下我们的系统,既要保持内部子系统的稳定,又要不断在与其他外部系统对接,外部请求变化的过程中,不断取得动态平衡。

你可能感兴趣的:(互联网系统稳定性笔记1 - 视角)