TakinTalks稳定性社区

如何在金融企业推进故障演练？中国人寿分阶段实践总结

一分钟精华速览

越来越多企业正在通过故障注入和演练的方式提升系统可靠性，这其中金融行业的应用较为特殊。一方面其可靠性要求比非涉账类系统更高；另一方面金融行业有更加严格的监管要求，如客户、账目等信息都有严格约束。加之金融系统较其他行业系统更加庞大、繁杂，所以金融行业落地混沌工程和故障演练等工作需尤为谨慎、严谨。

本文介绍了中国人寿故障演练的项目背景、目标思路、技术方案等，分享其在预知故障和降低不确定性风险方面的实践成效。

作者介绍

中国人寿研发中心高级工程师——刘玢

TakinTalks社区专家团成员。拥有多年开发和运维经验，专注高可用领域，目前负责中国人寿混沌工程等多项高可用举措的规划和落地实施，对于构建高可用系统具有深入的理解和实践经验。

温馨提醒：本文约4600字，预计花费9分钟阅读。后台回复 “交流” 进入读者交流群；回复“0426”获取课件资料；

背景

在最近六七年时间里，中国人寿对原来烟囱式的架构做了持续改造。对诸如长险、短险、万能险等等独立系统中的类似功能，做了横向的专业化拆分、微服务拆分。新架构在带来效率提升的同时，也带来了更多不确定性风险，如微服务数量的指数级增长、架构越来越复杂、问题定位难度加大等等。

从2022年安全事件及生产风险原因分析看，中国人寿安全事件及生产风险主要包括非版本类变更引发、第三方或硬件故障、版本或历史缺陷、生产长事务或者海量数据引发等，其中非版本类变更引发、第三方或硬件故障两项总和超过50%。

一方面，微服务增多导致版本翻倍增长，带来了更多的变更风险；另一方面，“1min-10min-30min”的故障处理要求也是不小的挑战。总体上，因为缺乏抓手导致我们对性能、安全、兼容性、可维护性等多方面都缺乏质量信心。

基于此，中国人寿高可用工程规划了一系列稳保能力，并于2022年开始落地基于混沌工程的故障演练。囿于金融行业生产环境的特殊性，目前中国人寿已率先完成了在故障演练在测试环境和准生产环境的落地。

今天我将主要围绕中国人寿故障演练的项目背景、目标思路、技术方案等，分享其在预知故障和降低不确定性风险方面的实践成效。

一、故障演练想要达成哪些目标？

1.1 故障演练目标

故障演练的目标主要分为两块，业务目标和技术目标。通过基于混沌工程平台的故障演练能力建设和演练实施，从开发、测试、运维、灾备各个领域帮助各系统发现和解决潜在问题，提高系统稳定性和可用性，增强团队协作能力和故障排除能力。

1.1.1 业务目标

事前（从架构设计角度）：增强业务可用性，预防事故发生；

事中（从系统运维角度）：提高故障发现能力和告警能力；

事后（从故障处置角度）：提升应急处置时效，降低故障影响范围和时长。

1.1.2 技术目标

开发领域：去除架构设计单点，验证系统容错能力；

测试领域：生产故障回归测试，极限场景测试；

运维领域：验证监控发现能力和告警有效性，验证应急预案有效性，缩短故障处置时间；

灾备领域：验证灾备切换预案的适用性和有效性。

1.2 落地思路

第一个是安全优先。先从测试环境演练入手，再慢慢过渡到生产环境，稳定安全优先。

第二个是分步实施。先做一些简单的场景，然后再做复杂的场景，稳步推进。同时，先引入开源工具，再加强自主掌控，不断提升故障演练系统支撑能力。

第三个是加强协同。故障演练和做容量规划、灰度、在线压测等都有很大的不同，大多数时候业务团队会认为故障演练将破坏其系统程序而抵触不配合。因此，协同沟通以及混沌理念宣传非常重要。

二、技术方案如何选择？

2.1 平台功能规划

技术选型是整个项目落地最重要的一块。我们将功能规划分成了五部分，实验配置、实验管理、安全管控、监控整合、故障注入。前面两部分各家都大同小异，这里将重点分享后面三个功能规划背景。

1）安全管控 这部分规划我们花费了最多的精力和时间。在做混沌工程时，大家首先都会关注如何建立系统稳态，如何控制爆炸半径等，而金融行业系统的安全管控尤为重要，所以我们花了大量时间，与诸如阿里等一线公司做交流和调研，借鉴成功的经验。具体实现过程我将在后面展开。

2）监控整合 我们要把原有的监控能力做整合，来适应混沌平台的需求。中国人寿做过很多监控能力的建设，如机房监控、主机监控、网络监控、数据库监控、服务链路监控等等，原来的监控平台对这些监控能力都做了接入，但为了告警方便和防止误报，很多监控数据都做了抽样，比如按分钟做一个统计数据再整合起来。如果直接给混沌平台来使用，会导致时效性不足或者故障被掩盖。因此，我们需要重新做监控能力的整合。

3）故障注入 故障注入能力可能是大多数人关注的重点。我们规划的故障注入能力包括基础故障（如CPU资源、网络资源、磁盘、进程、内存）、JVM类故障、网络请求类故障、消息中间件故障、K8S引擎故障、Cattle引擎故障等等。这部分我们花了较长时间做收集整理。

此外，我们还做了一些定制开发的故障。因为仅基于开源工具，很多场景故障无法模拟。举个例子，中国人寿现在使用了大量的中间件，一个Java工程使用很多外部jar包，有些外部包又依赖其他包，整个生态非常庞大，而外部的故障工具只能对其中某些地方做故障注入，不能完全满足实际的故障模拟需求。所以需要很多定制化的故障开发来补齐这部分能力。

2.2 技术选型过程

完成功能规划后，我们从业界主流的混沌工程平台中挑选了一些产品进行深入研究和试验测评。从故障注入能力、安全管控能力、实验配置与编排、界面易用性、部署难度、服务支持、扩展性兼容性等7个方面，做了深入的分析和对比。

基于技术自主可控的思考，最终我们选择了“自研+开源”的方式。基于开源的ChaosBlade，进一步做了定制化开发，包括自定义故障的开发、监控能力整合等，形成了现有的混沌工程平台。

三、如何分阶段落地故障演练？

整个故障演练工作可以分成三个阶段。目前已经完成测试环境和准生产环境的故障演练，我将重点分享这两个阶段的落地实操。

3.1 故障演练-测试环境

3.3.1 整体工作成效

从2022年7月开始至今，总计完成13个系统测试环境的故障演练，累计进行30轮演练，发现143个风险点并采取预防措施，整改问题超过50个。

3.3.2 演练过程

1）第一轮：线上分散式演练

第一轮演练是线上分散式的，持续时间一周以上。主要参与人员有混沌教练、产品架构师、测试人员。其中，产品团队需要提供架构文档（如物理架构、逻辑架构、技术栈情况等）、历史故障清单（如上下游关系比较近的系统故障）、演练的重要关注点等。

在此过程中，我们会根据系统技术栈和系统架构，先在故障演练库中选出适合的基础故障，再根据实际沟通情况补充应用适合的故障。接下来，基于开发环境对挑选出来的故障做预演练，其目的就是通过合适的方式生成故障——有些故障比较简单，通过故障工具可以直接生成，但需要找到合适的位置并做深度剖析；还有一些故障需要定制开发，并做演练迭代。

整个过程根据系统的复杂度，短则持续1周，长则2-3周。演练完成后，就能形成适合该系统的比较完整的故障清单。

2）第二轮：集中研讨整改措施

以线下集中的形式开展，时间是半天左右。将混沌教练、产品经理以及产品组架构师等等骨干全部召集，对第一轮确定的故障清单做集中演示。同时，现场讨论并确定整改举措。有些故障会涉及多个角色，也有可能产品组不认可问题整改意见，此时则需要多轮讨论，最终商定具体的整改方案。

3）第三轮：应急预案有效性验证

此阶段加入运维部署负责人，还是以线下的形式进行，主要对应急预案的有效性进行验证，时间也是半天左右。

此轮我们会挑选一部分和运维紧密相关的故障，对第二轮整改后的系统进行可触发应急处置的故障演练。运维人员介入并根据应急预案实施一遍，看看是否能覆盖并及时处理故障。同时，也会在现场讨论应急预案的举措是否合理、是否需要增加、是否需要完善等等，并可能在现场做多次迭代实验。

3.3.3 演练结果

对于金融系统来说，真正敢上生产环境做演练的几乎没有，所以我们在测试环境的演练收获会相对少很多。前面讲到我们总计完成了13个系统测试环境的故障演练，其演练结果和问题大致可做如下分类。

从数据中可以看出，大部分问题集中在监控缺失和告警规则。尽管监控平台已经建立了好几年，但是从演练结果来看，监控告警能力并不如大家想象的乐观——存在监控盲区或者需要达到一定阈值才会在监控中呈现、告警规则不合理等等。这里也是我们测试环境演练最有价值的收获之一。

（中国人寿某系统演练问题清单）

3.2 故障演练 - 准生产环境

3.3.1 演练背景

客户活动管理系统是中国人寿的客户节活动平台，在活动高峰时，瞬时TPS可达到8000以上。为应对即将到来的客户节活动，我们在此系统上做了准生产环境的故障演练。之所以称之为准生产环境，是因为虽然它本身是生产环境，但在客户节来临前，它没有生产流量，所以我们可以直接在生产环境做尺度更大的故障注入。

3.3.2 演练过程

演练需同时依赖在线压测平台和监控平台进行。由于是在生产环境演练，所以必须用在线压测的方法才能把生产流量打上去。另外更重要的一点是，虽然客户活动平台刚上线没有生产流量，但是其上下游系统也会有生产风险，所以需要依靠在线压测平台做流量区分，将测试流量打入影子库中。同时，一些不能调用的接口也需依托在线压测平台做Mock。所以，先有在线压测平台后，再来建设混沌平台，工作推进会更加合理。

3.3.3 演练成效

1）依托在线压测平台全面验证各个模块容量；一般情况下，容量验证依靠性能测试。但性能测试有个比较大的难点，即A模块产生性能瓶颈但下游的B模块还未到达瓶颈，此时需要性能测试不停做生产变更和配置调整才能达到最优。而通过混沌工程平台，简单对CPU或内存做一定比例的占用、对网络延时做少量调整即可检测出链路上各个模块的性能极限。

2）对数据库高可用、PAAS平台多活、应用限流熔断、监控和告警等进行了全面验证；

3）首次生产应急演预案有效性验证，应用弹性扩容、数据库扩容和重启等。

四、故障演练解决了哪些实际问题？

4.1 开发领域

1）强弱依赖梳理

重保期间人力成本降低。开门红是每家保险公司都非常重视的活动。由于业务量巨大，在这种活动重保期间，我们以前的做法是所有关联系统的运维人员、产品经理都需要24小时值班做支撑，这样的成本投入是非常高的。而依托故障演练的强弱依赖梳理，可以精确知道哪些系统更重要需要24小时保障，而其他不关键的系统则可以适当降低响应要求。了解组件之间精确的依赖关系，能够更合理安排运维支持，更大程度上减少人力成本。

2）高可用举措有效性验证

架构设计的落地情况验证。以前有很多架构设计，经过评审上线后落地好坏是很难评估的，比如在架构设计文档里承诺实现的点，实际上线后可能由于各种原因并未达到设计要求，混沌工程故障演练能有一定检验效果。

单点故障容错验证。主要验证集群中一个单点产生故障后，业务是否还能继续。在实操中，业务压力较大时，其中一个节点故障，整个集群的可用性并不一定如设计的那样有效。比如，在一次对某系统生产故障复现的故障演练中，当我们对Redis做故障注入，发现当主节点瞬时内存大量占用出现故障时，从节点并未切换为主节点。所以单点故障的容错验证是有必要的。

限流、熔断阈值验证。如前面提到，有些设计看起来是没问题的，但是不经过验证，它真的不一定是可靠的。

PaaS、网格等多活验证。中国人寿有自己的PaaS平台，做了一套多云多活的高可用设计，包括一套信创云做补充。通过混沌平台我们验证了PaaS平台和网格的多活策略的有效性。

中间件高可用验证。对Redis、消息队列等依赖比较重的系统特别需要这一块的实验。

4.2 测试领域

1）生产故障回归测试 月度生产故障根因分析支持。在生产环境出故障或者难以还原现场时，我们会用混沌工程模拟现场。尽管分析出来的根因可能会不一样，但这对周边系统的高可用提升具有借鉴意义，即当生产发生此故障时，周边系统的高可用手段应该如何发挥作用。重大生产问题复盘支持。

2）极限场景模拟测试 性能测试无法模拟的场景支持。有很多场景是无法通过性能测试模拟出来的，比如发压的压力达不到、或者流量配比不科学、或者中间一些环节的容量不够，无法把足够的压力传导到指定模块上，此时可以通过混沌工具占用一部分的CPU或者内存，再去做极限场景的性能测试。

4.3 运维领域

1）监控发现能力和告警有效性验证

监控发现能力补全和告警有效性验证。前面讲到进行了30轮演练后，我们发现监控缺失和告警规则不合理占大部分。我相信这种情况应该在各家公司是普遍存在的。

2）应急预案有效性验证

促进应急预案的完善；锻炼运维队伍，提升故障处置时效。

五、未来展望

未来我们希望打造更便捷，更安全，更智能的故障演练服务。

更便捷：当前在做故障演练时，我们的投入是很大的，基本是把混沌小组最厉害的工程师、混沌教练，还有各个产品团队的架构技术骨干都集中到一起才能把整个工作开展起来。难度高、专业性强导致了便捷性的不足。未来在更便捷方面，我们想像使用自来水一样做故障演练。

更安全：当前我们还没有真正上生产。一是因为大家信心不足，二是监控指标的有效性、完整性以及依托监控指标快速恢复现场的能力也还有待进步。

更智能：我们也在思考人工智能和混沌工程的结合，比如说不需要人工再做复杂的架构和技术栈分析、历史故障分析，甚至实现自动的故障注入和实施等。（全文完）

Q&A

1、混沌教练需要具备什么样的素质?

2、混沌工程构建故障是用的哪些测试工具？测试环境和准生产环境使用的工具有哪些不同?

3、故障演练、在线压测如何分工与协作?

4、怎么做到月度生产故障和重大生产问题故障的混沌场景，镜像生产数据?

更多详细内容，欢迎点击“阅读全文”，观看完整版解答！

声明：本文由公众号「TakinTalks稳定性社区」联合社区专家共同原创撰写，如需转载，请后台回复“转载”获得授权。

本文由博客一文多发平台 OpenWrite 发布！

guava loadingCache代码示例 IM 胡鹏飞 Java 工具类介绍
publicclassTest2{publicstaticvoidmain(String[]args)throwsException{LoadingCachecache=CacheBuilder.newBuilder()//设置并发级别为8，并发级别是指可以同时写缓存的线程数.concurrencyLevel(8)//设置缓存容器的初始容量为10.initialCapacity(10)//设置缓存
上位机知识篇---常见的文件系统
文件系统是操作系统用于管理和组织存储设备上文件的机制，它决定了文件的存储方式、命名规则、访问权限、数据结构等。以下是常见的文件系统及其应用场景、优势和劣势的详细介绍：一、Windows常用文件系统1.FAT32（FileAllocationTable32）基本特点：采用32位文件分配表，是FAT系列的升级版，支持最大单文件4GB，最大分区容量理论上为8TB（实际常用2TB以内）。应用场景：U盘、存
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
DeepSeek解读道德经第五十九章 cal_ 道德经道德经
一、原文与译文原文：治人事天，莫若啬。夫唯啬，是谓早服；早服谓之重积德；重积德则无不克；无不克则莫知其极；莫知其极，可以有国；有国之母，可以长久。是谓深根固柢，长生久视之道。译文：治理百姓侍奉天道，没有比珍爱能量更重要的。唯有珍惜能量，才叫早作准备；早作准备就是厚积德性；厚积德性则无往不胜；无往不胜则力量无穷；力量无穷便可守护国家；掌握治国根本，方能长久延续。这便是根深柢固、长生久存之道。二、核心
华为云对碳管理系统的全生命周期数据处理流程 Hy行者勇哥华为云知识华为云
碳管理系统的全生命周期数据处理流程包含完整的数据采集、处理、治理、分析和应用的流程架构，可以理解为是一个核心是围绕数据的“采集-传输-处理-存储-治理-分析-应用”链路展开。以下是对每个阶段的解释，以及它们与数据模型、算法等的关系：1.设备接入（IoTDA）功能：负责将园区、工厂、建筑内的各种能源设备（电表、水表、蒸汽、废气排放传感器等）接入系统，采集原始数据。与数据模型、算法的关系：这是数据源头
《从依赖纠缠到接口协作：ASP.NET Core注入式开发指南》后端
在C#的ASP.NETCore开发中，依赖注入绝非简单的技术技巧，而是重构代码关系的底层逻辑。它像一套隐形的神经网络，让程序模块摆脱硬编码的束缚，在运行时实现动态连接，从而为系统注入可测试、可进化的核心生命力。理解其深层价值，需要穿透"服务注册与获取"的表层操作，触及它对软件设计哲学的重塑。依赖注入的本质，是对"依赖关系"的去中心化治理。传统开发中，模块间的依赖如同藤蔓缠绕的树木，一个组件直接创建
linux脚本if then,Linux 之 shell script -- 条件判断式（if ... then）红帽子船长 linux脚本if then
条件判断式很多时候，我们都必须需要某些数据来判断程序该如何进行，简单的方式可以利用&&与||，但如果我们还想要执行一堆指令呢？就可以用ifthen来帮忙啦(当符合某个条件判断的时候，就予以进行某项工作)，这个if...then的判断还有多层次的情况，这里我们分别介绍来学习。条件判断式除了if...then之外，还有case...esac这种形式，不过因为内容量太大，case...esac我们放在下
C盘软件移动到D盘的方法！电脑软件搬家工具推荐，轻松扩容量 Nightowls__ 经验分享
宝子们，是不是和我一样，电脑用着用着，C盘就快爆了，电脑也变得卡卡的。别怕，今天就来给大家安利一波超好用的“软件搬家工具免费版”，让你的电脑瞬间清爽起来！全能C盘清理专家，这可真是个宝藏工具。它不仅能清理C盘的垃圾文件，还能把C盘的软件轻松搬到其他盘，操作超简单，小白也能轻松搞定。而且它还能自动检测兼容性问题，不用担心软件搬完不能用。还有ZinstallWinWin，这个工具换硬盘或者升级电脑，用
班车服务系统扩展到多场景（穿梭车、周转车）的升级过程中，遗传算法和蚁群算法的实现示例 Alex艾力的IT数字空间算法动态规划 java spring boot 功能测试测试覆盖率
班车服务系统扩展到多场景（如办公场地穿梭车、周转车）的升级过程中，遗传算法（GA）和蚁群算法（ACO）实现协同优化，代码示例如下：一、算法选择与场景适配1.遗传算法：全局调度优化适用场景：多车辆类型（班车、穿梭车、周转车）的协同调度、时间窗约束（如会议通勤时间）、资源分配（如车辆容量限制）。核心逻辑：通过染色体编码表示调度方案，利用选择、交叉、变异操作生成新解，逐步逼近最优调度序列。Java代码示
多维度数据资产测绘技术在安全管控平台中的应用实践 KKKlucifer 安全数据库
一、数据资产治理困境：从“黑箱”到“可见性”的行业挑战在数字化转型加速的当下，企业数据资产呈现爆发式增长，而传统资产梳理手段因维度单一、时效性差，导致“资产黑箱”问题频发。某省级运营商曾在安全评估中发现，其核心系统中40%的数据资产处于未知状态，敏感数据分布模糊、接口调用链路缺失，直接引发376起未授权访问事件。这类问题的本质在于：资产维度碎片化：仅从网络端口或数据库层面单一测绘，无法关联业务系统
3D 可视化技术开启污水治理全新发展阶段广州华锐视点 3d
3D可视化大屏展示技术在污水厂的应用，已然开启了污水处理的全新篇章。它不仅为污水厂解决了当下管理和展示的难题，更如同一座灯塔，照亮了未来污水处理领域的发展道路。随着科技的持续进步，3D可视化大屏展示技术必将迎来更加辉煌的发展。一方面，其与人工智能、大数据、物联网等前沿技术的融合将愈发紧密。借助人工智能算法，大屏系统将具备更强大的自主学习和分析能力，能够根据实时数据和历史经验，自动优化污水处理工艺参
服务器数据储存需注意什么？ weixin_54503231 服务器运维
服务器数据储存是保障服务器正常运行和企业信息安全的重要环节。以下是服务器数据储存时需要注意的几个方面：一、硬件设备与技术选择硬件选型：选择质量可靠、性能稳定的硬件设备，如高速硬盘、大容量内存、快速网络接口卡等。这些设备能够提升服务器的数据处理能力和存储效率。使用RAID技术：RAID（RedundantArrayofIndependentDisks，独立磁盘冗余阵列）技术通过磁盘阵列提高数据读写性
多租户场景下的资源配额管理，如何实现公平分配与优先级调度？百态老人人工智能数据库大数据
多租户场景下的资源配额管理与调度策略体系（2025技术视角）一、资源配额管理的核心机制资源配额是多租户环境下实现资源隔离与共享的基石，其核心在于建立动态可扩展的约束规则与智能化的执行框架。当前主流技术体系包含以下核心组件：1.分层配额模型物理层配额：基于硬件资源的绝对限制（如CPU核数、内存容量、GPU算力），通过Linuxcgroups或WindowsJobObjects实现资源硬性隔离。例如，
力扣：134.加油站 meraki 算法 c++leetcode 数据结构算法
力扣：134.加油站1、题目描述题目地址在一条环路上有n个加油站，其中第i个加油站有汽油gas[i]升。你有一辆油箱容量无限的的汽车，从第i个加油站开往第i+1个加油站需要消耗汽油cost[i]升。你从其中的一个加油站出发，开始时油箱为空。给定两个整数数组gas和cost，如果你可以绕环路行驶一周，则返回出发时加油站的编号，否则返回-1。如果存在解，则保证它是唯一的。示例1:输入:gas=[1,2
134. 加油站（力扣LeetCode）
文章目录134.加油站题目描述暴力枚举（超时）代码一代码二（优化）贪心算法方法一方法二134.加油站题目描述在一条环路上有n个加油站，其中第i个加油站有汽油gas[i]升。你有一辆油箱容量无限的的汽车，从第i个加油站开往第i+1个加油站需要消耗汽油cost[i]升。你从其中的一个加油站出发，开始时油箱为空。给定两个整数数组gas和cost，如果你可以按顺序绕环路行驶一周，则返回出发时加油站的编号，
4.服务注册发现：微服务的神经系统
在微服务架构中，服务之间不再是固定连接，而是高度动态、短暂存在的。如何让每个服务准确找到彼此，是分布式系统治理的核心问题之一。服务注册发现机制，正如神经系统之于人体，承担着连接、协调、感知变化的关键角色。本文将围绕Netflix开源的服务注册发现组件Eureka展开，深入剖析其原理，并以SpringCloud实战为导向，帮助你掌握服务治理的第一步。一、为什么需要服务注册发现？在单体架构中，服务调用
云成本优化的核心原则与框架极客奇点云服务降本增效云计算成本优化 FinOps 降本增效
一、引言：云成本失控的挑战据Flexera2022年报告，全球企业32%的云支出被浪费，主因包括资源闲置、配置超配、缺乏成本可见性等。面对此现状，FinOps（财务运营）作为云成本管理的核心框架，通过“成本可视-分配-优化”闭环，成为企业降本增效的关键手段。二、FinOps核心理念与三支柱框架FinOps的本质是打破财务、技术、业务的壁垒，建立数据驱动的成本治理文化。其框架由三大支柱构成：┌───
使用STM32CubeMX在嵌入式系统中实现通过FMC读写SDRAM 程序员杨弋嵌入式开发 stm32 嵌入式硬件单片机嵌入式
嵌入式系统中的存储器是非常重要的组成部分，为了满足大容量和高速度要求，SDRAM（SynchronousDynamicRandomAccessMemory）是常用的选择之一。本文将介绍如何使用STM32CubeMX配置硬件FMC（FlexibleMemoryController）以实现在STM32微控制器上读写SDRAM。1、STM32CubeMX配置FMC和SDRAM首先，我们需要打开STM32
社会治理·智慧城市大脑建设方案
智慧城市大脑概述智慧城市大脑是城市智慧治理中心，集网络理政、城市交通、环境保护等功能于一体，通过全面汇聚城市治理数据，实现智能预警、智慧决策和协同处置。数据大脑时代的智慧城市智慧城市进入数据大脑时代，数据的融合、关联、挖掘和应用成为核心。所有数据都具有强时空属性，通过二三维一体化时空信息可视化云平台，可推动城市治理多元化、精细化、智慧化。智慧城市大脑的建设背景随着智慧社会的到来，传统的社会治理结构
智慧城市大脑：城市治理的新引擎 Fulima_cloud 智慧城市人工智能
在科技日新月异的今天，智慧城市的概念已经深入人心。而智慧城市大脑，作为智慧城市的中枢神经系统，运用大数据、云计算、物联网、人工智能等先进技术，构建的城市级智能化管理体系，正逐步成为提升城市治理能力、优化城市服务、推动城市可持续发展的重要力量。智慧城市大脑是什么，简而言之，是运用大数据、云计算、物联网、人工智能等先进技术，构建的城市级智能化管理体系。它如同城市的“智慧中枢”，通过对城市全域运行数据的
NVIDIA GeForce RTX 3090显卡详细介绍山顶望月川人工智能
一、详细参数（一）核心参数芯片厂商：NVIDIA显卡芯片：GeForceRTX3090显示芯片系列：NVIDIARTX30系列制作工艺：8纳米核心代号：GA102-300核心频率：基础频率1400MHz，加速频率1700MHzCUDA核心：10496个（二）显存规格显存频率：19500MHz显存类型：GDDR6X显存容量：24GB显存位宽：384bit最大分辨率：7680×4320（三）显卡接口接
打造企业级数据治理运营体系：从项目到产品，再到体系化运营晴天彩虹雨数据治理体系化详解大数据数据仓库 big data etl工程师 etl
“治理不是项目，而是一种持续运营的能力。”——企业数据治理的终点，是从‘上线’走向‘长治久安’。本文目录为什么数据治理必须“可运营”？企业治理运营体系四要素治理运营的核心流程设计治理运营常见问题与对策治理成效度量指标体系总结与下一步1️⃣为什么数据治理必须“可运营”？在多数企业中，数据治理容易陷入以下误区：误区表现治理项目化一次项目验收完就结束，缺乏后续维护‍♂️责任虚化“治理归数据团队，业务不管
GlusterFS 分布式文件系统详解 Sally璐璐运维运维
一、核心特性高扩展性GlusterFS采用无共享架构，支持横向扩展，只需添加服务器节点即可提升存储容量和性能，理论上可达PB甚至EB级规模，且扩展过程对上层应用完全透明。例如，一个初始4节点、20TB的集群可无缝扩展至100节点、500TB规模，仅需执行简单扩容命令，无需中断服务或数据迁移。详细扩容步骤：准备新服务器并安装GlusterFS软件确保操作系统版本兼容安装glusterfs-serve
KaiwuDB X 济南大数据局：构建城市级重点车辆智慧监管中枢数据库
项目背景2022年2月14日，交通运输部联合多部门对《道路运输车辆动态监督管理办法》进行重要修订。新规突出"科技强监"理念，明确要求各级管理机构依托智能监管平台构建常态化监管机制：一方面强化对重点营运车辆的动态监测，另一方面建立事故预防预警体系。这一政策不仅为城市重点车辆监管提供了权威的政策指引，更在全国范围内掀起了监管平台智能化升级的热潮。作为城市治理的中枢部门，济南市大数据局肩负着重点车辆监管
Rust 中字符串类型区别解析萧曵丶 Rust rust 开发语言后端字符串
在Rust中，"hello"和String::from("hello")都表示字符串，但它们在内存表示、所有权和可变性上有本质区别：1.类型与内存表示"hello"(字符串字面量)：类型为&str（字符串切片引用）存储在程序的只读内存区（如代码段或静态存储区）编译时大小固定，不可变内存布局：胖指针（指针+长度），不包含容量字段String::from("hello")：类型为String（堆分配的
Docker免费时代终结？2025最新开源政策与替代方案全解析 109702008 编程 docker 开源人工智能
标签:#Docker#容器技术#云原生#开源治理引言：从全民免费到分层收费，Docker经历了什么？“曾经的开源先锋，如今因商业策略频遭争议。”2023年起，DockerHub取消免费组织账户，2024年拉取限流升级，2025年服务账户开始按量收费——这一系列动作让开发者不得不重新思考：Docker还是当初那个‘开源宠儿’吗？本文将结合技术演进与商业逻辑，为你揭开真相。一、Docker的核心：开源
魔都AI医疗哪家强？全景揭秘科技创新与未来钱景！
引言上海作为中国科技创新的先锋城市，正在AI医疗领域崭露头角。根据2024年12月的数据，上海拥有34家专注于AI药物研发的公司，占全国预临床研究的60%和临床试验的47%。这些公司利用深度学习、大语言模型（LLM）和计算机视觉等技术，革新药物发现、医疗影像分析和数据治理，推动医疗行业的智能化转型。从全球首个人工智能医院“AgentHospital”到AI驱动的诊断系统，上海的AI医疗生态正在重塑
80亿美元押注Agent！全球第一CRM收购Informatica
昨晚，全球第一CRM平台Salesforce在官网宣布，以80亿美元全资收购企业级AI驱动云数据管理领导者Informatica。根据收购协议条款，Informatica的A股和B-1类普通股持有者将每股获得25美元现金。本次收购将增强Salesforce的数据基础，这对部署强大且负责任的AIAgent至关重要。Informatica丰富的数据目录、数据集成、治理、质量与隐私保护、元数据管理和主数
Spring Cloud服务治理精讲 Java廖志伟 Java场景面试宝典 Spring Cloud Service Governance Distributed Systems
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
Raiden Network（一）—— Overview YzYzYzzzzz Raiden Network 区块链 Raiden Network
RaidenNetwork的优点：可扩展性：当前大多数区块链的容量都有固定或半固定的限制，而雷电网络的容量与参与者数量成正比快速地：可以在亚秒内确认转移私人的：个人转账不会出现在全球共享账本中可互操作：适用于任何遵循以太坊标准化令牌API(ERC20)的令牌低费用：转账费用可能比区块链低几个数量级小额付款：低交易费用允许有效地转移微小的价值RaidenNetwork的各种资料网址：RaidenNe
微信开发者验证接口开发 362217990 微信开发者 token 验证
微信开发者接口验证。 Token，自己随便定义，与微信填写一致就可以了。根据微信接入指南描述 http://mp.weixin.qq.com/wiki/17/2d4265491f12608cd170a95559800f2d.html 第一步：填写服务器配置第二步：验证服务器地址的有效性第三步：依据接口文档实现业务逻辑这里主要讲第二步验证服务器有效性。建一个
一个小编程题-类似约瑟夫环问题 BrokenDreams 编程
今天群友出了一题：一个数列,把第一个元素删除,然后把第二个元素放到数列的最后,依次操作下去,直到把数列中所有的数都删除,要求依次打印出这个过程中删除的数。 &
linux复习笔记之bash shell (5) 关于减号-的作用 eksliang linux关于减号“-”的含义 linux关于减号“-”的用途 linux关于“-”的含义 linux关于减号的含义
转载请出自出处： http://eksliang.iteye.com/blog/2105677 管道命令在bash的连续处理程序中是相当重要的，尤其在使用到前一个命令的studout（标准输出）作为这次的stdin（标准输入）时，就显得太重要了，某些命令需要用到文件名，例如上篇文档的的切割命令（split）、还有
Unix(3) 18289753290 unix ksh
1)若该变量需要在其他子进程执行，则可用"$变量名称"或${变量}累加内容什么是子进程？在我目前这个shell情况下，去打开一个新的shell，新的那个shell就是子进程。一般状态下，父进程的自定义变量是无法在子进程内使用的，但通过export将变量变成环境变量后就能够在子进程里面应用了。 2)条件判断： &&代表and ||代表or&nbs
关于ListView中性能优化中图片加载问题酷的飞上天空 ListView
ListView的性能优化网上很多信息，但是涉及到异步加载图片问题就会出现问题。具体参看上篇文章http://314858770.iteye.com/admin/blogs/1217594 如果每次都重新inflate一个新的View出来肯定会造成性能损失严重，可能会出现listview滚动是很卡的情况，还会出现内存溢出。现在想出一个方法就是每次都添加一个标识，然后设置图
德国总理默多克：给国人的一堂“震撼教育”课永夜-极光教育
http://bbs.voc.com.cn/topic-2443617-1-1.html德国总理默多克：给国人的一堂“震撼教育”课　安吉拉—默克尔，一位经历过社会主义的东德人，她利用自己的博客，发表一番来华前的谈话，该说的话，都在上面说了，全世界想看想传播——去看看默克尔总理的博客吧！　　德国总理默克尔以她的低调、朴素、谦和、平易近人等品格给国人留下了深刻印象。她以实际行动为中国人上了一堂
关于Java继承的一个小问题。。。随便小屋 java
今天看Java 编程思想的时候遇见一个问题，运行的结果和自己想想的完全不一样。先把代码贴出来！ //CanFight接口 interface Canfight { void fight(); } //ActionCharacter类 class ActionCharacter { public void fight() { System.out.pr
23种基本的设计模式 aijuans 设计模式
Abstract Factory：提供一个创建一系列相关或相互依赖对象的接口，而无需指定它们具体的类。　　Adapter：将一个类的接口转换成客户希望的另外一个接口。A d a p t e r模式使得原本由于接口不兼容而不能一起工作的那些类可以一起工作。　　Bridge：将抽象部分与它的实现部分分离，使它们都可以独立地变化。　　Builder：将一个复杂对象的构建与它的表示分离，使得同
《周鸿祎自述：我的互联网方法论》读书笔记 aoyouzi 读书笔记
从用户的角度来看,能解决问题的产品才是好产品,能方便/快速地解决问题的产品,就是一流产品. 商业模式不是赚钱模式一款产品免费获得海量用户后,它的边际成本趋于0,然后再通过广告或者增值服务的方式赚钱,实际上就是创造了新的价值链. 商业模式的基础是用户,木有用户,任何商业模式都是浮云.商业模式的核心是产品,本质是通过产品为用户创造价值. 商业模式还包括寻找需求
JavaScript动态改变样式访问技术百合不是茶 JavaScript style属性 ClassName属性
一:style属性格式: HTML元素.style.样式属性="值"; 创建菜单:在html标签中创建或者在head标签中用数组创建 <html> <head> <title>style改变样式</title> </head> &l
jQuery的deferred对象详解 bijian1013 jquery deferred对象
jQuery的开发速度很快，几乎每半年一个大版本，每两个月一个小版本。每个版本都会引入一些新功能，从jQuery 1.5.0版本开始引入的一个新功能----deferred对象。 &nb
淘宝开放平台TOP Bill_chen C++c 物流 C#
淘宝网开放平台首页：http://open.taobao.com/ 淘宝开放平台是淘宝TOP团队的产品，TOP即TaoBao Open Platform，是淘宝合作伙伴开发、发布、交易其服务的平台。支撑TOP的三条主线为： 1.开放数据和业务流程 * 以API数据形式开放商品、交易、物流等业务； &
【大型网站架构一】大型网站架构概述 bit1129 网站架构
大型互联网特点面对海量用户、海量数据大型互联网架构的关键指标高并发高性能高可用高可扩展性线性伸缩性安全性大型互联网技术要点前端优化 CDN缓存反向代理 KV缓存消息系统分布式存储 NoSQL数据库搜索监控安全想到的问题： 1.对于订单系统这种事务型系统，如
eclipse插件hibernate tools安装白糖_ Hibernate
eclipse helios(3.6)版 1.启动eclipse 2.选择 Help > Install New Software...> 3.添加如下地址： http://download.jboss.org/jbosstools/updates/stable/helios/ 4.选择性安装：hibernate tools在All Jboss tool
Jquery easyui Form表单提交注意事项 bozch jquery easyui
jquery easyui对表单的提交进行了封装，提交的方式采用的是ajax的方式，在开发的时候应该注意的事项如下： 1、在定义form标签的时候，要将method属性设置成post或者get，特别是进行大字段的文本信息提交的时候，要将method设置成post方式提交，否则页面会抛出跨域访问等异常。所以这个要
Trie tree(字典树)的Java实现及其应用-统计以某字符串为前缀的单词的数量 bylijinnan java实现
import java.util.LinkedList; public class CaseInsensitiveTrie { /** 字典树的Java实现。实现了插入、查询以及深度优先遍历。 Trie tree's java implementation.(Insert,Search,DFS) Problem Description Igna
html css 鼠标形状样式汇总 chenbowen00 html css
css鼠标手型cursor中hand与pointer Example：CSS鼠标手型效果 <a href="#" style="cursor:hand">CSS鼠标手型效果</a><br/> Example：CSS鼠标手型效果 <a href="#" style=&qu
[IT与投资]IT投资的几个原则 comsci it
无论是想在电商,软件,硬件还是互联网领域投资,都需要大量资金,虽然各个国家政府在媒体上都给予大家承诺,既要让市场的流动性宽松,又要保持经济的高速增长....但是,事实上,整个市场和社会对于真正的资金投入是非常渴望的,也就是说,表面上看起来,市场很活跃,但是投入的资金并不是很充足的......
oracle with语句详解 daizj oracle with with as
oracle with语句详解转在oracle中，select 查询语句，可以使用with,就是一个子查询，oracle 会把子查询的结果放到临时表中，可以反复使用例子:注意，这是sql语句，不是pl/sql语句，可以直接放到jdbc执行的 ----------------------------------------------------------------
hbase的简单操作 deng520159 数据库 hbase
近期公司用hbase来存储日志,然后再来分析 ,把hbase开发经常要用的命令找了出来. 用ssh登陆安装hbase那台linux后用hbase shell进行hbase命令控制台! 表的管理 1）查看有哪些表 hbase(main)> list 2）创建表 # 语法：create <table>, {NAME => <family&g
C语言scanf继续学习、算术运算符学习和逻辑运算符 dcj3sjt126com c
/* 2013年3月11日20:37:32 地点：北京潘家园功能：完成用户格式化输入多个值目的：学习scanf函数的使用 */ # include <stdio.h> int main(void) { int i, j, k; printf("please input three number:\n"); //提示用
2015越来越好 dcj3sjt126com 歌曲
越来越好房子大了电话小了感觉越来越好假期多了收入高了工作越来越好商品精了价格活了心情越来越好天更蓝了水更清了环境越来越好活得有奔头人会步步高想做到你要努力去做到幸福的笑容天天挂眉梢越来越好婆媳和了家庭暖了生活越来越好孩子高了懂事多了学习越来越好朋友多了心相通了大家越来越好道路宽了心气顺了日子越来越好活的有精神人就不显
java.sql.SQLException: Value '0000-00-00' can not be represented as java.sql.Tim feiteyizu mysql
数据表中有记录的time字段（属性为timestamp）其值为：“0000-00-00 00:00:00” 程序使用select 语句从中取数据时出现以下异常： java.sql.SQLException:Value '0000-00-00' can not be represented as java.sql.Date java.sql.SQLException: Valu
Ehcache（07）——Ehcache对并发的支持 234390216 并发 ehcache 锁 ReadLock WriteLock
Ehcache对并发的支持在高并发的情况下，使用Ehcache缓存时，由于并发的读与写，我们读的数据有可能是错误的，我们写的数据也有可能意外的被覆盖。所幸的是Ehcache为我们提供了针对于缓存元素Key的Read（读）、Write（写）锁。当一个线程获取了某一Key的Read锁之后，其它线程获取针对于同
mysql中blob,text字段的合成索引 jackyrong mysql
在mysql中，原来有一个叫合成索引的，可以提高blob,text字段的效率性能，但只能用在精确查询，核心是增加一个列，然后可以用md5进行散列，用散列值查找则速度快比如： create table abc(id varchar(10),context blog,hash_value varchar(40)); insert into abc(1,rep
逻辑运算与移位运算 latty 位运算逻辑运算
源码：正数的补码与原码相同例+7 源码：00000111 补码：00000111 （用8位二进制表示一个数）负数的补码：符号位为1，其余位为该数绝对值的原码按位取反；然后整个数加1。 -7 源码： 10000111 ，其绝对值为00000111 取反加一：11111001 为-7补码已知一个数的补码，求原码的操作分两种情况：
利用XSD 验证XML文件 newerdragon java xml xsd
XSD文件（XML Schema 语言也称作 XML Schema 定义（XML Schema Definition，XSD）。具体使用方法和定义请参看： http://www.w3school.com.cn/schema/index.asp java自jdk1.5以上新增了SchemaFactory类可以实现对XSD验证的支持，使用起来也很方便。以下代码可用在J
搭建 CentOS 6 服务器(12) - Samba rensanning centos
（1）安装 # yum -y install samba Installed: samba.i686 0:3.6.9-169.el6_5 # pdbedit -a rensn new password:123456 retype new password:123456 …… （2）Home文件夹 # mkdir /etc
Learn Nodejs 01 toknowme nodejs
（1）下载nodejs https://nodejs.org/download/ 选择相应的版本进行下载（2）安装nodejs 安装的方式比较多，请baidu下我这边下载的是“node-v0.12.7-linux-x64.tar.gz”这个版本（1）上传服务器（2）解压 tar -zxvf node-v0.12.
jquery控制自动刷新的代码举例 xp9802 jquery
1、html内容部分复制代码代码示例: <div id='log_reload'> <select name="id_s" size="1"> <option value='2'>-2s-</option> <option value='3'>-3s-</option

如何在金融企业推进故障演练？中国人寿分阶段实践总结

一分钟精华速览

作者介绍

背景

一、故障演练想要达成哪些目标？

1.1 故障演练目标

1.1.1 业务目标

1.1.2 技术目标

1.2 落地思路

二、技术方案如何选择？

2.1 平台功能规划

2.2 技术选型过程

三、如何分阶段落地故障演练？

3.1 故障演练-测试环境

3.3.1 整体工作成效

3.3.2 演练过程

3.3.3 演练结果

3.2 故障演练 - 准生产环境

3.3.1 演练背景

3.3.2 演练过程

3.3.3 演练成效

四、故障演练解决了哪些实际问题？

4.1 开发领域

4.2 测试领域

4.3 运维领域

五、未来展望

Q&A

你可能感兴趣的:(容量治理)