40岁资深老架构师尼恩

大家都崩，美团不崩：其高可用架构，巧夺天工！

说在前面

在40岁老架构师尼恩的50+读者群中，一直在指导大家简历，指导大家职业升级。

前几天，指导了一个40岁老伙伴拿到年薪100W offer，小伙伴的优势在异地多活。

在简历指导的过程中，尼恩发现： 异地多活的概念、异地多活的架构、非常重要。

而且，异地多活的架构非常重要，3月份出了两个大的线上事故，B站刚崩，唯品会又崩了。

在这里，尼恩给自己的 Future Super Architect Community （未来超级架构师）社区的小伙伴，积累一些异地多活的架构方案和素材。这些资料的主要的目标：方便在架构指导的时候，作为参考资料。

在尼恩的公众号技术自由社群中，之前有过两篇异地多活的方案介绍文章：

《B站刚崩，唯品会又崩：亿级用户网站的架构硬伤与解决方案》

《100Wqps异地多活，得物是怎么架构的？》

当然，好知识不能独享，这份方案，顺便通过尼恩的自媒体渠道公布给大家，为大家做架构提供参考资料。

也一并把这个方案作为系统高可用架构参考答案，收入咱们的《尼恩Java面试宝典PDF》V143，供后面的小伙伴参考，提升大家的 3高架构、设计、开发水平。

《尼恩架构笔记》《尼恩高并发三部曲》《尼恩Java面试宝典》的PDF，请到文末公号【技术自由圈】取

文章目录

- 说在前面
- 接二连三的P0级事故（高可用事故）
- - 语雀崩了、阿里云崩，阿里崩完、滴滴崩...
- 美团点评智能支付核心交易系统的可用性实践
- 背景
- 问题引发
- 问题分析
- 问题解决
- - 1. 发生频率要低之别人死我们不死
  - - 1.1 消除依赖、弱化依赖和控制依赖
    - 1.2 事务中不包含外部调用
    - 1.3 设置合理的超时和重试
    - 1.4 解决慢查询
    - 1.5 熔断
  - 2. 发生频率要低之自己不作死
  - - 2.1 不作
    - 2.2 不死
  - 3. 发生频率要低之不被别人搞死
  - - 3.1 限流
  - 4. 故障范围要小之隔离
  - 5. 故障恢复要快之快速发现
  - - 5.1 全链路线上压测
  - 6. 故障恢复要快之快速定位
  - 7. 故障恢复要快之快速解决
- 工具介绍
- - Hystrix
  - Rhino
- 说在最后
- 技术自由的实现路径 PDF：
- - - 实现你的架构自由：
    - 实现你的响应式自由：
    - 实现你的 spring cloud 自由：
    - 实现你的 linux 自由：
    - 实现你的网络自由：
    - 实现你的分布式锁自由：
    - 实现你的王者组件自由：
    - 实现你的面试题自由：

接二连三的P0级事故（高可用事故）

语雀崩了、阿里云崩，阿里崩完、滴滴崩…

2023-11月左右，P0级（宕机几个小时）故障频发：

语雀一个月前崩了，接着阿里云崩，阿里云崩完、滴滴崩…而且都是宕机几个小时，影响面广，例如由于滴滴平台不能提供服务，有同学说：

滴滴影响实在是太大了，整个飞机上人数少了有一半。

所以，像阿里云、滴滴这样的大平台，一旦出现大的质量事故，造成的经济损失非常巨大。

P0事件频发，的确是给各个互联网大厂敲响了质量警钟。

1. 滴滴平台事故

这次故障影响相当之大，持续非常之久。从昨晚10点一直影响到今天早上9点。

2023-11-28 22:27 有网友反馈，滴滴打车车子未到，司机电话说到了。

22:50 尝试访问，依然502，搜索失败，之后不断尝试… 依旧是502错误。

从全线产品线出问题来看，可能是数据库批量挂掉，恢复数据完成时间不可控。

当然，也有可能是系统升级导致基础架构崩溃，比如云平台崩溃，问题难定位。

2. 阿里云崩溃

回到11月12日双十一刚过，阿里就迎来了一次P0级事故，阿里云直接崩溃，影响范围极大，阿里系的钉钉，淘宝，闲鱼，语雀，高德地图等重磅应用全线崩溃，并且还影响到数以万计的客户，那些使用了阿里云OSS服务的公司，也难以幸免。

这次事故被定级为P0事故了，最严重的那种，而距离上一次阿里云发生P0事故，还不到一年的时间，在去年的12月，阿里云香港地区就发生了严重的故障，导致服务中断了超过12小时，而现在一年时间都不到，又发生了类似事件。

3. 语雀严重故障

10 月 23 日下午两点左右，语雀（在线文档编辑与协同工具）发生服务器故障，在线文档和官网目前均无法打开。

当日 15 时，语雀发布官方声明称，“目前因网络故障，出现无法访问的情况。此故障不会影响用户在语雀存储的数据，不会引起数据丢失，我们正在紧急恢复中，再次抱歉给你带来的损失。”

据语雀公告，这次事故是由于新的运维升级工具 bug导致的：导致华东地区生产环境存储服务器被误下线。受其影响，语雀数据服务发生严重故障，造成大面积的服务中断。为了尽快恢复服务，语雀和数据存储运维团队全力进行数据恢复工作，但受限于恢复方案、数据量级等因素，整体用时较长。从下午2:15开始联系硬件团队尝试将下线机器重新上线，但是因存储系统使用的机器类别较老，无法直接操作上线，重新调整恢复方案，中间经过新建存储系统、数据恢复、数据校验、团队联调等过程，最终在 22 点恢复语雀全部服务，历时近8个小时。

这次故障教训是深刻的，技术风险保障和高可用架构设计非常重要，确保数据备份、系统容错能力，如增加存储系统的异地灾备，实现快速恢复，并进行定期的容灾应急演练，缩小运维动作灰度范围。今后，我们也要加强运维工具的质量保障与测试，杜绝此类运维 bug 再次发生。

4. 更早：唯品会大事故

6 月 5 日，唯品会发布关于 329 机房宕机故障处理公告。官方在公告中称，南沙机房重大故障影响时间持续 12 个小时，导致公司业绩损失超亿元，影响客户达 800 多万。公司让对应部门的直接管理者承担此次事故责任，基础平台部负责人予以免职处理。

5. 大家都崩，美团不崩

这么多大厂产品都崩，大家发现没有，美团的产品，竟然不崩

没怎么听到没有产品崩溃的消息。

不出事就是好事，说明人家平时的工作做好了，做到位了。

那么，美团是怎么做高可用架构的呢？

这里，来了一篇美团内部的架构师，写的他们的高可用架构的文章。

通过文章，看看他的高可用架构，是多巧夺天工！

美团点评智能支付核心交易系统的可用性实践

文章来源：美团技术公众号

作者：晓静，美团技术专家

背景

每个系统都有它最核心的指标。比如在收单领域：进件系统第一重要的是保证入件的准确性，第二重要的是保证上单效率。清结算系统第一重要的是保证准确打款，第二重要的是保证及时打款。我们负责的系统是美团点评智能支付的核心链路，承担着智能支付100%的流量，内部习惯称为核心交易。因为涉及美团点评所有线下交易商家、用户之间的资金流转，对于核心交易来说：第一重要的是稳定性，第二重要的还是稳定性。

稳定重要性

问题引发

作为一个平台部门，我们的目标分为三个阶段：第一阶段是迅速支持业务发展；第二阶段是把握住一个明确的发展方向；第三阶段是在观察市场趋势的基础上，引领一个大方向。

虽然目标宏伟，但现实情况是，从2017年初的每天数十万订单，到年底时，日订单量已经激增至700万，系统面临着前所未有的挑战。支付渠道在不断增加，交易链路在延长，系统复杂性也在不断提升。从最初的POS机到后来的二维码支付产品，如小白盒、小黑盒、秒付等，产品的多样化，使得系统的定位也在不断调整。而系统对于变化的适应速度，就像是与兔子赛跑的乌龟。

由于业务的高速增长，即使系统没有进行任何更新升级，也可能会突然出现事故。事故发生的频率越来越高，而系统自身的升级也常常面临诸多困难。基础设施升级、上下游升级，往往会引发“蝴蝶效应”，系统可能会在毫无预兆的情况下受到影响。

问题分析

核心交易的稳定性问题实质上是如何实现系统的高可用性。

可用性指标

业界高可用的标准是按照系统宕机时间来衡量的：

可用性标准

因为业界的标准是后验的指标，考虑到对于平时工作的指导意义，我们通常采用服务治理平台OCTO来统计可用性。计算方法是：

美团可用性计算

可用性分解

业界系统可靠性还有两个比较常用的关键指标：

平均无故障时间(Mean Time Between Failures，简称MTBF)：即系统平均能够正常运行多长时间，才发生一次故障。
平均修复时间(Mean Time To Repair，简称MTTR)：即系统由故障状态转为工作状态时修理时间的平均值。

对于核心交易来说，可用性最好是无故障。然而，在出现故障时，判断其影响的因素除了时间，还包括影响的范围。将核心交易的可用性问题分解则为：

可用性分解

问题解决

1. 发生频率要低之别人死我们不死

1.1 消除依赖、弱化依赖和控制依赖

用STAR法则举一个场景：

情境(situation)

我们要设计一个系统A，其功能是：通过我们美团点评的POS机，使用系统A连接银行进行支付，同时我们会提供一些优惠活动，如满减、积分等。

任务(task)

分析一下对于系统A的显性需求和隐性需求：

接收上游传递的参数，参数中包含商家信息、用户信息、设备信息、优惠信息。
生成单号，将交易的订单信息落库。
敏感信息要加密。
要调用下游银行的接口。
要支持退款。
要把订单信息同步给积分核销等部门。
要能给商家一个查看订单的界面。
要能给商家进行收款的结算。

基于以上需求，分析一下怎样才能让里面的最核心链路“使用POS机付款”稳定。

行动(action)

分析一下：需求1到4是支付必需的链路，可以将其集成在一个子系统内，称之为收款子系统。需求5到8各自独立，每个都可以作为一个子系统来开发，具体情况取决于开发人员数量、维护成本等因素。

需要注意的是，需求5到8与收款子系统之间没有功能上的依赖，只有数据上的依赖，即它们都需要依赖生成的订单数据。

收款子系统是整个系统的核心，对稳定性有极高的要求。其他子系统出现问题，不能影响到收款子系统。

因此，我们需要在收款子系统和其他子系统之间建立一个解耦，统一管理向其他系统提供的数据。这里称之为“订阅转发子系统”，只要确保这个系统不会影响收款子系统的稳定性即可。

粗略架构图如下：

架构图

结果(result)

从上述架构图可以看出，收款子系统和退款子系统、结算子系统、信息同步子系统、查看订单子系统之间没有直接依赖关系，达到了消除依赖的目的。收款子系统不需要依赖数据订阅转发子系统，而是数据订阅转发子系统需要依赖收款子系统的数据。我们通过控制依赖，使数据订阅转发子系统从收款子系统拉取数据，而不是收款子系统向数据订阅转发子系统推送数据。这样，即使数据订阅转发子系统出现问题，收款子系统也不会受到影响。

再说数据订阅转发子系统拉取数据的方式。例如，数据存储在MySQL数据库中，通过同步Binlog来获取数据。如果采用消息队列进行数据传输，就会对消息队列中间件产生依赖。如果我们设计一个灾备方案：当消息队列出现问题，直接通过RPC调用传输数据。对于这个消息队列，就实现了降低依赖的效果。

1.2 事务中不包含外部调用

外部调用包括对其他系统的调用和基础组件的调用。外部调用的特点是返回时间不可预测，如果将其包含在事务中，会导致事务变得庞大。过大的数据库事务会占用所有数据库连接，导致与该数据库相关的所有服务陷入等待状态，进而使得连接池满负荷，多个服务崩溃。如果处理不好这个问题，危险程度极高，达到五颗星。下面的图显示出外部调用时间的不可控：

大事务问题

解决方法：

检查各个系统的代码，看看事务中是否包含RPC调用、HTTP调用、消息队列操作、缓存操作、循环查询等耗时操作。这些操作应该放在事务之外，理想情况下，事务内只处理数据库操作。
对大事务添加监控报警。大事务发生时，会收到邮件和短信提醒。针对数据库事务，一般分为1s以上、500ms以上、100ms以上三种级别的事务报警。
建议不要使用XML配置事务，而应采用注解方式。原因在于，XML配置事务的可读性不强，切面配置通常过于泛滥，容易导致事务过大，而且对于嵌套情况的规则处理不好。

大事务排除措施

1.3 设置合理的超时和重试

对外部系统和基础组件如缓存、消息队列等的依赖关系。设想一下，如果这些被依赖的对象突然出现问题，我们系统的响应时间将由内部耗时、依赖方超时时间以及重试次数决定。如果超时时间过长或重试次数过多，系统可能会长时间无法返回，导致连接池被耗尽，甚至导致系统崩溃；反之，如果超时时间过短，会导致499错误增加，从而降低系统的可用性。

举个例子：

依赖例子

以服务A为例，它依赖于两个服务的数据来完成某项操作。在正常情况下，没有问题。但是，如果服务B在您不知情的情况下，响应时间变长甚至停止服务，而客户端的超时时间设置过长，那么完成此次请求的响应时间就会变长。在这种情况下，如果发生意外，后果将会非常严重。

Java的Servlet容器，无论是Tomcat还是Jetty都是多线程模型，都用Worker线程来处理请求。这个可配置有上限，当你的请求打满Worker线程的最大值之后，剩余请求会被放到等待队列。等待队列也有上限，一旦等待队列都满了，那这台Web Server就会拒绝服务，对应到Nginx上返回就是502。如果你的服务是QPS较高的服务，那么在这种情况下，你的服务也会受到影响。如果上游服务没有合理设置超时时间，故障会继续向上扩散。这种故障逐级放大的过程，就是所谓的服务雪崩效应。

解决方法：

首先要调研被依赖服务自己调用下游的超时时间是多少。调用方的超时时间要大于被依赖方调用下游的时间。
统计这个接口99%的响应时间是多少，设置的超时时间在这个基础上加50%。如果接口依赖第三方，而第三方的波动比较大，也可以按照95%的响应时间。
如果系统服务的重要性较高，可以按照默认的重试次数，通常是重试三次。否则，可以考虑不进行重试。

1.4 解决慢查询

慢查询会降低应用的响应性能和并发性能。在业务量增加的情况下造成数据库所在的服务器CPU利用率急剧攀升，严重的会导致数据库不响应，只能重启解决。关于慢查询，可以参考技术博客之前的文章《MySQL索引原理及慢查询优化》。

慢查询

解决方法：

将查询分为实时查询、近实时查询和离线查询。实时查询可以直接穿透数据库，其他的查询则不走数据库，可以使用Elasticsearch来实现一个查询中心，处理近实时查询和离线查询。
读写分离。写走主库，读走从库。
索引优化。过多的索引会影响数据库的写入性能，而索引不足则会导致查询速度变慢。DBA建议一个数据表的索引数不超过4个。
不允许出现大表。MySQL数据库的一张数据表当数据量达到千万级，效率开始急剧下降。

1.5 熔断

在依赖的服务不可用时，服务调用方应通过一些技术手段，提供有损服务，以确保业务的柔性可用性。如果系统没有熔断机制，由于代码逻辑问题上线引发故障、网络问题、调用超时、业务促销导致调用量激增、服务容量不足等原因，服务调用链路上的一个下游服务出现故障，就可能导致接入层的其他业务无法使用。下图是对无熔断影响的鱼骨图分析：

无熔断

解决方法：

自动熔断：可以使用Netflix的Hystrix或者美团点评自己研发的Rhino来做快速失败。
手动熔断：确认下游支付通道抖动或不可用，可以手动关闭通道。

2. 发生频率要低之自己不作死

自己不作死要做到两点：第一自己不作，第二自己不死。

2.1 不作

关于不作，我总结了以下7点：

不当小白鼠：只用成熟的技术，确保系统的稳定不受技术问题的影响。
职责单一化：防止职责的交织削弱或影响其完成主要职责的能力。
流程规范化：降低人为因素带来的影响。
过程自动化：让系统更高效、更安全的运营。
容量有冗余：为应对竞争对手系统崩溃导致用户转向我们、大型促销活动等突发情况，以及防灾考虑，系统容量至少要有2倍以上的冗余。
持续的重构：持续重构是保证代码长期稳定运行，避免一动就出问题的有效方法。
漏洞及时补：美团点评有安全漏洞运维机制，提醒督促各个部门修复安全漏洞。

安全漏洞

2.2 不死

关于不死，地球上有五大不死神兽：能在恶劣环境下停止新陈代谢的“水熊虫”；可以返老还童的“灯塔水母”；在硬壳里休养生息的“蛤蜊”；水、陆、寄生样样都成的“涡虫”；有隐生能力的“轮虫”。它们的共通特征用在系统设计领域上就是自身容错能力强。这里“容错”的概念是：使系统具有容忍故障的能力，即在产生故障的情况下，仍有能力将指定的过程继续完成。容错即是Fault Tolerance，确切地说是容故障(Fault)，而并非容错误(Error)。

容错

3. 发生频率要低之不被别人搞死

3.1 限流

在开放的网络环境中，外部系统经常会遇到各种有意或无意的恶意攻击，例如DDoS攻击和用户重复尝试。尽管我们的团队成员都是精英，但我们仍然需要采取措施来保护系统，以免受到上游疏忽的影响。毕竟，没有人能够保证其他同事不会编写一个无限次重试的代码，如果下游返回不符合预期。这些内部和外部的巨量调用，如果不加以保护，往往会扩散到后台服务，最终可能引起后台基础服务宕机。下图是对无限流影响的问题树分析：

无限流

解决方法：

通过对服务端的业务性能进行压测，可以分析出一个相对合理的最大QPS值。
流量控制中用的比较多的三个算法是令牌桶、漏桶、计数器。可以使用Guava的RateLimiter来实现。其中SmoothBurstry是基于令牌桶算法的，SmoothWarmingUp是基于漏桶算法的。
核心交易这边采用美团服务治理平台OCTO做thrift截流。该平台支持接口粒度配额、单机/集群配额、指定消费者配额、测试模式工作以及及时的报警通知。在测试模式下，系统只会报警并不会真正进行限流。关闭测试模式后，超过限流阈值的请求将触发异常处理。限流策略可以随时关闭。
可以使用Netflix的Hystrix或者美团点评自己研发的Rhino来做特殊的针对性限流。

4. 故障范围要小之隔离

隔离是指将系统或资源分割开，这样在系统出现问题时，可以限制故障的扩散和影响范围。

服务器物理隔离原则

① 内外有别：内部系统与对外开放平台应有所区别对待。
② 内部隔离：从上游到下游按通道从物理服务器上进行隔离，并将低流量服务合并。
③ 外部隔离：按渠道隔离，渠道之间互不影响。

线程池资源隔离

Hystrix通过命令模式，将每个类型的业务请求封装成对应的命令请求。每个命令请求对应一个线程池，创建好的线程池是被放入到ConcurrentHashMap中。

注意：尽管线程池提供了线程隔离，客户端底层代码也必须要有超时设置，不能无限制地阻塞导致线程池一直饱和。

信号量资源隔离

开发者可以使用Hystrix限制系统对某一个依赖的最高并发数，这基本上就是一个限流策略。每次调用依赖时都会检查是否达到了信号量的限制值，如果达到限制值，则拒绝请求。

总的来说，隔离技术是一种非常重要的技术，它可以帮助我们设计出更稳定、更健壮的系统。无论是在服务器的设计，还是在线程池和信号量的管理中，都需要运用到隔离技术。通过合理的隔离，我们可以有效地防止故障的扩散，提高系统的稳定性和可靠性。

5. 故障恢复要快之快速发现

发现分为事前发现、事中发现和事后发现。事前发现的主要手段是压测和故障演练；事中发现的主要手段是监控报警；事后发现的主要手段是数据分析。

5.1 全链路线上压测

你的系统是否适合全链路线上压测呢?一般来说，全链路压测适用于以下场景：

① 针对链路长、环节多、服务依赖错综复杂的系统，全链路线上压测可以更快更准确的定位问题。
② 有完备的监控报警，出现问题可以随时终止操作。
③ 有明显的业务峰值和低谷。低谷期就算出现问题对用户影响也比较小。

全链路线上压测的目的主要有：

① 了解整个系统的处理能力
② 排查性能瓶颈
③ 验证限流、降级、熔断、报警等机制是否符合预期并分析数据反过来调整这些阈值等信息
④ 发布的版本在业务高峰的时候是否符合预期
⑤ 验证系统的依赖是否符合预期

全链路压测的简单实现：

① 采集线上日志数据来做流量回放，为了和实际数据进行流量隔离，需要对部分字段进行偏移处理。
② 数据着色处理。可以用中间件来获取和传递流量标签。
③ 可以使用影子数据表来隔离流量，但需要注意磁盘空间，建议如果磁盘剩余空间不足70%时采用其他方式隔离流量。
④ 外部调用可能需要Mock。实现上可以采用一个Mock服务随机产生和线上外部调用返回时间分布的时延。

压测工具上，核心交易这边使用美团点评开发的pTest。

压测工具对比

故障的快速发现是保证系统稳定运行的重要环节。只有快速发现故障，才能快速定位问题，从而快速解决问题，减少故障对系统的影响。全链路线上压力测试是故障快速发现的重要手段之一。它通过模拟用户的操作行为，对系统进行压力测试，从而发现系统可能存在的问题。全链路线上压力测试不仅可以发现系统的问题，还可以帮助我们了解系统的性能，排查性能瓶颈，验证系统的各种机制是否正常工作。因此，全链路线上压力测试是系统维护的重要工具，对于保证系统的稳定运行起着至关重要的作用。

6. 故障恢复要快之快速定位

定位需要靠谱的数据。所谓靠谱就是和要发现的问题紧密相关的，无关的数据会造成视觉盲点，影响定位。所以对于日志，要制定一个简明日志规范。另外系统监控、业务监控、组件监控、实时分析诊断工具也是定位的有效抓手。

简明日志规范

7. 故障恢复要快之快速解决

要解决，提前是发现和定位。解决的速度取决于我们所采用的自动化程度，是完全自动化、半自动化还是手工操作。核心交易的目标是构建一个高可用的系统。我们的宗旨是：“避免重复造轮子，充分利用现有资源。”为此，我们打造了一个集成平台，其主要任务是：“专注于核心交易的高可用性，实现更好、更快、更高效的解决方案。”

在美团点评内部，有许多用于发现、定位和处理问题的系统和平台。然而，如果每次都需要打开不同的链接或登录不同的系统，势必会影响到解决问题的速度。因此，我们需要将这些系统和平台集成起来，实现问题的一站式解决。希望达到的效果举例如下：

解决问题

工具介绍

Hystrix

Hystrix通过实现断路器模式来监控故障。当断路器检测到调用接口出现长时间等待时，它会采用快速失败策略，向上返回一个错误响应，从而达到防止阻塞的目的。在这里，我们将重点介绍Hystrix的线程池资源隔离和信号量资源隔离。

线程池资源隔离

线程池资源隔离

优点

使用线程可以完全隔离第三方代码，请求线程可以快速放回。
当一个失败的依赖再次变成可用时，线程池将清理，并立即恢复可用，而不是一个长时间的恢复。
可以完全模拟异步调用，方便异步编程。

缺点

线程池的主要缺点是它增加了CPU，因为每个命令的执行涉及到排队（默认使用SynchronousQueue避免排队），调度和上下文切换。
对使用ThreadLocal等依赖线程状态的代码增加复杂性，需要手动传递和清理线程状态（Netflix公司内部认为线程隔离开销足够小，不会造成重大的成本或性能的影响）。

信号量资源隔离

开发者可以使用Hystrix限制系统对某一个依赖的最高并发数。这个基本上就是一个限流策略，每次调用依赖时都会检查一下是否到达信号量的限制值，如达到，则拒绝。

信号量资源隔离

优点

不新起线程执行命令，减少上下文切换。

缺点

无法配置断路，每次都一定会去尝试获取信号量。

比较一下线程池资源隔离和信号量资源隔离

线程隔离是和主线程无关的其他线程来运行的；而信号量隔离是和主线程在同一个线程上做的操作。
信号量隔离也可以用于限制并发访问，防止阻塞扩散，与线程隔离的最大不同在于执行依赖代码的线程依然是请求线程。
线程池隔离适用于第三方应用或者接口、并发量大的隔离；信号量隔离适用于内部应用或者中间件；并发需求不是很大的场景。

隔离对比

Hystrix的线程池资源隔离和信号量资源隔离都是用于限制对共享资源的并发访问，防止故障扩散。线程池资源隔离适用于外部应用或接口、并发量大的场景，而信号量资源隔离适用于内部应用或中间件，并发需求不是很大的场景。在实际应用中，我们可以根据具体需求选择合适的资源隔离策略。

Rhino

Rhino是美团点评基础架构团队研发并维护的一个稳定性保障组件，提供故障模拟、降级演练、服务熔断、服务限流等功能。和Hystrix对比：

内部通过CAT（美团点评开源的监控系统，参见之前的博客“深度剖析开源分布式监控CAT”）进行了一系列埋点，方便进行服务异常报警。
接入配置中心，能提供动态参数修改，比如强制熔断、修改失败率等。

说在最后

架构和高级开发不一样：架构的问题是open的、开发式的、没有标准答案的。

架构之路，注定是充满了坎坷。

在做架构过程中，或者在转型过程中，如果遇到复杂的场景，确实不知道怎么做架构方案，确实找不到有底的方案，怎么办？可以以来找40岁老架构尼恩求助.

就在前几天，一个小伙伴遇到了一个 电商网站的黄金链路架构，开始找不到思路，但是经过尼恩 10分钟语音指导，一下就豁然开朗。

so，大家如果遇到架构问题，甚至架构难题，可以找尼恩来交流，来求助。

技术自由的实现路径 PDF：

实现你的架构自由：

《吃透8图1模板，人人可以做架构》

《10Wqps评论中台，如何架构？B站是这么做的！！！》

《阿里二面：千万级、亿级数据，如何性能优化？教科书级答案来了》

《峰值21WQps、亿级DAU，小游戏《羊了个羊》是怎么架构的？》

《100亿级订单怎么调度，来一个大厂的极品方案》

《2个大厂 100亿级超大流量红包架构方案》

… 更多架构文章，正在添加中

实现你的响应式自由：

《响应式圣经：10W字，实现Spring响应式编程自由》

这是老版本《Flux、Mono、Reactor 实战（史上最全）》

实现你的 spring cloud 自由：

《Spring cloud Alibaba 学习圣经》

《分库分表 Sharding-JDBC 底层原理、核心实战（史上最全）》

《一文搞定：SpringBoot、SLF4j、Log4j、Logback、Netty之间混乱关系（史上最全）》

实现你的 linux 自由：

《Linux命令大全：2W多字，一次实现Linux自由》

实现你的网络自由：

《TCP协议详解 (史上最全)》

《网络三张表：ARP表, MAC表, 路由表，实现你的网络自由！！》

实现你的分布式锁自由：

《Redis分布式锁（图解 - 秒懂 - 史上最全）》

《Zookeeper 分布式锁 - 图解 - 秒懂》

实现你的王者组件自由：

《队列之王： Disruptor 原理、架构、源码一文穿透》

《缓存之王：Caffeine 源码、架构、原理（史上最全，10W字超级长文）》

《缓存之王：Caffeine 的使用（史上最全）》

《Java Agent 探针、字节码增强 ByteBuddy（史上最全）》

实现你的面试题自由：

4000页《尼恩Java面试宝典》 40个专题

以上尼恩架构笔记、面试题的PDF文件更新，▼请到下面【技术自由圈】公号取 ▼

你可能感兴趣的:(面试,架构,面试,java,后端,系统架构,可用性测试)

pipost 如何提升团队协作效率 [特殊字符] Kairo_01 postman
开发团队中的沟通障碍在许多开发团队中，前端工程师、后端工程师和QA测试人员之间的同步往往会浪费大量时间。不断的会议和对齐会话减慢了整个过程，严重影响了生产力。以下是一些常见的痛点：前端和后端团队需要不断对API接口进行同步。测试人员必须反复确认API行为。产品经理必须确保每个人都对项目需求达成一致。这些沟通障碍导致开发周期延长、团队士气下降和项目发布推迟。通过Apipost提高协作效率1.精简的A
现代前端开发框架对比：React、Vue 和 Svelte 的选择指南 zhyoobo vue.js react.js 前端
引言在当今快速发展的Web开发领域，前端框架的选择往往直接影响项目的开发效率、维护成本和用户体验。React、Vue和Svelte作为当前最受关注的三大框架，各自拥有独特的设计哲学与技术实现。本文将通过5000字的深度解析，从架构设计、开发体验、性能特征到生态系统四个维度进行全方位对比，并针对不同场景提供选型决策框架。无论您是初创团队的技术负责人，还是正在构建企业级应用的架构师，都能在此找到面向2
DeepSeek智能政务大脑：城市服务知识库构建全指南——从RAG架构到民生场景落地实践 Coderabo DeepSeek R1模型企业级应用政务架构
DeepSeek赋能城市智慧升级：基于RAG架构的市民服务智能知识库构建全解一、需求分析与技术选型1.1市民服务场景需求市民服务智能知识库需要解决政务咨询效率低下、专业术语难理解、多轮对话能力弱等核心问题。系统需具备：自然语言理解能力（NLU）异构知识整合能力政策法规精准解读能力多轮对话上下文管理应急服务联动机制1.2DeepSeek技术栈选择基于DeepSeek-Large语言模型构建核心系统，
JVM八股文系列一:JVM基础知识 suikasa JVM八股文 java jvm
一.JVM基础知识1.JVM从编译到执行1.1Java程序的执行过程一个Java程序，首先经过javac编译成.class文件，然后JVM将其加载到方法区，执行引擎将会执行这些字节码。执行时，会翻译成操作系统相关的函数。JVM作为.class文件的翻译存在，输入字节码，调用操作系统函数。过程如下：Java文件->编译器>字节码->JVM->机器码。JVM也就是Java虚拟机。它能识别.class后
高级java每日一道面试题-2025年3月03日-微服务篇[Eureka篇]-Eureka自我保护机制是什么? java我跟你拼了 java每日一道面试题 java 微服务 eureka SpringCloud SpringBoot 自我保护机制出发条件
如果有遗漏,评论区告诉我进行补充面试官:Eureka自我保护机制是什么?我回答:在Java高级面试中，Eureka的自我保护机制（Self-PreservationMode）是一个非常重要且常被提及的话题。理解这一机制的工作原理及其应用场景对于构建高可用性的微服务架构至关重要。以下是结合提供的内容对Eureka自我保护机制的详细解析和综合概述：自我保护机制的概念Eureka的自我保护机制是一种容错
JVM技术八股文小麟School JVM jvm java 开发语言
JVM面试八股文，整理了出来。排版不太好！目录JVM入门部分为什么要学习JVM？你了解哪些JVM产品？JVM的构成有哪几部分？JVM类加载部分你知道哪些类加载器？为什么需要多个类加载器？什么是双亲委派类加载模型？双亲委派方式加载类有什么优势、劣势？描述一下类加载时候的基本步骤是怎样的？什么情况下会触发类的加载？类加载时静态代码块一定会执行吗？如何理解类的主动加载和被动加载？为什么要自己定义类加载器
史上最全JVM面试八股文合集 Java小海. 面试 java 职场和发展程序人生后端
简述JVM内存模型线程私有的运行时数据区:程序计数器、Java虚拟机栈、本地方法栈。线程共享的运行时数据区:Java堆、方法区。简述程序计数器程序计数器表示当前线程所执行的字节码的行号指示器。程序计数器不会产生StackOverflowError和OutOfMemoryError。简述虚拟机栈Java虚拟机栈用来描述Java方法执行的内存模型。线程创建时就会分配一个栈空间，线程结束后栈空间被回收。
[0482]基于JAVA的养老服务监控智慧管理系统的设计与实现阿鑫学长【毕设工场】 java 人工智能大数据毕业设计课程设计
毕业设计（论文）开题报告表姓名学院专业班级题目基于JAVA的养老服务监控智慧管理系统的设计与实现指导老师（一）选题的背景和意义选题背景与意义：随着全球社会老龄化的不断加剧，养老服务的信息化、智能化转型已成为必然趋势。我国作为世界上老年人口最多的国家，面临着巨大的养老压力和挑战，如何高效、科学地管理和优化养老服务资源，保障老年群体的生活质量及健康安全，是当前社会亟待解决的重要课题。基于此现实背景，设
使用 request 的 axios 状态码分析 fridayCodeFly 前端 servlet
request.interceptors.response.use(function(response){},function(error){})后端返回结果code===400不经过response,直接跳到error。当后端返回状态码为400时直接进入error回调而不经过response回调，这是因为axios默认会将状态码不在200-299范围内的响应视为错误。解决1.修改validate
计算机专业开题报告案例19：基于spring boot的养老院信息管理系统的设计与实现平姐设计计算机毕业设计100套 java项目实战网站开发与搭建实战项目 spring boot 后端 java 计算机毕业设计养老院信息管理系统开题报告老人信息
计算机毕业设计100套微信小程序项目实战java项目实战需要源码可以滴滴我一、课题论证1.1国内外研究动态目前，基于springboot的养老院信息管理系统的研究和开发已经在国内外得到了较多关注和实践。北京大学医学部的研究人员开发了一套养老院信息管理系统，该系统可以实现对老人的生活、医疗、营养等方面的全面管理和监测。此外，南开大学、清华大学等高校也都开展了相关研究。其中就有采取建立于微信小程序平台
【C++】仿函数的概念无水先生 BOOST C++c++
目录一、仿函数说明二、仿函数的定义三、更直观的例子四、仿函数实例五、仿函数仿函数(functor)在各编程语言中的应用5.1仿函数C5.2仿函数C++5.3仿函数C#5.4仿函数Java一、仿函数说明在我们写代码时有时会发现有些功能实现的代码，会不断的在不同的成员函数中用到，但是又不好将这些代码独立出来成为一个类的一个成员函数。但是又很想复用这些代码。写一个公共的函数，就要单立出一个函数，也不是很
JVM部分八股努力向前ing JVM八股详究 java jvm 八股
什么是JVM？有哪些好处？索引越界可能导致程序覆盖其他程序内存中的代码JVM是一套规范，有多种实现JVM运行流程？1.类加载器将java程序翻译为java字节码文件2.运行数据区将字节码文件加载到内存，字节码文件是JVM规范的文件，不能直接运行，而是交给执行引擎运行3.执行引擎中的解释器将字节码文件翻译为机器指令，交给CPU执行，执行过程中可能通过本地方法调用接口调用本地方法类的生命周期？加载：将
高级java每日一道面试题-2025年3月06日-微服务篇[Eureka篇]-Eureka Server和Eureka Client关系? java我跟你拼了 java每日一道面试题 java 微服务 eureka
如果有遗漏,评论区告诉我进行补充面试官:EurekaServer和EurekaClient关系?我回答:在微服务架构中，Eureka作为Netflix开源的服务发现组件，由EurekaServer（服务端）和EurekaClient（客户端）两大部分组成。这两者通过紧密协作实现服务的注册、发现与健康管理，是确保微服务间通信顺畅的关键。以下是对EurekaServer和EurekaClient关系的
JavaScript typeof 运算符详解 wjs2024 开发语言
JavaScripttypeof运算符详解概述在JavaScript中，typeof是一个一元运算符，用于检测给定变量的数据类型。它是JavaScript中最常用的类型检查方法之一。本文将详细解释typeof运算符的用法、返回值以及其局限性。typeof运算符的用法typeof运算符后面跟一个要检查类型的变量或表达式。它不区分大小写，以下是其基本用法：leta=10;console.log(typ
如何实现一个apply函数？风茫 Javascript javascript apply
在JavaScript中，apply是一个非常有用的方法，它允许你调用一个函数，并显式地指定该函数内部的this值。与call方法不同，apply方法接受参数的方式是一个数组或类数组对象。我们将手动实现一个类似apply的函数，以深入理解其工作原理。实现步骤1.定义myApply方法首先，我们需要在Function.prototype上定义一个新的方法myApply，这样所有的函数都可以调用它。F
Java调本地接口重定向唯他命 java json 开发语言
/***通用接口*/@PostMapping("/deviceToService/up")@ApiOperationSupport(order=1)@ApiOperation(value="通用接口",notes="传入requestDTO")publicObjectdetail(@RequestBodyRequestDTOrequestDTO){Instructionsdetail=instru
JVM 深入浅出：一文看懂 JVM 内存结构 kkkllllss spring Java Java架构 spring boot spring redis java 架构
文章目录1.概述2.程序计数器3.Java虚拟机栈3.1.栈深度3.2.栈帧3.2.1.局部变量表3.2.2.操作数栈3.2.3.动态链接3.2.4.方法正常结束3.2.5.方法异常结束4.堆5.方法区5.1.去永久代过程6.运行时常量池7.本地方法栈8.参考资料1.概述JVM把内存进行了划分，不同的内存区域有不同的功能。有的内存区域是线程私有的，比如Java虚拟机栈、本地方法栈和程序计数器，每一
深入浅出JVM(一)---两种环境杨洪波 Java jvm java class api 语言引擎
如果你想真正掌握JAVA技术,请首先记住它的四个组成部分:JAVA语言,class文件格式,JVM和JAVAAPI.如果你说你学过JAVA,那么,你已经知道了,JAVA有两个环境:编译环境和运行环境.好,我们分别讨论.1)编译环境编译环境是什么?如果你装了JDK,那么,你的D:/j2sdk1.4.2目录下的所有东西,就是你的JAVA编译环境.编译环境的工作流程如下:你利用JAVA语言规范,或利用J
FerretDB 2.0：开源 MongoDB 替代品的安装与使用指南田猿笔记 MongoDB 开源数据库 FerretDB
介绍FerretDB2.0是一个开源数据库，旨在作为MongoDB的替代品。它与MongoDB5.0+的驱动程序和工具兼容，适合需要避免MongoDB许可复杂性的开发者。它的核心特点是使用PostgreSQL作为后端，并通过DocumentDB扩展提升性能，研究表明某些工作负载可快20倍。安装与使用安装FerretDB2.0使用dockercompose需要以下步骤：创建docker-compos
Stream流与Guava工具类使用小薛博客 guava 数据库 java
Stream流与Guava工具类使用小薛博客官方地址Stream流与Guava工具类使用1、StreamAPI1、了解StreamJava8中有两大最为重要的改变。第一个是Lambda表达式；另外一个则是StreamAPI(java.util.stream.*)。Stream是Java8中处理集合的关键抽象概念，它可以指定你希望对集合进行的操作，可以执行非常复杂的查找、过滤和映射数据等操作。使用S
policy_does_not_allow_file_overwrite 前端uniapp云存储
uniapp云开发阿里云上传文件uniapp的出现，让前端人员和后端人员实现了“全栈”的小梦想，当然，真正跨端开发的时候，还是会遇到不少的问题，比如今天我们的主角，uniCloud.uploadFile,一般来说，这个api文件名动态生成，云端返回文件存储的链接即可，但是，假如我们的产品是针对用户存储的，即用户的头像、私有文件、图片等具有唯一性，要单独开个目录存放的时候，同样的文件名上传会存在无法
Java之ArrayList M(菜鸡) java list
ArrayList1.1ArrayList简介ArrayList的底层是数组队列，相当于动态数组。与Java中的数组相比，它的容量能动态增长。在添加大量元素前，应用程序可以使用ensureCapacity操作来增加ArrayList实例的容量。这可以减少递增式再分配的数量。ArrayList继承了AbstractList，实现了List,RandomAccess,Cloneable,java.io
docker-compose 部署nginx和jdk步骤方大拿拿 docker nginx java
**yum安装jdk**1、yum-ylistjava*查看可安装java版本选择安装java-1.8.0-openjdk-accessibility.x86_642、yuminstall-yjava-1.8.0-openjdk-devel.x86_64耐心等待安装完成即可3、java-version即可查看当前安装的java版本4、yum安装的jdk，被安装到哪里去了？你可以在**/usr/li
参加AIGC四级考试的，建议先看下我的备考经验 Tester_孙大壮 AI培训师 AIGC
写在前面这是我2024年末看到AI快速发展，自己也想入局AI而准备的一个考试，但是真正考试下来发现这个考试真的特别简单，除了政府补贴，其他可能对自己没有任何的用处，我觉得这个在面试的时候也很难成为一个加分项，但是备考过程中可能会对一些AI的知识有框架式的了解，以下是我的备考经验，希望对你有帮助。我参加的是广州本地宝推荐的人社部AIGC考试。整体而言，考试难度不算特别大。以我的工作年限，符合报考四级
Springboot启动失败：解决「org.yaml.snakeyaml.error.YAMLException」报错全记录 -天凉好秋- spring boot java idea visual studio code
##关键字Java、Springboot、vscode、idea、nacos启动失败、YAMLException、字符集配置---##背景环境###项目架构-**框架**：SSM（Spring+SpringMVC+MyBatis）-**中间件**：Nacos（配置管理+服务发现）-**配置存储**：Nacos中存储了Springboot的配置，包括：数据库连接信息、Redis连接信息、服务配置等。
PDF转图片 JAVA JAVA派派 java PDF
前言以下是一个使用ApachePDFBox将PDF文件转换为图片的封装方法。这个方法将会把PDF的每一页转换为一张图片，并保存到指定的目录中。1.添加依赖首先，你需要在项目中添加PDFBox的依赖。如果你使用的是Maven，可以在pom.xml中添加以下依赖：org.apache.pdfboxpdfbox2.0.292.转换方法importorg.apache.pdfbox.pdmodel.PDD
每日OJ_牛客_MT1最大差值_模拟+贪心_C++_Java GR鲸鱼 c++java 数据结构算法 leetcode
目录牛客_MT1最大差值_模拟+贪心题目解析C++代码Java代码牛客_MT1最大差值_模拟+贪心最大差值_牛客题霸_牛客网描述：有一个长为n的数组A，求满足0≤a≤b&A,intn){//vectorarr(n,0x3f3f3f3f);//维护一个0到i的最小值//arr[0]=A[0];//intres=0;//for(inti=1;i
Java课程设计“单项选择题标准化考试系统设计” GG爆不会写代码 java sql mysql intellij-idea
大二时做的java课设，代码能力不是很行，给需要做课设的同学一个参考题目如下“单项选择题标准化考试系统设计”1、问题描述设计一个单项选择题标准化考试系统，该系统要求能自动组卷和评分。2、功能要求（1）用数据库保存试题。（每个试题包括题干、4个备选答案、标准答案）。（2）试题录入：可随时增加试题到试题库中。（3）试题抽取：每次从试题库中可以随机抽出N道题（N由键盘输入）。（4）答题：用户可实现输入自
【后端】【django】Django 自带的用户系统与 RBAC 机制患得患失949 django知识数据库 sqlite django
Django自带的用户系统与RBAC机制Django自带的用户系统（django.contrib.auth）提供了身份验证（Authentication）和权限管理（Authorization），能够快速实现用户管理、权限控制、管理员后台等功能，同时具备RBAC（基于角色的访问控制，Role-BasedAccessControl）的基本实现。本文将详细介绍Django用户系统的功能、管理员账号创建
从0到1，带你快速上手Scala语言 qq_23519469 scala 开发语言后端
什么是ScalaScala，读作“skah-lah”，是“ScalableLanguage”的缩写，是一门多范式编程语言。它就像是编程世界里的“变形金刚”，融合了面向对象编程（OOP）和函数式编程（FP）的特性，这意味着开发者能在同一语言中，把面向对象的设计和函数式编程的抽象结合起来使用，超级灵活！它运行在Java虚拟机（JVM）上，能与现有的Java代码无缝集成。这就好比Scala是Java的“
关于旗正规则引擎下载页面需要弹窗保存到本地目录的问题何必如此 jsp 超链接文件下载窗口
生成下载页面是需要选择“录入提交页面”，生成之后默认的下载页面<a>标签超链接为：<a href="<%=root_stimage%>stimage/image.jsp?filename=<%=strfile234%>&attachname=<%=java.net.URLEncoder.encode(file234filesourc
【Spark九十八】Standalone Cluster Mode下的资源调度源代码分析 bit1129 cluster
在分析源代码之前，首先对Standalone Cluster Mode的资源调度有一个基本的认识：首先，运行一个Application需要Driver进程和一组Executor进程。在Standalone Cluster Mode下，Driver和Executor都是在Master的监护下给Worker发消息创建(Driver进程和Executor进程都需要分配内存和CPU，这就需要Maste
linux上独立安装部署spark daizj linux 安装 spark 1.4 部署
下面讲一下linux上安装spark，以 Standalone Mode 安装 1）首先安装JDK 下载JDK：jdk-7u79-linux-x64.tar.gz ，版本是1.7以上都行，解压 tar -zxvf jdk-7u79-linux-x64.tar.gz 然后配置 ~/.bashrc&nb
Java 字节码之解析一周凡杨 java 字节码 javap
一： Java 字节代码的组织形式类文件 { OxCAFEBABE ，小版本号，大版本号，常量池大小，常量池数组，访问控制标记，当前类信息，父类信息，实现的接口个数，实现的接口信息数组，域个数，域信息数组，方法个数，方法信息数组，属性个数，属性信息数组 } &nbs
java各种小工具代码 g21121 java
1.数组转换成List import java.util.Arrays; Arrays.asList(Object[] obj); 2.判断一个String型是否有值 import org.springframework.util.StringUtils; if (StringUtils.hasText(str)) 3.判断一个List是否有值 import org.spring
加快FineReport报表设计的几个心得体会老A不折腾 finereport
一、从远程服务器大批量取数进行表样设计时，最好按“列顺序”取一个“空的SQL语句”，这样可提高设计速度。否则每次设计时模板均要从远程读取数据，速度相当慢！！二、找一个富文本编辑软件（如NOTEPAD+）编辑SQL语句，这样会很好地检查语法。有时候带参数较多检查语法复杂时，结合FineReport中生成的日志，再找一个第三方数据库访问软件（如PL/SQL）进行数据检索，可以很快定位语法错误。
mysql linux启动与停止墙头上一根草
如何启动/停止/重启MySQL一、启动方式1、使用 service 启动：service mysqld start2、使用 mysqld 脚本启动：/etc/inint.d/mysqld start3、使用 safe_mysqld 启动：safe_mysqld&二、停止1、使用 service 启动：service mysqld stop2、使用 mysqld 脚本启动：/etc/inin
Spring中事务管理浅谈 aijuans spring 事务管理
Spring中事务管理浅谈 By Tony Jiang@2012-1-20 Spring中对事务的声明式管理拿一个XML举例 [html] view plain copy print ? <?xml version="1.0" encoding="UTF-8"?>&nb
php中隐形字符65279（utf-8的BOM头）问题 alxw4616
php中隐形字符65279（utf-8的BOM头）问题今天遇到一个问题. php输出JSON 前端在解析时发生问题:parsererror. 调试: 1.仔细对比字符串发现字符串拼写正确.怀疑是非打印字符的问题. 2.逐一将字符串还原为unicode编码. 发现在字符串头的位置出现了一个 65279的非打印字符.
调用对象是否需要传递对象(初学者一定要注意这个问题) 百合不是茶对象的传递与调用技巧
类和对象的简单的复习,在做项目的过程中有时候不知道怎样来调用类创建的对象,简单的几个类可以看清楚,一般在项目中创建十几个类往往就不知道怎么来看为了以后能够看清楚,现在来回顾一下类和对象的创建,对象的调用和传递(前面写过一篇) 类和对象的基础概念: JAVA中万事万物都是类类有字段(属性),方法,嵌套类和嵌套接
JDK1.5 AtomicLong实例 bijian1013 java thread java多线程 AtomicLong
JDK1.5 AtomicLong实例类 AtomicLong 可以用原子方式更新的 long 值。有关原子变量属性的描述，请参阅 java.util.concurrent.atomic 包规范。AtomicLong 可用在应用程序中（如以原子方式增加的序列号），并且不能用于替换 Long。但是，此类确实扩展了 Number，允许那些处理基于数字类的工具和实用工具进行统一访问。
自定义的RPC的Java实现 bijian1013 java rpc
网上看到纯java实现的RPC，很不错。 RPC的全名Remote Process Call，即远程过程调用。使用RPC，可以像使用本地的程序一样使用远程服务器上的程序。下面是一个简单的RPC 调用实例，从中可以看到RPC如何
【RPC框架Hessian一】Hessian RPC Hello World bit1129 Hello world
什么是Hessian The Hessian binary web service protocol makes web services usable without requiring a large framework, and without learning yet another alphabet soup of protocols. Because it is a binary p
【Spark九十五】Spark Shell操作Spark SQL bit1129 shell
在Spark Shell上，通过创建HiveContext可以直接进行Hive操作 1. 操作Hive中已存在的表 [hadoop@hadoop bin]$ ./spark-shell Spark assembly has been built with Hive, including Datanucleus jars on classpath Welcom
F5　往header加入客户端的ip ronin47
when HTTP_RESPONSE {if {[HTTP::is_redirect]}{ HTTP::header replace Location [string map {:port/ /} [HTTP::header value Location]]HTTP::header replace Lo
java-61-在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差. 求所有数对之差的最大值。例如在数组{2, 4, 1, 16, 7, 5, bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/2541117420116135376632/ 写了个java版的 public class GreatestLeftRightDiff { /** * Q61.在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差。 * 求所有数对之差的最大值。例如在数组
mongoDB 索引开窍的石头 mongoDB索引
在这一节中我们讲讲在mongo中如何创建索引得到当前查询的索引信息 db.user.find(_id:12).explain(); cursor: basicCoursor 指的是没有索引 &
[硬件和系统]迎峰度夏 comsci 系统
从这几天的气温来看，今年夏天的高温天气可能会维持在一个比较长的时间内所以，从现在开始准备渡过炎热的夏天。。。。每间房屋要有一个落地电风扇，一个空调(空调的功率和房间的面积有密切的关系) 坐的，躺的地方要有凉垫，床上要有凉席电脑的机箱
基于ThinkPHP开发的公司官网 cuiyadll 行业系统
后端基于ThinkPHP，前端基于jQuery和BootstrapCo.MZ 企业系统轻量级企业网站管理系统运行环境:PHP5.3+, MySQL5.0 系统预览系统下载：http://www.tecmz.com 预览地址：http://co.tecmz.com 各种设备自适应响应式的网站设计能够对用户产生友好度，并且对于
Transaction and redelivery in JMS (JMS的事务和失败消息重发机制) darrenzhu jms 事务承认 MQ acknowledge
JMS Message Delivery Reliability and Acknowledgement Patterns http://wso2.com/library/articles/2013/01/jms-message-delivery-reliability-acknowledgement-patterns/ Transaction and redelivery in
Centos添加硬盘完全教程 dcj3sjt126com linux centos hardware
Linux的硬盘识别: sda 表示第1块SCSI硬盘 hda 表示第1块IDE硬盘 scd0 表示第1个USB光驱一般使用“fdisk -l”命
yii2 restful web服务路由 dcj3sjt126com PHP yii2
路由随着资源和控制器类准备，您可以使用URL如 http://localhost/index.php?r=user/create访问资源，类似于你可以用正常的Web应用程序做法。在实践中，你通常要用美观的URL并采取有优势的HTTP动词。例如，请求POST /users意味着访问user/create动作。这可以很容易地通过配置urlManager应用程序组件来完成如下所示
MongoDB查询(4)——游标和分页[八] eksliang mongodb MongoDB游标 MongoDB深分页
转载请出自出处：http://eksliang.iteye.com/blog/2177567 一、游标数据库使用游标返回find的执行结果。客户端对游标的实现通常能够对最终结果进行有效控制，从shell中定义一个游标非常简单，就是将查询结果分配给一个变量（用var声明的变量就是局部变量），便创建了一个游标，如下所示： > var
Activity的四种启动模式和onNewIntent() gundumw100 android
Android中Activity启动模式详解　　在Android中每个界面都是一个Activity，切换界面操作其实是多个不同Activity之间的实例化操作。在Android中Activity的启动模式决定了Activity的启动运行方式。　　Android总Activity的启动模式分为四种： Activity启动模式设置： <acti
攻城狮送女友的CSS3生日蛋糕 ini html Web html5 css css3
在线预览：http://keleyi.com/keleyi/phtml/html5/29.htm 代码如下： <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>攻城狮送女友的CSS3生日蛋糕-柯乐义<
读源码学Servlet（1）GenericServlet 源码分析 jzinfo tomcat Web servlet 网络应用网络协议
Servlet API的核心就是javax.servlet.Servlet接口，所有的Servlet 类（抽象的或者自己写的）都必须实现这个接口。在Servlet接口中定义了5个方法，其中有3个方法是由Servlet 容器在Servlet的生命周期的不同阶段来调用的特定方法。先看javax.servlet.servlet接口源码： package
JAVA进阶：VO(DTO)与PO(DAO)之间的转换 snoopy7713 java VO Hibernate po
PO即 Persistence Object　　VO即 Value Object 　VO和PO的主要区别在于：　　VO是独立的Java Object。　　PO是由Hibernate纳入其实体容器（Entity Map）的对象，它代表了与数据库中某条记录对应的Hibernate实体，PO的变化在事务提交时将反应到实际数据库中。　实际上，这个VO被用作Data Transfer
mongodb group by date 聚合查询日期统计每天数据（信息量） qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 1 */ { "_id" : ObjectId("557ac1e2153c43c320393d9d"), "msgType" : "text", "sendTime" : ISODate("2015-06-12T11:26:26.000Z")
java之18天常用的类(一) Luob. Math Date System Runtime Rundom
System类 import java.util.Properties; /** * System: * out:标准输出,默认是控制台 * in:标准输入,默认是键盘 * * 描述系统的一些信息 * 获取系统的属性信息:Properties getProperties(); * * * */ public class Sy
maven wuai maven
1、安装maven：解压缩、添加M2_HOME、添加环境变量path 2、创建maven_home文件夹，创建项目mvn_ch01,在其下面建立src、pom.xml，在src下面简历main、test、main下面建立java文件夹 3、编写类，在java文件夹下面依照类的包逐层创建文件夹，将此类放入最后一级文件夹 4、进入mvn_ch01 4.1、mvn compile ,执行后会在

大家都崩，美团不崩：其高可用架构，巧夺天工！

说在前面

文章目录

接二连三的P0级事故（高可用事故）

语雀崩了、阿里云崩，阿里崩完、滴滴崩…

美团点评智能支付核心交易系统的可用性实践

背景

问题引发

问题分析

问题解决

1. 发生频率要低之别人死我们不死

1.1 消除依赖、弱化依赖和控制依赖

1.2 事务中不包含外部调用

1.3 设置合理的超时和重试

1.4 解决慢查询

1.5 熔断

2. 发生频率要低之自己不作死

2.1 不作

2.2 不死

3. 发生频率要低之不被别人搞死

3.1 限流

4. 故障范围要小之隔离

5. 故障恢复要快之快速发现

5.1 全链路线上压测

6. 故障恢复要快之快速定位

7. 故障恢复要快之快速解决

工具介绍

Hystrix

Rhino

说在最后

技术自由的实现路径 PDF：

实现你的 架构自由：

实现你的 响应式 自由：

实现你的 spring cloud 自由：

实现你的 linux 自由：

实现你的 网络 自由：

实现你的 分布式锁 自由：

实现你的 王者组件 自由：

实现你的 面试题 自由：

你可能感兴趣的:(面试,架构,面试,java,后端,系统架构,可用性测试)

实现你的架构自由：

实现你的响应式自由：

实现你的网络自由：

实现你的分布式锁自由：

实现你的王者组件自由：

实现你的面试题自由：