阿里技术官方号

救火必备！问题排查与系统优化手册

简介：软件工程领域存在一个共识：维护代码所花费的时间要远多于写代码。而整个代码维护过程中，最惊心动魄与扣人心弦的部分，莫过于问题排查（Trouble-shooting）了。特别是那些需要 7x24 小时不间断维护在线业务的一线服务端程序员们，大大小小的问题排查线上救火早已成为家常便饭，一不小心可能就吃成了自助餐 —— 竖着进躺着出，吃不了也兜不住。本文分享作者在服务端问题排查方面的一些经验，包括常见问题、排查流程、排查工具，结合实际项目中发生过的惨痛案例进行现身说法。

一问题排查

1 常见问题

Know Your Enemy：知己知彼，百战不殆。

日常遇到的大部分问题，大致可以归到如下几类：

逻辑缺陷：e.g. NPE、死循环、边界情况未覆盖。
性能瓶颈：e.g. 接口 RT 陡增、吞吐率上不去。
内存异常：e.g. GC 卡顿、频繁 FGC、内存泄露、OOM
并发/分布式：e.g. 存在竞争条件、时钟不同步。
数据问题：e.g. 出现脏数据、序列化失败。
安全问题：e.g. DDoS 攻击、数据泄露。
环境故障：e.g. 宿主机宕机、网络不通、丢包。
操作失误：e.g. 配置推错、删库跑路（危险动作，请勿尝试..）。

上述分类可能不太完备和严谨，想传达的点是：你也可以积累一个这样的 checklist，当遇到问题百思不得其解时，耐心过一遍，也许很快就能对号入座。

2 排查流程

医生：小王你看，这个伤口的形状，像不像一朵漂浮的白云？

病人：...再不给我包扎止血，就要变成火烧云了。

快速止血

问题排查的第一步，一定是先把血止住，及时止损。如何快速止血？常见方式包括：

发布期间开始报错，且发布前一切正常？啥也别管，先回滚再说，恢复正常后再慢慢排查。
应用已经稳定运行很长一段时间，突然开始出现进程退出现象？很可能是内存泄露，默默上重启大法吧。
只有少数固定机器报错？试试隔离这部分机器（关闭流量入口）。
单用户流量突增导致服务不稳定？如果不是惹不起的金主爸爸，请勇敢推送限流规则。
下游依赖挂了导致服务雪崩？还想什么呢，降级预案走起。

保留现场

血止住了？那么恭喜你，至少故障影响不会再扩大了。卸下锅，先喘口气再说。下一步，就是要根据线索找出问题元凶了。作为一名排查老手，你需要有尽量保留现场的意识，例如：

隔离一两台机器：将这部分机器入口流量关闭，让它们静静等待你的检阅。
Dump 应用快照：常用的快照类型一般就是线程堆栈和堆内存映射。
所有机器都回滚了，咋办？别慌，如果你的应用监控运维体系足够健全，那么你还有多维度的历史数据可以回溯：应用日志、中间件日志、GC 日志、内核日志、Metrics 指标等。

定位原因

OK，排查线索也有了，接下来该怎么定位具体原因？这个环节会综合考验你的技术深度、业务熟悉度和实操经验，因为原因往往都千奇百怪，需要 case by case 的追踪与分析。这里给出几个排查方向上的建议：

关联近期变更：90% 以上的线上问题都是由变更引发，这也是为什么集团安全生产的重点一直是在管控“变更”。所以，先不要急着否认（“肯定不是我刚加的那行代码问题！”），相信统计学概率，好好 review 下近期的变更历史（从近至远）。
全链路追踪分析：微服务和中台化盛行的当下，一次业务请求不经过十个八个应用处理一遍，都不好意思说自己是写 Java 的。所以，不要只盯着自己的应用不放，你需要把排查 scope 放大到全链路。
还原事件时间线：请把自己想象成福尔摩斯（柯南也行），摆在你面前的就是一个案发现场，你需要做的是把不同时间点的所有事件线索都串起来，重建和还原整个案发过程。要相信，时间戳是不会骗人的。
找到 Root Cause：排查问题多了你会发现，很多疑似原因往往只是另一个更深层次原因的表象结果之一。作为福尔摩斯，你最需要找到的是幕后凶手，而不是雇佣的杀人犯 —— 否则 TA 还会雇人再来一次。
尝试复现问题：千辛万苦推导出了根因，也不要就急着开始修 bug 了。如果可以，最好能把问题稳定复现出来，这样才更有说服力。这里提醒一点：可千万别在生产环境干这事（除非你真的 know what you're doing），否则搞不好就是二次伤害（你：哈哈哈，你看，这把刀当时就是从这个角度捅进去的，轨迹完全一样。用户：...）。

解决问题

最后，问题根因已经找到，如何完美解决收尾？几个基本原则：

修复也是一种变更，需要经过完整的回归测试、灰度发布；切忌火急火燎上线了 bugfix，结果引发更多的 bugs to fix。
修复发布后，一定要做线上验证，并且保持观察一段时间，确保是真的真的修复了。
最后，如果问题已经上升到了故障这个程度，那就拉上大伙好好做个故障复盘吧。整个处理过程一定还有提升空间，你的经验教训对其他同学来说也是一次很好的输入和自查机会：幸福总是相似的，故障也是。

3 排查工具

手里只有锤子，那看什么都像钉子。作为工程师，你需要的是一整套工具箱。

问题排查其实就是一次持续观测应用行为的过程。为了确保不遗漏关键细节，你需要让自己的应用变得更“可观测（Observable）。

提升应用可观测性有三大利器：日志（Logging）、监控（Metrics）、追踪（Tracing）。在我之前所做的项目中，这三块能力分别是由 SLS、Alimonitor / AliMetrics / Tsar、EagleEye 提供的，这里就不再展开描述了。

另外也很推荐 Arthas 这个工具，非常实用和顺手，相信很多同学都已经用过。

二系统优化

只学会了问题排查还远远不够（当然技能必须点满，shit always happen），再熟练也只是治标不治本。如果想从根源上规避问题，必须从系统本身出发：按照性能、稳定性和可维护性三个方向，持续优化你的系统实现，扼杀问题于摇篮之中，让自己每天都能睡个安稳觉。

老板：既要快，又要稳，还要好。哦，工资的事你别担心，下个月一定能发出来。

系统优化的三个基本方向：性能（Performance）、稳定性（Stability）、可维护性（Maintainability）。三者之间并不是完全独立的，而是存在着复杂的相互作用关系，有时甚至会此消彼长。

最优秀的软件系统，并非要把这三个方向都做到极致，而是会根据自己实际的业务需求和场景合理取舍，在这三者之间达到一个综合最优的动态平衡状态，让各方面都能做到足够好即可。

所以，优化不只是一门科学，也是一门艺术。

1 性能优化

问：要跑出最快的圈速，是车手重要，还是赛车重要？

答：全都重要。

没有哪个男人会不喜欢高性能跑车，也没有哪个女人会希望在看李佳琦直播时突然卡顿。

性能，是各行各业工程师们共同追求的终极浪漫。

性能指标

指标（Indicators）是衡量一件事物好坏的科学量化手段。对于性能而言，一般会使用如下指标评估：

吞吐率（Throughput）：系统单位时间内能处理的工作负载，例如：在线 Web 系统 - QPS/TPS，离线数据分析系统 - 每秒处理的数据量。
响应时间（Response Time）：以 Web 请求处理为例，响应时间（RT）即请求从发出到收到的往返时间，一般会由网络传输延迟、排队延迟和实际处理耗时几个部分共同组成。
可伸缩性（Scalability）：系统通过增加机器资源（垂直/水平）来承载更多工作负载的能力；投入产出比越高（理想情况是线性伸缩），则说明系统的可伸缩性越好。

此外，同一个系统的吞吐率与响应时间，一般还会存在如下关联关系：吞吐率小于某个临界值时，响应时间几乎不变；一旦超出这个临界值，系统将进入超载状态（overloaded），响应时间开始线性增长。对于一个有稳定性要求的系统，需要在做性能压测和容量规划时充分考虑这个临界值的大小。

注：其实按更严谨的说法，性能就是单指一个系统有多“快”；上述部分指标并不纯粹只代表系统快慢，但也都与快慢息息相关。

性能分析

古人有句老话，If you can't measure it, you can't improve It.

要优化一个系统的性能（例如Web请求响应时间），你必须首先准确地测量和分析出，当前系统的性能究竟差在哪：是请求解析不够快，还是查询 DB 太慢？如果是后者，那又是扫描数据条目阶段太慢，还是返回结果集太慢？或者会不会只是应用与 DB 之间的网络延迟太大？

任何复杂请求的处理过程，最终都可以拆解出一系列并行/串行的原子操作。如果只是逮住哪个就去优化哪个，显然效率不会太高（除非你运气爆棚）。更合理的做法，应该是坚持 2/8 原则：优先分析和优化系统瓶颈，即当前对系统性能影响最大的原子操作；他们很可能就是 ROI 最高的优化点。

具体该如何去量化分析性能？这里列出了一些工具参考：

系统层面：tsar、top、iostat、vmstat
网络层面：iftop、tcpdump、wireshark
数据库层面：SQL explain、CloudDBA
应用代码层面：JProfiler、Arthas、jstack

其中很多工具也是问题排查时常用的诊断工具；毕竟，无论是性能分析还是诊断分析，目的都是去理解一个系统和他所处的环境，所需要做的事情都是相似的。

优化原则

你应该做的：上面已经提了很多，这里再补充一点：性能优化与做功能需求一样，都是为业务服务的，因此优化时千万不要忙着自嗨，一定要结合目标需求和应用场景 —— 也许这块你想做的优化，压根线上就碰不到；也许那块很难做的优化，可以根据流量特征做非通用的定制优化。

你不应该做的：即老生常谈的提前优化（Premature-optimization）与过度优化（Over-optimization） —— 通常而言（并不绝对），性能优化都不是免费的午餐，优化做的越多，往往可维护性也会越差。

优化手段

常用的性能优化手段有哪些？我这里总结了 8 个套路（最后 1 个是小霸王多合一汇总套路）。

1）简化

有些事，你可以选择不做。

业务层面：e.g. 流程精简、需求简化。
编码层面：e.g. 循环内减少高开销操作。
架构层面：e.g. 减少没必要的抽象/分层。
数据层面：e.g. 数据清洗、提取、聚合。

2）并行

有些事，你可以找人一起做。

方式：单机并行（多线程）、多机并行（分布式）。

优点：充分利用机器资源（多核、集群）。

缺点：同步开销、线程开销、数据倾斜。

同步优化：乐观锁、细粒度锁、无锁。
线程替代（如协程：Java WISP、Go routines、Kotlin coroutines）。
数据倾斜：负载均衡（Hash / RR / 动态）。

3）异步

有些事，你可以放手，不用死等。

方式：消息队列 + 任务线程 + 通知机制。

优点：提升吞吐率、组件解耦、削峰填谷。

缺点：排队延迟（队列积压）。

避免过度积压：Back-pressure（Reactive思想）。

4）批量

有些事，你可以合起来一起做。

方式：多次单一操作 → 合并为单次批量操作。

案例：TCP Nagel 算法；DB 的批量读写接口。

优点：避免单次操作的固有开销，均摊后总开销更低。

缺点：等待延迟 + 聚合延迟。

减少等待延迟：Timeout 触发提交，控制延迟上限。

5）时间空间互换

游戏的本质：要么有闲，要么有钱。

空间换时间：避免重复计算、拉近传输距离、分流减少压力。

案例：缓存、CDN、索引、只读副本（replication）。

时间换空间：有时候也能达到“更快”的效果（数据量减少 → 传输时间减少）。

案例：数据压缩（HTTP/2 头部压缩、Bitmap）。

6）数据结构与算法优化

程序 = 数据结构 + 算法

多了解一些“冷门”的数据结构：Skip list、Bloom filter、Time Wheel 等。
一些“简单”的算法思想：递归、分治、贪心、动态规划。

7）池化 & 局部化

共享经济 & 小区超市

池化（Pooling）：减少资源创建和销毁开销。

案例：线程池、内存池、DB 连接池、Socket 连接池。

局部化（Localization）：避免共享资源竞争开销。

案例：TLB（ThreadLocalBuffer）、多级缓存（本地局部缓存 -> 共享全局缓存）。

8）更多优化手段

升级红利：内核、JRE、依赖库、协议。
调参大师：配置、JVM、内核、网卡。
SQL 优化：索引、SELECT *、LIMIT 1。
业务特征定制优化：e.g. 凌晨业务低峰期做日志轮转。
Hybrid 思想（优点结合）：JDK sort() 实现、Weex/RN。

2 稳定性优化

稳住，我们能赢。—— by [0 杀 10 死] 正在等待复活的鲁班七号

维持稳定性是我们程序员每天都要思考和讨论的大事。

什么样的系统才算稳定？我自己写了个小工具，本地跑跑从来没出过问题，算稳定吗？淘宝网站几千人维护，但双十一零点还是经常下单失败，所以它不稳定喽？

稳定是相对的，业务规模越大、场景越复杂，系统越容易出现不稳定，且带来的影响也越严重。

衡量指标

不同业务所提供的服务类型千差万别，如何用一致的指标去衡量系统稳定性？标准做法是定义服务的可用性（Availability）：只要对用户而言服务“可用”，那就认为系统当前是稳定的；否则就是不稳定。用这样的方式，采集和汇总后就能得到服务总的可用/不可用比例（服务时长 or 服务次数），以此来监测和量化一个系统的稳定性。

可是，通过什么来定义某个服务当前是否可用呢？这一点确实跟业务相关，但大部分同类业务都可以用类似的方式去定义。例如，对于一般的 Web 网站，我们可以按如下方式去定义服务是否可用：API 请求都返回成功，且页面总加载时间 < 3 秒。

对于阿里云对外提供的云产品而言，服务可用性是一个更加需要格外重视并持续提升的指标：阿里云上的很多用户会同时使用多款云产品，其中任何一款产品出现可用性问题，都会直接被用户的用户感知和放大。所以，越是底层的基础设施，可用性要求就越高。关于可用性的更多细节指标和概念（SLI / SLO / SLA），可进一步参考云智能 SLA 了解。

可用性测量

有了上述可用性指标定义后，接下来该如何去准确测量系统的可用性表现？一般有如下两种方式。

1）探针模拟

从客户端侧，模拟用户的调用行为。

优点：数据真实（客户端角度）
缺点：数据不全面（单一客户数据）

2）服务端采集

从服务端侧，直接分析日志和数据。

优点：覆盖所有调用数据。
缺点：缺失客户端链路数据。

对可用性数据要求较高的系统，也可以同时运用上述两种方式，建议结合你的业务场景综合评估选择。

优化原则

你应该做的：关注 RT 的数据分布（如：p50/p99/p999 分位点），而不是平均值（mean） —— 平均值并没有太大意义，更应该去关注你那 1%、0.1% 用户的准确感受。

你不应该做的：不要尝试承诺和优化可用性到 100% —— 一方面是无法实现，存在太多客观不可控因素；另一方面也没有意义，客户几乎关注不到 0.001% 的可用性差别。

优化手段

常用的稳定性优化手段有哪些？这里也总结了 8 个套路：

1）避免单点

父母：一个人在外漂了这么多年，也该找个人稳定下来了。

如何避免？

集群部署
数据副本
多机房容灾

只堆量不够，还需要具备故障转移能力（Failover）。

接入层：DNS、VipServer、SLB。
服务层：服务发现 + 健康检查 + 剔除机制。
应用层：无状态设计（Stateless），便于随时和快速切换。

2）流控/限流

计划生育、上学调剂、车牌限号、景区限行... 人生处处被流控。

类型：QPS 流控、并发度流控。
工具：RateLimiter、信号量、Sentinel。
粒度：全局、用户级、接口级。
热点流控：避免意料之外的突增流量。

3）熔断

上午买的股票熔断，晚上家里保险丝熔断... 淡定，及时止损而已。

目的：防止连锁故障（雪崩效应）。
工具：Hystrix、Failsafe、Resilience4j。
功能：自动绕开异常服务并检测恢复状态。
流程：关闭 → 打开 → 半开。

4）降级

没时间做饭了，今天就吃外卖吧... 对于健康问题，还是得少一点降级。

触发原因：流控、熔断、负载过高。

常见降级方式：

关闭非核心功能：停止应用日志打印
牺牲数据时效性：返回缓存中旧数据
牺牲数据精确性：降低数据采样频率

5）超时/重试

钉钉不回怎么办？每 10 分钟 ping 一次，超过 1 小时打电话。

超时：避免调用端陷入永久阻塞。

超时时间设置：全链路自上而下规划
Timeout vs. Deadline：使用绝对时间会更好

重试：确保可重试操作的幂等性。

消息去重
异步重试
指数退避

6）资源设限

双 11 如何避免女友败家？提前把自己信用卡额度调低。

目的：防止资源被异常流量耗尽
资源类型：线程、队列、DB 连接
设限方式：资源池化、有界队列
超限处理：返回 ServiceUnavailable / QuotaExceeded

7）资源隔离

双 12 女友还是要败家？得嘞刷你自个的卡吧，别动我的。

目的：防止资源被部分异常流量耗尽；为 VIP 客户提供服务质量保证（QoS）。

隔离方式：队列划分、独立集群；注意处理优先级和资源分配比例。

8 ）安全生产

女友哭着说再让我最后剁一次手吧？安全第一，宁愿心疼也不要肉疼。

程序动态性：开关、配置、热升级。

Switch：类型安全；侵入性小。

审核机制：代码 Review、发布审批。

灰度发布；分批部署；回滚预案。

DUCT：自动/手动调整 HSF 节点权重。

可维护性优化

前人栽树，后人乘凉。

前人挖坑，后人凉凉。

维护的英文是 maintain，也能翻译成：维持、供给。所以软件维护能有多重要？它就是软件系统的呼吸机和食物管道，维持软件生命的必要供给。

系统开发完成上线，不过只是把它“生”下来而已。软件真正能发挥多大价值，看的是交付后持续的价值兑现过程 —— 是不断茁壮成长，为用户发光发热？还是慢慢堕落，逐渐被用户所遗忘？这并不是取决于它当下瞬时是否足够优秀（性能）和靠谱（稳定），而是取决于未来 —— 能否在不断变化的市场环境、客户需求和人为因素中，始终保持足够优秀和靠谱，并且能越来越好。

相比性能和稳定性而言，可维护性所体现的价值往往是最长远、但也最难在短期内可兑现的，因此很多软件项目都选择了在前期牺牲可维护性。这样决策带来的后果，就跟架构设计一样，是几乎无法（或者需要非常高的成本）去弥补和挽回的。太多的软件项目，就是因为越来越不可维护（代码改不动、bug 修不完、feature 加不上），最后只能慢慢沦落为一个谁都不想碰的遗留项目。

衡量指标

相比性能和稳定性而言，可维护性确实不太好量化（艺术成分 > 科学成分）。这里我选取了几个偏定性分析的指标：

1）复杂度（Complexity）：是否复杂度可控？

编码：简洁度、命名一致性、代码行数等。
架构：组件耦合度、层次清晰度、职责单一性等。

2）可扩展性（Extensibility）：是否易于变更？

需要变更代码或配置时，是否简单优雅、不易出错。

3）可运维性（Operability）：是否方便运维？

日志、监控是否完善；部署、扩容是否容易。

重要性

这里给了几个观点，进一步强调可维护性的重要性。

软件生命周期：维护周期 >> 开发周期。
破窗效应、熵增定律：可维护性会趋向于越来越差。
遗留系统的危害：理解难度，修改成本，变更风险；陷入不断踩坑、填坑、又挖坑的循环。

优化原则

你应该做的：遵循 KISS 原则、DRY 原则、各种代码可读性和架构设计原则等。

你不应该做的：引入过多临时性、Hack 代码；功能 Work 就 OK，欠一堆技术债（出来混总是要还的）。

优化手段

常用的可维护性优化手段有哪些？这里我总结了 4 个套路：

1）编码规范

无规矩，不成方圆。

编码：推荐《Java 开发手册》，另外也推荐 The Art of Readable Code 这本书。
日志：无盲点、无冗余、TraceID。
测试：代码覆盖度、自动化回归。

2）代码重构

别灰心，代码还有救。

何时重构：任何时候代码中嗅到坏味道（bad smell）。
重构节奏：小步迭代、回归验证。
重构 vs. 重写：需要综合考虑成本、风险、并行版本维护等因素。
推荐阅读：Refactoring: Improving the Design of Existing Code。

3）数据驱动

相信数据的力量。

系统数据：监控覆盖、Metrics 采集等，对于理解系统、排查问题至关重要。
业务数据：一致性校验、旧数据清理等；要相信，数据往往比代码要活得更久。

4）技术演进

技术是第一生产力。

死守阵地 or 紧跟潮流? 需要综合评估风险、生产力、学习成本。
当前方向：微服务化、容器化。

三结语

Truth lies underneath the skin - 真理永远暗藏在表象底下。

对，就在这句话底下。

欢迎各位技术同路人加入阿里云云原生应用研发平台 EMAS 团队，我们专注于广泛的云原生技术（Backend as a Service、Serverless、DevOps、低代码平台等），致力于为企业、开发者提供一站式的应用研发管理服务，内推直达：pengqun.pq # alibaba-inc.com，有信必回。

原文链接：https://developer.aliyun.com/article/767550?

版权声明：本文中所有内容均属于阿里云开发者社区所有，任何媒体、网站或个人未经阿里云开发者社区协议授权不得转载、链接、转贴或以其他方式复制发布/发表。申请授权请邮件[email protected]，已获得阿里云开发者社区协议授权的媒体、网站，在转载使用时必须注明"稿件来源：阿里云开发者社区，原文作者姓名"，违者本社区将依法追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件至：[email protected] 进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容。

你可能感兴趣的:(缓存,运维,监控,算法,安全,Java,测试技术,tsar,索引,微服务)

Mac安装JDK FINAL_NO Java基础 Mac JDK
1.JDK地址下载https://adoptopenjdk.net/?variant=openjdk8&jvmVariant=hotspot2.解决链接https://apple.stackexchange.com/questions/334384/how-can-i-install-java-openjdk-8-on-high-sierra3.方法安装最新版JDKbrewcaskinstalla
Java设计模式十三代理模式 (Proxy Pattern) 空灵宫（Ethereal Palace）设计模式 java 设计模式代理模式
代理模式(ProxyPattern)代理模式是一种结构型设计模式，它为其他对象提供一种代理（或占位符）以控制对该对象的访问。通过代理模式，我们可以在不修改目标对象的情况下，控制对其的访问，添加额外的功能，比如懒加载、权限检查、日志记录等。代理模式主要通过为目标对象创建一个代理对象来代替真实对象，代理对象可以控制对目标对象的访问，并可以在访问时提供附加功能。1.代理模式的组成代理模式通常包括以下角色
java环境变量配置 Vurteon Java java 初学者环境变量
学习了一段时间的Java，其实吧，对于这个环境变量的配置，如果你直接使用eclipse和下载jdk，就不会用到。但是一般在写单个test的时候，使用编辑器和javac，java这两个命令是个不错的选择。为什么需要配置环境变量也就是这个原因，你在任意的一个目录下，输入了javac****然后就可以编译一个.java文件了，原因就在于，你把下载的jdk下的bin目录添加进了系统变量中的PATH，这样，
JavaScript中通过array.map(）实现数据转换、创建派生数组、异步数据流处理、复杂API请求、DOM操作、搜索和过滤等，array.map(）的使用详解（附实际应用代码） watermelo37 前端 #数据结构 javascript vue.js 前端算法数据分析数据挖掘
目录JavaScript中通过array.map(）实现数据转换、创建派生数组、异步数据流处理、复杂API请求、DOM操作、搜索和过滤等，array.map（）的使用详解（附实际应用代码）一、什么时候该使用Array.map()，与forEach()的区别是什么？1、什么时候该用Array.map()2、Array.map()与Array.forEach()的区别二、Array.map(）的使用与
分布式 IO 模块与伺服电机：拉丝机高效生产的 “黄金搭档” 明达技术分布式
在工业生产领域，拉丝机的高效运作对于金属加工等众多行业至关重要。随着技术的不断进步，明达技术MR30分布式IO模块与伺服电机的协同应用，正为拉丝机带来前所未有的生产效率提升。高效协作，提升产能MR30分布式IO模块的分布式特性，使得它可以灵活地控制拉丝机的各个关键节点上，实现对设备的全面监控和控制。它与伺服电机紧密协作，能够快速响应生产过程中的各种变化。比如，当拉丝速度需要根据生产需求进行调整时，
明达云：赋能化工园区，智绘安全高效新蓝图明达技术物联网网络
在日新月异的科技浪潮中，数字化转型已成为各行各业转型升级的关键驱动力。尤其在化工这一关乎国家经济命脉与安全环保的重要领域，如何实现智能化管理、提升运营效率、确保生产安全，成为了摆在众多化工园区面前的重大课题。在此背景下，明达云平台以其卓越的技术实力与深厚的行业经验，正逐步成为化工园区智慧化升级的首选伙伴。智慧监管，安全先行化工生产，安全为先。明达云平台通过集成物联网、大数据、人工智能等先进技术，为
探索分布式IO模块的介质冗余：赋能工业自动化的稳健之心明达技术分布式自动化运维
在日新月异的工业自动化领域，每一个细微环节的稳定性都直接关系到生产线的效率与安全。随着智能制造的深入发展，分布式IO（Input/Output）模块作为连接现场设备与控制系统的关键桥梁，其重要性日益凸显。我们自主研发的带有介质冗余功能的MR30分布式IO模块，正以其独特的优势，为工业自动化系统构建起一道坚不可摧的防护网。介质冗余：保障数据传输的“双保险”在传统工业自动化系统中，单一介质（如网线、光
C++的STL库介绍及使用（初学者请食用）陌晽叶吖 c++开发语言
C++STL（标准模板库）是C++中提供的一个强大而广泛的库，包含了多种常用的模板类和算法。对于初学者来说，掌握STL的基础是非常重要的，它能大大提高代码的效率和简洁性。下面是适用于C++STL库初学者的使用方法，涵盖了常用的容器、算法和迭代器等基本内容。1.STL容器STL容器是存储数据的类模板，常见的容器包括：Vector（向量）List（链表）Deque（双端队列）Map（映射）Set（集合
老域名建站更好吗？域名域名申请域名配置
在互联网的世界里，域名不仅是网站的地址，更是品牌的重要组成部分。随着互联网的发展，关于域名的选择也出现了不同的观点，尤其是老域名和新域名的使用。那么，老域名建站是否更好呢？这是一个值得探讨的问题。本文将从多个角度分析老域名建站的优缺点，帮助大家更好地做出选择。一、老域名的潜在优势搜索引擎信任度：如果一个老域名在过去有良好的使用记录，未涉及违规或垃圾信息，搜索引擎可能已经对其建立了一定的信任度。例如
多边形扫描线填充算法晓梦OvO 算法 python
1.基本思想按扫描线顺序，计算扫描线与多边形的相交区间，再用要求的颜色显示这些区间的象素，即完成填充工作。对于一条扫描线填充过程可以分为四个步骤：1.求交：计算扫描线与多边形各边的交点；2.排序：把所有交点按x值递增顺序排序；3.配对：第一个与第二个，第三个与第四个等等；每对交点代表扫描线与多边形的一个相交区间，4.着色：把相交区间内的象素置成多边形颜色，把相交区间外的象素置成背景色。2.算法过程
CDN防御如何保护我们的网络安全？ cdncdn缓存网络安全
在当今数字化时代，网络安全成为了一个至关重要的议题。随着网络攻击的日益频繁和复杂化，企业和个人都面临着前所未有的安全威胁。内容分发网络（CDN）作为一种分布式网络架构，不仅能够提高网站的访问速度和用户体验，还能够在很大程度上增强网络安全防护能力。本文将探讨CDN防御如何保护我们的网络安全。1、CDN防御的首要本领是分布式抗DDoS攻击DDoS攻击，即分布式拒绝服务攻击，犹如网络中的“洪水猛兽”，攻
华为OD机试E卷 --羊、狼、农夫过河--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript c语言 python
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述羊、狼、农夫都在岸边，当羊的数量小于狼的数量时，狼会攻击羊，农夫则会损失羊。农夫有一艘容量固定的船，能够承载固定数量的动物。要求求出不损失羊情况下将全部羊和狼运到对岸需要的最小次数。只计算农夫去对岸的次数，回程时农夫不会运送羊和狼。备注:农夫在或农夫离开后羊的数量大于狼的数量
华为OD机试E卷 --手机App防沉迷系统--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript python c语言
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述智能手机方便了我们生活的同时，也侵占了我们不少的时间。“手机App防沉迷系统”能够让我们每天合理地规划手机App使用时间，在正确的时间做正确的事。它的大概原理是这样的：在一天24小时内，可以注册每个App的允许使用时段一个时间段只能使用一个AppApp有优先级，数值越高，优先
JAVA：Spring Boot 实现责任链模式处理订单流程的技术指南拾荒的小海螺 JAVA java spring boot 责任链模式
1、简述在复杂的业务系统中，订单流程往往需要一系列的操作，比如验证订单、检查库存、处理支付、更新订单状态等。责任链模式（ChainofResponsibility）可以帮助我们将这些处理步骤分开，并且以链式方式处理每一个操作，从而让代码更加清晰、可扩展和模块化。本文将介绍如何在SpringBoot3.3中使用责任链模式实现订单流程管理。2、场景设计责任链模式是一种行为设计模式，它通过将请求沿着处理
PHP基于Google Authenticator双因素身份验证实现动态码验证
一：介绍GoogleAuthenticator双因素身份验证是谷歌推出的一款动态口令工具，解决大家各平台账户遭到恶意攻击的问题，一般在相关的服务平台登陆中除了用正常用户名和密码外，需要再输入一次谷歌认证器生成的动态口令才能验证成功，相当于输入二次密码，以达到账户的高安全性。二：拓展安装composerrequirehuaweichenai/google-authenticator三：使用1：创建密
DNS缓存—互联网高效运行的幕后功臣服务器运维缓存系统
在当今数字化时代，互联网已经渗透到我们生活的方方面面。当我们在浏览器中输入一个网址，瞬间就能访问到对应的网站，这背后DNS缓存功不可没。DNS缓存是一种优化域名解析过程的机制。我们知道，互联网上的计算机通过IP地址来相互识别和通信，但IP地址是一串难记的数字，于是域名应运而生。一、DNS缓存有什么作用?1、提升访问效率在网络访问中，首次访问某个域名时，设备需向DNS服务器发起查询以获取对应的IP地
Containerd 插件系统深度解析
前言Containerd是一个工业级的容器运行时,其插件系统是其架构中最核心的部分之一。本文将深入解析containerd的插件机制,帮助读者理解其设计理念和实现原理。1.插件系统概述1.1设计目标模块化:将功能解耦为独立插件可扩展性:支持动态添加新功能类型安全:基于Go接口的类型检查依赖管理:自动处理插件间依赖关系1.2核心概念typeRegistrationstruct{TypeTypeIDs
怎么做DNS污染检测域名解析dnsdns劫持
DNS污染是指通过恶意手段篡改DNS解析结果，导致用户访问错误或恶意网站的行为。这种行为不仅影响用户体验，还可能带来安全风险。以下是几种检测DNS污染的方法：1.使用在线DNS检查工具可以使用在线工具如帝恩思旗下的拨测在线DNS检测工具等来检查DNS设置和解析结果。这些工具会返回当前的DNS解析结果，从而判断是否存在异常。2.手动检查DNS解析结果通过命令行工具（如nslookup、dig）手动查
网络安全常见十大漏洞总结（原理、危害、防御）安全防护服务器安全加固服务器
一、弱口令产生原因与个人习惯和安全意识相关，为了避免忘记密码，使用一个非常容易记住的密码，或者是直接采用系统的默认密码等。危害通过弱口令，攻击者可以进入后台修改资料，进入金融系统盗取钱财，进入OA系统可以获取企业内部资料，进入监控系统可以进行实时监控等等。防御设置密码通常遵循以下原则：（1）不使用空口令或系统缺省的口令，为典型的弱口令；（2）口令长度不小于8个字符；（3）口令不应该为连续的某个字符
JS工程化集锦
项目工具模块化JS模块规范CommonJS·AMD·CMD·UMD·ES6NPM版本NPM版本介绍打包构建polyfill工程化篇-JS兼容方案项目管理LintCodeReview效率工具ESLint方案官方：https://cn.eslint.org/docs/user-guide/configuringairbnb:https://github.com/airbnb/javascriptsta
农夫过河——python贪心算法实现贝桑不止学Python
1.问题描述：一个农夫在河的西岸带了一匹狼、一只羊和一棵白菜，他需要把这三样东西用船带到河的东岸。然而，这艘船只能容下农夫本人和另外一样东西。如果农夫不在场的话，狼会吃掉羊，羊也会吃掉白菜。2.问题分析：由于整个过程涉及四个对象，多个步骤，而各个步骤中各个对象所处位置相对不同，因此可以定义一个二维数组，分别存储对象及初始状态——initial_state[0][0]，[1][0]，[1][1]，[
python元组+字典学IT的那些年 python
#案例#访问元组#aTuple=(23,35,56,34,11,21)#下标为2#print(aTuple[2])#索引值不存在#print(aTuple[20])#查询个数#aTuple=('b','c','d','e','f','g')#print(aTuple.count('d'))#查询索引#print(aTuple.index('d',0,4))#无对应元素#print(aTuple.i
Python的元组和字典汤姆666 测试工具测试软件测试 python
1.元组Python的元组与列表类似，不同之处在于元组的元素不能修改。元组使用小括号，列表使用方括号。格式：变量名=（，，，，）案例aTuple=(23,35,56,34,11,21)1.1访问元组通过索引取数据索引值存在aTuple=(23,35,56,34,11,21)print(aTuple[2])结果561.2查询个数count查询出现的个数aTuple=('b','c','d','e',
深入理解 SSH 端口转发：本地 vs 远程 vs 动态转发 X_taiyang18 ssh 运维
简介SSH端口转发（SSHPortForwarding）作为一种强大而灵活的技术，不仅可以帮助我们安全地访问远程服务，还能轻松突破网络限制。本文将带你深入了解SSH端口转发的原理、类型和实战应用。目录简介什么是SSH端口转发？主要特点：SSH端口转发的三种类型1.本地端口转发（LocalPortForwarding）️➡️1.1原理1.2使用场景1.3命令格式1.4示例2.远程端口转发（Remot
深入理解视图的创建与删除：数据库管理中的高级功能
title:深入理解视图的创建与删除：数据库管理中的高级功能date:2025/1/21updated:2025/1/21author:cmdragonexcerpt:在现代数据库管理系统中，视图是一个重要的高级功能，可以为用户提供定制化的数据视图以满足特定需求。视图不仅能够简化复杂的查询，还能增强数据安全性和访问效率。categories:前端开发tags:数据库视图创建视图删除视图数据库管理数
老域名建站更好吗？域名域名申请域名配置
在互联网的世界里，域名不仅是网站的地址，更是品牌的重要组成部分。随着互联网的发展，关于域名的选择也出现了不同的观点，尤其是老域名和新域名的使用。那么，老域名建站是否更好呢？这是一个值得探讨的问题。本文将从多个角度分析老域名建站的优缺点，帮助大家更好地做出选择。一、老域名的潜在优势搜索引擎信任度：如果一个老域名在过去有良好的使用记录，未涉及违规或垃圾信息，搜索引擎可能已经对其建立了一定的信任度。例如
安装栅栏-算法晚夜微雨问海棠呀算法 scala
给定一个数组trees，其中trees[i]=[xi,yi]表示树在花园中的位置。你被要求用最短长度的绳子把整个花园围起来，因为绳子很贵。只有把所有的树都围起来，花园才围得很好。返回恰好位于围栏周边的树木的坐标。输入:points=[[1,1],[2,2],[2,0],[2,4],[3,3],[4,2]]输出:[[1,1],[2,0],[3,3],[2,4],[4,2]]importscala.c
AI编程，不会使用提示词，那怎么能行！！小南独家提示词书写技巧，让你效率提高2倍！！！ - 提示词第一课！！！！小南AI学院 AI JAVA 前端 AI编程
0.前言这是提示词第一课程，未来还有cursor、Copilot、通义千问、MarsCode的实战。关注、收藏不迷路。麻烦点个赞吧。小南持续为大家1.如何写提示词编写有效提示词是高效使用AI编程软件的关键。下面介绍一些方法和技巧，帮助你更精准地引导模型生成所需内容。1.1明确角色将AI编程软件设定为特定领域的专家角色，有助于生成更专业、更贴合实际需求的内容。示例：“你是一位经验丰富的Java后端开
docker教程安装docker 爱吃蚂蚁的松鼠 docker docker kubernetes 容器
学习一个技术最重要的是学习一个技术的生态，用这些生态的相关知识点解决实际问题。docker实战docker拉取容器（nginx的坑等等）docker日志配置和DNS配置docker远程API调试（通过对接API来实现，打造自己的web运维工具）docker结合terraform自动化运维工具做自动化工作docker网络（网络流转原理和一些创建新环境来跟公司网络环境保持一致才能连接）docker高可
prometheus持久化到mysql_Prometheus的架构及持久化 CHM单
原文：https://my.oschina.net/go4it/blog/855598Prometheus是什么Prometheus是一个开源的系统监控和报警工具，特点是多维数据模型(时序列数据由metric名和一组key/value组成)在多维度上灵活的查询语言(PromQl)不依赖分布式存储，单主节点工作.通过基于HTTP的pull方式采集时序数据可以通过pushgateway进行时序列数据推
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI PHP android linux
╔-----------------------------------╗┆
各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。 bozch .net .net mvc
在.net mvc5中，在执行某一操作的时候，出现了如下错误：各表中的列名必须唯一。在表 'dbo.XXX' 中多次指定了列名 'XXX'。经查询当前的操作与错误内容无关，经过对错误信息的排查发现，事故出现在数据库迁移上。回想过去：在迁移之前已经对数据库进行了添加字段操作，再次进行迁移插入XXX字段的时候，就会提示如上错误。 &
Java 对象大小的计算 e200702084 java
Java对象的大小如何计算一个对象的大小呢？
Mybatis Spring 171815164 mybatis
ApplicationContext ac = new ClassPathXmlApplicationContext("applicationContext.xml"); CustomerService userService = (CustomerService) ac.getBean("customerService"); Customer cust
JVM 不稳定参数 g21121 jvm
-XX 参数被称为不稳定参数，之所以这么叫是因为此类参数的设置很容易引起JVM 性能上的差异，使JVM 存在极大的不稳定性。当然这是在非合理设置的前提下，如果此类参数设置合理讲大大提高JVM 的性能及稳定性。可以说“不稳定参数”
用户自动登录网站永夜-极光用户
1.目标:实现用户登录后,再次登录就自动登录,无需用户名和密码 2.思路:将用户的信息保存为cookie 每次用户访问网站,通过filter拦截所有请求,在filter中读取所有的cookie,如果找到了保存登录信息的cookie,那么在cookie中读取登录信息,然后直接
centos7 安装后失去win7的引导记录程序员是怎么炼成的操作系统
1.使用root身份(必须)打开 /boot/grub2/grub.cfg 2.找到 ### BEGIN /etc/grub.d/30_os-prober ### 在后面添加 menuentry "Windows 7 (loader) (on /dev/sda1)" {
Oracle 10g 官方中文安装帮助文档以及Oracle官方中文教程文档下载 aijuans oracle
Oracle 10g 官方中文安装帮助文档下载：http://download.csdn.net/tag/Oracle%E4%B8%AD%E6%96%87API%EF%BC%8COracle%E4%B8%AD%E6%96%87%E6%96%87%E6%A1%A3%EF%BC%8Coracle%E5%AD%A6%E4%B9%A0%E6%96%87%E6%A1%A3 Oracle 10g 官方中文教程
JavaEE开源快速开发平台G4Studio_V3.2发布了無為子 AOP oracle mysql javaee G4Studio
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V3.2版本已经正式发布。大家可以通过如下地址下载。访问G4Studio网站 http://www.g4it.org G4Studio_V3.2版本变更日志功能新增 (1).新增了系统右下角滑出提示窗口功能。 (2).新增了文件资源的Zip压缩和解压缩
Oracle常用的单行函数应用技巧总结百合不是茶日期函数转换函数(核心)数字函数通用函数(核心)字符函数
单行函数; 字符函数,数字函数,日期函数,转换函数(核心),通用函数(核心) 一:字符函数: .UPPER(字符串) 将字符串转为大写 .LOWER (字符串) 将字符串转为小写 .INITCAP(字符串) 将首字母大写 .LENGTH (字符串) 字符串的长度 .REPLACE(字符串,'A','_') 将字符串字符A转换成_
Mockito异常测试实例 bijian1013 java 单元测试 mockito
Mockito异常测试实例： package com.bijian.study; import static org.mockito.Mockito.mock; import static org.mockito.Mockito.when; import org.junit.Assert; import org.junit.Test; import org.mockito.
GA与量子恒道统计 Bill_chen JavaScript 浏览器百度 Google 防火墙
前一阵子，统计**网址时，Google Analytics（GA）和量子恒道统计（也称量子统计），数据有较大的偏差，仔细找相关资料研究了下，总结如下：为何GA和量子网站统计（量子统计前身为雅虎统计）结果不同？首先：没有一种网站统计工具能保证百分之百的准确出现该问题可能有以下几个原因：（1）不同的统计分析系统的算法机制不同；（2）统计代码放置的位置和前后
【Linux命令三】Top命令 bit1129 linux命令
Linux的Top命令类似于Windows的任务管理器，可以查看当前系统的运行情况，包括CPU、内存的使用情况等。如下是一个Top命令的执行结果： top - 21:22:04 up 1 day, 23:49, 1 user, load average: 1.10, 1.66, 1.99 Tasks: 202 total, 4 running, 198 sl
spring四种依赖注入方式白糖_ spring
平常的java开发中，程序员在某个类中需要依赖其它类的方法，则通常是new一个依赖类再调用类实例的方法，这种开发存在的问题是new的类实例不好统一管理，spring提出了依赖注入的思想，即依赖类不由程序员实例化，而是通过spring容器帮我们new指定实例并且将实例注入到需要该对象的类中。依赖注入的另一种说法是“控制反转”，通俗的理解是：平常我们new一个实例，这个实例的控制权是我
angular.injector boyitech AngularJS AngularJS API
angular.injector 描述: 创建一个injector对象, 调用injector对象的方法可以获得angular的service, 或者用来做依赖注入. 使用方法: angular.injector(modules, [strictDi]) 参数详解: Param Type Details mod
java-同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待 bylijinnan Integer
public class PC { /** * 题目：生产者-消费者。 * 同步访问一个数组Integer[10]，生产者不断地往数组放入整数1000，数组满时等待；消费者不断地将数组里面的数置零，数组空时等待。 */ private static final Integer[] val=new Integer[10]; private static
使用Struts2.2.1配置 Chen.H apache spring Web xml struts
Struts2.2.1 需要如下 jar包: commons-fileupload-1.2.1.jar commons-io-1.3.2.jar commons-logging-1.0.4.jar freemarker-2.3.16.jar javassist-3.7.ga.jar ognl-3.0.jar spring.jar struts2-core-2.2.1.jar struts2-sp
[职业与教育]青春之歌 comsci 教育
每个人都有自己的青春之歌............但是我要说的却不是青春... 大家如果在自己的职业生涯没有给自己以后创业留一点点机会,仅仅凭学历和人脉关系,是难以在竞争激烈的市场中生存下去的.... &nbs
oracle连接(join)中使用using关键字 daizj JOIN oracle sql using
在oracle连接(join)中使用using关键字 34. View the Exhibit and examine the structure of the ORDERS and ORDER_ITEMS tables. Evaluate the following SQL statement: SELECT oi.order_id, product_id, order_date FRO
NIO示例 daysinsun nio
NIO服务端代码： public class NIOServer { private Selector selector; public void startServer(int port) throws IOException { ServerSocketChannel serverChannel = ServerSocketChannel.open(
C语言学习homework1 dcj3sjt126com c homework
0、课堂练习做完 1、使用sizeof计算出你所知道的所有的类型占用的空间。 int x; sizeof(x); sizeof(int); # include <stdio.h> int main(void) { int x1; char x2; double x3; float x4; printf(&quo
select in order by , mysql排序 dcj3sjt126com mysql
If i select like this: SELECT id FROM users WHERE id IN(3,4,8,1); This by default will select users in this order 1,3,4,8, I would like to select them in the same order that i put IN() values so:
页面校验-新建项目 fanxiaolong 页面校验
$(document).ready( function() { var flag = true; $('#changeform').submit(function() { var projectScValNull = true; var s =""; var parent_id = $("#parent_id").v
Ehcache（02）——ehcache.xml简介 234390216 ehcache ehcache.xml 简介
ehcache.xml简介 ehcache.xml文件是用来定义Ehcache的配置信息的，更准确的来说它是定义CacheManager的配置信息的。根据之前我们在《Ehcache简介》一文中对CacheManager的介绍我们知道一切Ehcache的应用都是从CacheManager开始的。在不指定配置信
junit 4.11中三个新功能 jackyrong java
junit 4.11中两个新增的功能，首先是注解中可以参数化，比如 import static org.junit.Assert.assertEquals; import java.util.Arrays; import org.junit.Test; import org.junit.runner.RunWith; import org.junit.runn
国外程序员爱用苹果Mac电脑的10大理由 php教程分享 windows PHP unix Microsoft perl
Mac 在国外很受欢迎，尤其是在设计/web开发/IT 人员圈子里。普通用户喜欢 Mac 可以理解，毕竟 Mac 设计美观，简单好用，没有病毒。那么为什么专业人士也对 Mac 情有独钟呢？从个人使用经验来看我想有下面几个原因： 1、Mac OS X 是基于 Unix 的这一点太重要了，尤其是对开发人员，至少对于我来说很重要，这意味着Unix 下一堆好用的工具都可以随手捡到。如果你是个 wi
位运算、异或的实际应用 wenjinglian 位运算
一．位操作基础，用一张表描述位操作符的应用规则并详细解释。二．常用位操作小技巧，有判断奇偶、交换两数、变换符号、求绝对值。三．位操作与空间压缩，针对筛素数进行空间压缩。 &n
weblogic部署项目出现的一些问题（持续补充中……） Everyday都不同 weblogic部署失败
好吧，weblogic的问题确实…… 问题一： org.springframework.beans.factory.BeanDefinitionStoreException: Failed to read candidate component class: URL [zip:E:/weblogic/user_projects/domains/base_domain/serve
tomcat7性能调优（01） toknowme tomcat7
Tomcat优化： 1、最大连接数最大线程等设置 <Connector port="8082" protocol="HTTP/1.1" useBodyEncodingForURI="t
PO VO DAO DTO BO TO概念与区别 xp9802 java DAO 设计模式 bean 领域模型
O/R Mapping 是 Object Relational Mapping（对象关系映射）的缩写。通俗点讲，就是将对象与关系数据库绑定，用对象来表示关系数据。在O/R Mapping的世界里，有两个基本的也是重要的东东需要了解，即VO，PO。它们的关系应该是相互独立的，一个VO可以只是PO的部分，也可以是多个PO构成，同样也可以等同于一个PO（指的是他们的属性）。这样，PO独立出来，数据持

救火必备！问题排查与系统优化手册

一 问题排查

1 常见问题

2 排查流程

二 系统优化

1 性能优化

2 稳定性优化

可维护性优化

三 结语

你可能感兴趣的:(缓存,运维,监控,算法,安全,Java,测试技术,tsar,索引,微服务)

一问题排查

二系统优化

三结语