左灯右行的爱情

深度学习与总结JVM专辑（七）：垃圾回收器—CMS（图文+代码）

CMS垃圾收集器深度解析教程

- 1. 前言：为什么需要CMS？
- 2. CMS 工作原理：一场与时间的赛跑
- - 2.1. 初始标记（Initial Mark）
  - 2.2. 并发标记（Concurrent Mark）
  - 2.3. 重新标记（Remark）
  - 2.4. 并发清除（Concurrent Sweep）
- 3. CMS 的优势与劣势：权衡的艺术
- - 3.1. 优势 (Pros)
  - 3.2. 劣势 (Cons)
- 4. "并发" vs "并行"：别再傻傻分不清
- 5. 三色标记法：CMS并发标记的理论基础
- 6. 写屏障与增量更新：并发标记的救星
- - 6.1. 写屏障 (Write Barrier)
  - 6.2. 增量更新 (Incremental Update)
  - 6.3. 卡表 (Card Table)：优化重新标记
- 7. CMS 的核心痛点详解
- - 7.1. 并发失败 (Concurrent Mode Failure)
  - 7.2. 内存碎片 (Memory Fragmentation)
  - 7.3. 浮动垃圾 (Floating Garbage)
- 8. CMS 适用场景与被取代的原因
- - 8.1. 何时考虑使用 CMS？
  - 8.2. 为什么 CMS 被废弃和移除？
- 9. 总结：CMS 的历史价值

1. 前言：为什么需要CMS？

在Java虚拟机（JVM）的众多垃圾收集器（Garbage Collector, GC）中，CMS（Concurrent Mark Sweep）占有特殊的历史地位。虽然它在较新的JDK版本中已被标记为废弃（Deprecated）并最终移除，但理解CMS的设计理念、工作原理以及优缺点，对于深入掌握JVM内存管理、理解后续更先进的GC（如G1、ZGC）的演进思路，仍然具有非常重要的价值。

CMS的核心目标是什么？

简单来说，CMS的设计目标是 获取尽可能短的回收停顿时间。

假如有一个高并发的在线购物网站。在用户浏览商品、下单支付的关键时刻，如果JVM因为执行垃圾回收而突然卡顿（Stop The World, STW）几百毫秒甚至几秒钟，那将是灾难性的，会导致用户流失和交易失败。
CMS正是为了解决这类对 低延迟（Low Latency） 有着苛刻要求的应用场景而诞生的。

它尝试在应用程序运行的同时，并发地执行大部分垃圾回收工作，从而将原本可能很长的STW时间，分解成几次非常短暂的STW停顿，极大地改善了应用的响应性能和用户体验。

注意： CMS已在JDK 9中被标记为废弃，并在JDK 14中被移除。本教程旨在帮助理解其原理，而非推荐在新的项目中使用。对于现代Java应用，G1、ZGC或Shenandoah通常是更好的选择。

2. CMS 工作原理：一场与时间的赛跑

CMS的核心思想是“并发”，即垃圾收集线程与应用程序线程在大部分时间内可以同时运行。为了实现这个目标，CMS将整个垃圾回收过程精心划分为四个主要阶段，以及一些穿插其中的预处理和收尾工作。

核心算法：标记-清除（Mark-Sweep）

首先要明确，CMS是基于 标记-清除 算法实现的。这意味着它在回收后不会对内存空间进行整理，这也是后续我们会讨论到的“内存碎片”问题的根源。

四个主要阶段：

CMS的回收过程主要包含以下四个步骤：

初始标记（Initial Mark）
并发标记（Concurrent Mark）
重新标记（Remark）
并发清除（Concurrent Sweep）

其中，初始标记 和 重新标记 这两个阶段需要 “Stop The World”（STW），即暂停所有应用程序线程。而 并发标记 和 并发清除 阶段则可以与应用程序线程并发执行。

下面我们来详细解析每个阶段的工作：

2.1. 初始标记（Initial Mark）

目标： 标记出所有从 GC Roots 直接关联到的对象。
执行方式： 需要 STW。
耗时： 非常短暂。

这个阶段就像是在繁忙的高速公路上设置了一个极短的检查点。交警（GC线程）需要迅速拦下所有车辆（暂停用户线程），然后快速识别并标记出那些“有明确目的地”（直接被GC Roots引用）的车辆（对象）。GC Roots 包括虚拟机栈中引用的对象、方法区静态属性引用的对象、方法区常量引用的对象、本地方法栈JNI引用的对象等。

由于现代JVM的方法区、虚拟机栈等区域通常不会太大，而且只需要标记GC Roots直接关联的对象，无需深度遍历，因此这个阶段的速度非常快，通常只持续几十毫料。

理解帮助： 为什么需要STW？因为GC Roots集合是不断变化的，如果在标记过程中用户线程还在运行，可能会导致GC Roots增加或减少，从而影响标记的准确性。必须在一个静止的快照上进行操作。

2.2. 并发标记（Concurrent Mark）

目标： 从“初始标记”阶段找到的对象出发，递归遍历整个对象引用链，标记所有存活的对象。
执行方式： 并发执行（GC线程与用户线程同时运行）。
耗时： 较长，是CMS整个回收过程中耗时最长的阶段。

这是CMS最核心、最具特色的阶段。在初始标记完成后，应用程序线程恢复运行。同时，专门的GC线程开始工作，它们沿着初始标记阶段找到的那些“种子对象”，逐步追踪整个对象引用图。就像是在高速公路上，普通车辆（用户线程）在正常行驶，而道路养护车（GC线程）在旁边车道或者利用夜间进行详细的道路状况检查（标记存活对象）。

理解帮助： 并发标记的挑战？这个阶段最大的挑战在于，用户线程仍在运行并可能修改对象的引用关系。比如：

原本被标记为存活的对象，在标记过程中被用户线程断开了引用，变成了垃圾。
原本某个对象没有被GC线程访问到（标记为白色），但用户线程突然让一个已经被标记过的对象（黑色）引用了它。

这些变化可能会导致标记结果不准确（漏标或错标）。CMS需要后续的“重新标记”阶段来修正这些问题。我们将在后面详细讨论CMS如何解决这些并发问题。

2.3. 重新标记（Remark）

目标： 修正“并发标记”期间，因用户线程修改引用关系而导致标记发生变动的那一部分对象的标记记录。
执行方式： 需要 STW。
耗时： 比初始标记长，但远比并发标记短。

并发标记阶段虽然完成了大部分工作，但它是在一个“动态”的环境下进行的。为了确保标记的最终准确性，需要一个短暂的STW阶段来进行“查漏补缺”。这就像道路养护车在并发检查后，再次短暂封闭道路（STW），对那些在检查期间有车辆进出或新出现问题的路段（被用户线程修改过引用的对象及相关区域）进行最后的确认。

这个阶段主要处理两类变化：

并发标记期间，新加入引用关系的对象。
并发标记期间，被移除引用关系的对象。

CMS通过一些聪明的机制（如卡表、增量更新，稍后详述）来记录并发标记期间的这些变化，使得重新标记阶段不必重新扫描整个堆，而只需要关注那些“有变动”的小范围区域，从而有效控制了STW的时间。

理解帮助： 为什么重新标记比初始标记慢？因为重新标记需要处理整个并发标记阶段积累的变化信息，扫描范围比初始标记（只看GC Roots直连对象）要大。但相比于重新扫描整个堆，它的效率已经大大提高了。

2.4. 并发清除（Concurrent Sweep）

目标： 清除在标记阶段被判定为“已死亡”（未被标记）的对象，释放它们占用的内存空间。
执行方式： 并发执行（GC线程与用户线程同时运行）。
耗时： 较长，取决于垃圾对象的数量和分布。

在重新标记阶段确保了所有存活对象都被正确标记后，应用程序线程再次恢复运行。GC线程则开始最后的清理工作。它们遍历堆内存，将那些没有被标记（白色）的对象识别为垃圾，并将它们占用的内存回收，加入到空闲内存列表（Free List）中，以备后续分配新对象使用。

这个阶段也是并发的，用户线程可以正常访问那些已被标记为存活的对象，同时GC线程在后台默默地回收垃圾。

整体流程回顾：

CMS GC Cycle

初始标记 Initial Mark
STW, 耗时短

并发标记 Concurrent Mark
并发, 耗时最长

重新标记 Remark
STW, 耗时较短

并发清除 Concurrent Sweep
并发, 耗时较长

App Threads

通过将耗时最长的标记和清除阶段设计为并发执行，CMS成功地将大部分GC工作与应用程序运行重叠，从而显著降低了整体的STW时间，实现了其低延迟的目标。

3. CMS 的优势与劣势：权衡的艺术

没有哪种垃圾收集器是完美的，CMS也不例外。它通过牺牲一些其他方面的性能来换取低延迟的特性。理解其优缺点对于判断它是否适合特定应用场景至关重要。

3.1. 优势 (Pros)

并发收集 (Concurrent Collection): 这是CMS最核心的优势。标记和清除两个主要耗时阶段可以与用户线程并发执行，避免了长时间的应用停顿。
低延迟 (Low Latency): 由于STW时间被显著缩短（主要由初始标记和重新标记贡献，通常很短），CMS非常适合对响应时间有严格要求的应用，例如：
- 网站服务器（如Tomcat, Jetty）
- API网关
- 实时交易系统
- 交互式桌面应用

3.2. 劣势 (Cons)

CMS的并发特性和基于标记-清除算法的设计，也带来了几个不容忽视的缺点：

对CPU资源敏感 (CPU Intensive):
- 原因： 并发阶段，GC线程需要与用户线程一起抢占CPU资源。默认情况下，CMS启动的回收线程数是 (CPU核心数 + 3) / 4。当CPU核心数较少时（例如少于4个），GC线程可能会占用相当一部分（甚至超过25%）的CPU运算能力，导致用户程序的执行速度变慢，总吞吐量下降。
- 理解帮助： 想象一下，原本专心开车的司机（用户线程）旁边多了一个不断指手画脚、分散注意力的乘客（GC线程），虽然车没有停，但整体开车效率降低了。吞吐量指的是单位时间内用户代码运行时间占总时间的比例。CMS为了低延迟牺牲了吞吐量。
无法处理“浮动垃圾” (Floating Garbage):
- 原因： 在并发清除阶段，用户线程还在运行，并且可能会产生新的垃圾对象。然而，这些新产生的垃圾是在标记阶段之后出现的，CMS本次无法识别它们，只能等到下一次GC周期才能回收。这些在本轮GC中无法回收、但实际上已经是垃圾的对象，就被称为“浮动垃圾”。
- 影响：
  - 降低了内存利用率，部分内存被无效占用。
  - 需要预留一部分堆空间来容纳这些浮动垃圾以及并发运行时用户线程可能继续分配的新对象。这也是为什么CMS不能等到老年代几乎完全满了再启动回收，而是需要在一个较低的阈值（默认68%或92%，取决于JDK版本和配置）就开始回收。参数 -XX:CMSInitiatingOccupancyFraction 控制这个阈值。
- 理解帮助： 清洁工（GC线程）正在打扫房间（并发清除），但主人（用户线程）还在不断扔新的垃圾。清洁工这次只能清理之前标记好的垃圾，新扔的只能等下次再说了。
产生内存碎片 (Memory Fragmentation):
- 原因： CMS基于 标记-清除 算法。该算法只标记、清除，不移动对象。回收后，内存空间会变得不连续，存在大量小的空闲块，这就是内存碎片。
- 影响：
  - 当应用程序需要分配一个较大的对象时，即使总的空闲内存足够，也可能因为找不到一块足够大的连续空间而分配失败。
  - 内存碎片过多最终会提前触发一次 Full GC（通常是使用 Serial Old 或 Parallel Old 进行带压缩的回收），导致更长时间的STW。
- 缓解措施： CMS提供了两个参数来控制碎片整理：
  - -XX:+UseCMSCompactAtFullCollection (默认开启): 在不得不进行Full GC时，开启内存整理（压缩）。
  - -XX:CMSFullGCsBeforeCompaction (默认值为0): 设置在执行多少次不压缩的Full GC之后，进行一次带压缩的Full GC。值为0表示每次Full GC都进行压缩。
- 理解帮助： 图书馆管理员（GC）把借走的书（垃圾对象）下架了，但书架上留下了很多零散的空位（碎片）。当需要放一本大部头（大对象）时，虽然总空位数很多，但找不到一个足够宽的连续空位。管理员可以选择在某个时候（Full GC）把所有书重新排列整齐（压缩），但这需要闭馆一段时间（STW）。
并发失败风险 (Concurrent Mode Failure):
- 原因： 如果在CMS并发标记或并发清除的过程中，老年代的内存增长速度过快（比如用户线程分配大对象、大量对象从年轻代晋升），导致预留的空间不足以容纳新对象，CMS就会发生“并发失败”。
- 后果： 一旦发生并发失败，JVM会冻结用户线程（STW），然后启用后备的、单线程的、带压缩的 Serial Old 收集器来重新进行整个老年代的垃圾回收。这会导致一次非常漫长的STW，比CMS正常运行时的短暂停顿要长得多，严重影响应用性能。
- 触发条件：
  - 老年代空间不足以容纳从Young GC晋升的对象。
  - 并发过程中分配大对象，老年代没有足够连续空间。
  - CMSInitiatingOccupancyFraction 设置过高，预留空间不足。
  - 回收速度跟不上内存分配速度。
- 理解帮助： 商场（老年代）一边营业（用户线程运行）一边打扫（CMS并发回收）。但突然涌入大量顾客（对象晋升/大对象分配），或者垃圾产生速度太快，清洁工来不及清理，商场空间不够用了。这时不得不紧急关门谢客（STW），请来效率较低但能彻底整理的保洁队（Serial Old）进行大扫除。

总结：

特性	优势	劣势
核心	并发收集、低延迟	对CPU敏感、吞吐量降低
算法	(无直接优势)	标记-清除导致内存碎片
并发执行	减少STW时间	无法处理浮动垃圾、需要预留空间、可能发生并发失败（Concurrent Mode Failure）
适用场景	对响应时间要求高的应用（Web服务、API等）	CPU资源紧张、内存分配率极高、无法容忍内存碎片的场景

选择CMS，就是选择用CPU资源、部分内存空间和一定的复杂性来换取应用响应时间的提升。

4. “并发” vs “并行”：别再傻傻分不清

在垃圾收集的语境下，“并发”（Concurrent）和“并行”（Parallel）是两个非常重要且容易混淆的概念。理解它们的区别有助于我们把握不同GC的设计哲学。

并行 (Parallel):
- 定义： 指 多条垃圾收集器线程 同时工作。
- 关注点： 缩短 垃圾收集本身 的时间，提高GC的效率。
- 用户线程状态： 在并行GC执行期间，用户线程仍然处于等待状态（STW）。
- 例子： Parallel Scavenge（新生代）、Parallel Old（老年代）。它们在进行垃圾回收时，会启动多个GC线程协同工作，以加快回收速度，但整个过程应用是暂停的。
- 目标： 提高 吞吐量 (Throughput)。即让用户代码执行时间占总时间的比例最大化。适合后台计算、数据处理等不需要实时响应的任务。
- 类比： 多个人（多GC线程）一起快速打扫一个房间（GC过程），打扫期间房间里不允许有人（用户线程STW）。
并发 (Concurrent):
- 定义： 指 垃圾收集器线程 与 用户线程 同时执行（不一定是严格的同时，可能交替执行）。
- 关注点： 减少 应用程序的停顿时间。
- 用户线程状态： 在并发GC执行期间的大部分时间里，用户线程可以继续运行。
- 例子： CMS、G1（部分阶段）、ZGC、Shenandoah。它们的核心特点是将耗时操作分散到与用户线程并发执行的阶段。
- 目标： 降低 延迟 (Latency)。即缩短因GC引起的STW时间。适合交互式应用、Web服务等对响应时间敏感的场景。
- 类比： 一个人（GC线程）在房间有人活动（用户线程运行）的情况下进行打扫，尽量不影响房间里的人。

CMS是哪一种？

CMS的名字 Concurrent Mark Sweep 就明确告诉我们，它是一个并发收集器。它的主要工作（并发标记、并发清除）是与用户线程并发执行的。

需要注意：

CMS的初始标记和重新标记阶段虽然需要STW，但也可以是并行的。可以通过 -XX:+CMSParallelInitialMarkEnabled 和 -XX:+CMSParallelRemarkEnabled (后者通常默认开启) 来让这两个STW阶段使用多线程执行，进一步缩短停顿时间。
现代的垃圾收集器（如G1、ZGC）往往 同时利用了并行和并发 的优势。它们既能在STW阶段并行执行，也能在大部分时间里与用户线程并发执行。

总结：

特性	并行 (Parallel)	并发 (Concurrent)
线程关系	多个 GC线程协同工作	GC线程与用户线程同时运行
用户线程	STW (暂停)	大部分时间 Running (运行)
目标	高吞吐量 (Throughput)	低延迟 (Latency)
关注	缩短 GC 时间	缩短应用停顿时间
代表	Parallel Scavenge, Parallel Old	CMS, G1, ZGC, Shenandoah
核心优势	GC效率高	应用停顿少
核心代价	STW时间可能较长	可能牺牲吞吐量、增加CPU开销、实现复杂

5. 三色标记法：CMS并发标记的理论基础

为了在用户线程并发修改对象引用的同时，正确地标记出所有存活对象，CMS（以及G1、ZGC等并发或增量GC）采用了 三色标记（Tri-color Marking） 算法作为理论基础。

三色标记法将垃圾收集器在标记过程中遇到的对象，根据其访问状态，划分为三种颜色：

白色 (White):
- 含义： 对象尚未被垃圾收集器访问过。
- 初始状态： 在标记开始时，所有对象都是白色的。
- 结束状态： 在标记结束后，如果一个对象仍然是白色，意味着它从GC Roots不可达，是垃圾，将被回收。
灰色 (Gray):
- 含义： 对象已经被垃圾收集器访问过，但它的直接引用还没有全部处理完毕（即它的“邻居”还没有全部被扫描）。
- 状态变化： 当一个白色对象被GC Roots直接引用或者被灰色对象引用时，它会变成灰色。当一个灰色对象的所有直接引用都被扫描处理后，它会变成黑色。
- 作用： 灰色对象是标记过程中的中间状态，代表着“待处理”的任务列表。
黑色 (Black):
- 含义： 对象已经被垃圾收集器访问过，并且它的所有直接引用（Field）都已经被扫描处理完毕。
- 保证： 黑色对象代表它本身是存活的，并且从它出发能直接到达的对象也已经被正确处理了（要么变成灰色待处理，要么已经是黑色）。

标记过程：

初始： 所有对象都是白色。
根扫描： 将所有GC Roots直接引用的对象标记为灰色，放入待处理集合。
遍历：
- 从灰色集合中取出一个灰色对象。
- 遍历该灰色对象的所有直接引用：
  - 如果引用指向一个白色对象，将该白色对象标记为灰色，放入待处理集合。
  - 如果引用指向灰色或黑色对象，不做任何处理（因为它们已经被访问或正在处理中）。
- 将当前处理的灰色对象标记为黑色。
重复： 重复步骤3，直到灰色集合为空。
结束： 此时，所有仍然是白色的对象就是不可达的垃圾，可以被回收。所有黑色对象都是存活对象。

可视化理解：

最终状态

处理Obj3, Obj4后

处理Obj2后

处理Obj1后

根扫描后

初始状态

标记

GC Roots

Obj1 黑色

Obj2 黑色

Obj3 黑色

Obj4 黑色

不可达
Obj5 白色

GC Roots

Obj1 黑色

Obj2 黑色

Obj3 黑色

Obj4 黑色

GC Roots

Obj1 黑色

Obj2 黑色

Obj3 灰色

Obj4 灰色

GC Roots

Obj1 黑色

Obj2 灰色

Obj3 灰色

Obj4 白色

GC Roots

Obj1 灰色

Obj2 白色

Obj3 白色

Obj4 白色

GC Roots

Obj1 白色

Obj2 白色

Obj3 白色

Obj4 白色

并发执行带来的问题：

如果三色标记法在严格的STW下单线程执行，是完全正确的。但CMS的并发标记阶段，用户线程和GC线程同时运行，这就可能破坏三色标记法正常工作的前提，导致两种严重错误：

对象消失 (Object Loss) / 漏标 (Missing Mark):
- 场景： 一个黑色对象 A，原本引用着一个白色对象 B。在并发标记过程中：
  1. 用户线程断开了 A 到 B 的引用 (A.ref = null;)。
  2. 同时，用户线程让一个灰色对象 C 新增了到 B 的引用 (C.ref = B;)。
  3. 但是，GC线程此时已经 扫描完 了 A（A已经是黑色），并且 还没来得及 扫描 C（C还是灰色）。
- 后果： 当GC线程后续扫描完 C 时，它可能不会再回头看 B（具体取决于实现策略）。最终，对象 B 虽然是存活的（被 C 引用），但没有被任何黑色或灰色对象直接引用扫描到，它仍然是白色的，最终被错误地当成垃圾回收了。这是 绝对不能接受 的错误！
- 发生的条件（同时满足）：
  - 赋值器（用户线程）插入了一条或多条从黑色对象到白色对象的新引用。
  - 赋值器删除了所有从灰色对象到该白色对象的直接或间接引用。
浮动垃圾 (Floating Garbage):
- 场景： 一个已经被标记为灰色或黑色的对象，在并发标记或并发清除阶段，被用户线程断开了所有引用，变成了垃圾。
- 后果： 由于它已经被标记为“存活”（非白色），本轮GC不会回收它。它成为了“浮动垃圾”，只能等待下一轮GC。这虽然 不影响正确性，但会 降低内存利用率。

CMS必须解决“对象消失”这个致命问题，同时尽量减少“浮动垃圾”。它主要通过 写屏障（Write Barrier） 和 增量更新（Incremental Update） 技术来实现这一点。

6. 写屏障与增量更新：并发标记的救星

为了解决三色标记在并发环境下可能出现的“对象消失”问题，CMS 引入了 写屏障（Write Barrier） 和 增量更新（Incremental Update） 机制。

6.1. 写屏障 (Write Barrier)

什么是写屏障？

写屏障不是硬件层面的内存屏障（Memory Barrier），而是JVM层面的一种 代码注入技术。当JVM在编译Java代码时，如果发现代码执行的是 引用类型字段的赋值操作（例如 obj.field = someOtherObj;），它会在这个赋值操作的前后插入一些额外的、特殊的处理代码。这些被插入的代码就称为“写屏障”。

写屏障的作用？

它的核心作用是 拦截或记录 用户线程对对象引用关系的修改。就像在每个对象引用赋值的地方安插了一个“监视器”，一旦发生修改，就触发特定的动作，通知GC系统。

写屏障的种类：

写前屏障 (Pre-Write Barrier): 在 赋值发生之前 执行。它通常关注的是“即将失去的引用”，比如记录下 obj.field 原本指向的对象。
写后屏障 (Post-Write Barrier): 在 赋值发生之后 执行。它通常关注的是“新建立的引用”，比如记录下 obj.field 现在指向了 someOtherObj。

CMS的选择：

不同的并发GC策略会使用不同的写屏障组合。CMS为了解决漏标问题，主要依赖 写后屏障 配合 增量更新 策略。

伪代码示例（写后屏障）：

// 原始代码
// obj.field = newValue;

// JVM 加入写屏障后的伪代码 (Post-Write Barrier)
void setField(Object obj, Field field, Object newValue) {
    // <--- 写屏障开始 --->
    // 记录下引用变化的信息，供GC后续处理
    // 例如，如果 obj 是黑色，newValue 是白色，
    // 可能需要将 obj 重新标记为灰色，或者记录下这个 (obj, newValue) 的关系
    postWriteBarrier(obj, field, newValue);
    // <--- 写屏障结束 --->

    // 执行原始的赋值操作
    obj.field = newValue;
}

// 写屏障的具体实现 (伪代码)
void postWriteBarrier(Object obj, Field field, Object newValue) {
    // 判断是否满足特定条件 (例如：破坏了三色标记的不变性)
    if (isBlack(obj) && isWhite(newValue)) {
        // 执行增量更新逻辑
        incrementalUpdate(obj, newValue);
    }
}

6.2. 增量更新 (Incremental Update)

增量更新是CMS用来 解决漏标（对象消失） 问题所采用的具体策略。它关注的是 黑色对象指向白色对象 这种情况的发生。

核心思想：

当一个黑色对象 A 新增了对一个白色对象 B 的引用时 (A.ref = B;)，为了防止 B 被漏标，增量更新策略会通过写屏障捕捉到这个事件，并采取措施记录下这个变化。

具体做法：

当写屏障检测到 isBlack(A) && isWhite(B) 的情况时，它不会立即把 B 变成灰色（因为并发访问灰色集合也可能存在问题），而是将 A 重新标记回灰色，或者更常见的是，将这个 新增的引用关系 (A, B) 记录在一个 专门的、需要额外扫描的列表 中。

为什么叫“增量”更新？

因为它只关注并发标记过程中新增的黑色到白色的引用关系。它假设在标记开始时建立的对象图快照是基础，然后只处理后续发生的“增量”变化。

重新标记阶段的作用：

在 重新标记（Remark） 这个STW阶段，GC线程会：

暂停所有用户线程。
处理在并发标记期间，由增量更新机制记录下来的所有 引用变化信息（比如那个专门的列表）。
从这些记录出发，重新扫描受影响的对象，确保所有可达对象最终都被正确标记（变成黑色）。

伪代码示例（增量更新逻辑）：

// 增量更新记录列表
List<ReferenceChange> incrementalUpdates = new CopyOnWriteArrayList<>(); // 线程安全列表

// 写屏障中的增量更新实现
void incrementalUpdate(Object blackObj, Object whiteObj) {
    // 记录下这个新增的引用关系
    // 注意：这里只是示意，实际实现会更复杂和高效
    incrementalUpdates.add(new ReferenceChange(blackObj, whiteObj));
    // 或者，更简单的做法可能是将 blackObj 重新标记为灰色
    // markGray(blackObj); // 但CMS主要采用记录方式
}

// 重新标记阶段的处理逻辑 (伪代码)
void remarkPhase() {
    stopTheWorld(); // STW

    // 处理增量更新记录
    for (ReferenceChange change : incrementalUpdates) {
        Object source = change.getSource();
        Object target = change.getTarget();
        if (isBlack(source) && isWhite(target)) {
            // 从 source 开始重新扫描，确保 target 及其可达对象被标记
            scanObject(source); // 或者直接标记 target 为灰色 scanObject(target)
        }
    }
    incrementalUpdates.clear(); // 清空记录

    // ... 其他重新标记逻辑 (如处理卡表) ...

    resumeTheWorld(); // 恢复用户线程
}

与SATB的区别（简单提一下）：

G1垃圾收集器采用的是另一种叫做 SATB（Snapshot-At-The-Beginning） 的策略。SATB关注的是删除的引用。它通过 写前屏障 记录下那些 即将被删除 的从灰色/黑色对象到白色对象的引用。即使这个引用后来真的被用户线程删除了，SATB也会认为这个白色对象在标记开始时的那个“快照”中是存活的，从而在本轮GC中保留它。SATB能更好地处理浮动垃圾，但实现也更复杂。

总结： CMS通过写后屏障捕捉引用赋值操作，利用增量更新策略记录下并发标记期间黑色对象新增对白色对象的引用，最后在重新标记STW阶段统一处理这些记录，从而保证了并发标记的正确性，防止了“对象消失”的致命错误。

6.3. 卡表 (Card Table)：优化重新标记

虽然增量更新解决了正确性问题，但如果在重新标记阶段需要扫描所有记录下来的对象以及它们引用的对象，开销仍然可能很大。为了进一步 优化重新标记阶段的扫描范围，CMS（以及很多现代GC）引入了 卡表（Card Table） 机制。
换句话说:
卡表（Card Table）是实现增量更新（Incremental Update）策略的一种高效的技术手段，它优化了“记录修改”这个环节。
增量更新的目标：是为了解决并发标记中“黑色对象引用了新的白色对象，但GC没发现”的问题。它要求GC必须记录下那些在并发标记期间被修改过的、可能指向新对象的“黑色对象”（或更简单地说，记录下发生过引用写入的区域）。
如何记录？

最精确但可能最慢的方式：记录下每一个发生这种“黑指向白”赋值操作的对象地址。这需要在写屏障里做很多判断和记录，开销可能很大。
卡表的方式（更优化的方式）：不记录精确的对象，而是记录一个粗粒度的区域（卡页）。只要卡页内的任何一个对象的引用字段被修改了（通常简化为只要有引用写入就标记），就把这个卡页标记为“脏”。
卡表的优化体现在哪里？
写屏障开销小：标记一个字节（卡表项）非常快，比精确记录对象和判断颜色/代等复杂逻辑要高效得多，对应用程序的吞吐量影响更小。
空间效率高：只需要 HeapSize / CardSize 的额外空间，比存储大量对象指针要节省得多。

所以，不是说先有了一个“增量更新”的抽象算法，然后卡表来优化它。
而是：
为了实现“增量更新”这个策略（即在并发标记后重新检查被修改过的区域），需要一种记录修改的方法。
卡表提供了一种非常高效、低开销的记录方法。它用空间换时间（可能标记了一些不需要的区域），但极大地降低了在应用程序运行时（写屏障触发时）的性能损耗。

什么是卡表？

卡表是一个 位图（Bitmap） 或 字节数组，它将整个 堆内存（尤其是老年代）划分成固定大小的 卡页（Card Page）。卡页的大小通常是 2 的幂次方，例如 512 字节。卡表中的每一个元素（一个比特位或一个字节）就对应堆内存中的一个卡页。

卡表的作用？

卡表用来标记哪些卡页可能包含了 指向其他区域（尤其是新生代指向老年代，或者在CMS并发标记中，老年代内部）的引用，或者更简单地说，标记哪些卡页 “变脏”（Dirty） 了。

写屏障与卡表的联动：

当写屏障检测到一次 跨代引用（新生代对象引用老年代对象，这在Young GC时很重要）或者在CMS并发标记中检测到 老年代内部引用发生变化 时，它除了执行增量更新逻辑（如果需要），还会做一个非常快速的操作：将引用发生地所在的那个卡页，在卡表中对应的标记位/字节，设置为“脏”状态。

伪代码示例（写屏障更新卡表）：

// 假设 Card Table 是一个字节数组
byte[] cardTable = ...;
final int CARD_SHIFT = 9; // 卡页大小为 2^9 = 512 字节
final byte DIRTY_CARD = 0; // 脏标记

// JVM 加入写屏障后的伪代码 (Post-Write Barrier with Card Table)
void setField(Object obj, Field field, Object newValue) {
    // ... 增量更新逻辑 ...
    postWriteBarrier(obj, field, newValue);

    // <--- 更新卡表 --->
    // 计算 obj 对象所在的卡页索引
    long objAddress = getAddress(obj);
    int cardIndex = (int)(objAddress >>> CARD_SHIFT);
    // 将对应的卡表项标记为脏
    // 这里用字节数组示例，实际可能是位操作
    if (cardTable[cardIndex] != DIRTY_CARD) {
        cardTable[cardIndex] = DIRTY_CARD;
    }
    // <--- 卡表更新结束 --->

    // 执行原始的赋值操作
    obj.field = newValue;
}

重新标记阶段如何利用卡表？

在 重新标记（Remark） STW阶段，GC线程不再需要扫描整个老年代来查找可能存在的引用变化。它们只需要：

扫描卡表，找到所有被标记为“脏”的卡页。
只扫描那些“脏”卡页内的对象，查找它们是否有指向白色对象的引用，并进行相应的标记处理（结合增量更新记录的信息）。

这极大地缩小了重新标记阶段需要扫描的范围，从而显著缩短了STW时间。

总结： 卡表通过空间换时间的方式，用一个额外的位图/字节数组记录了内存区域的“脏”状态。写屏障在修改引用时快速标记对应的卡页，使得重新标记阶段只需扫描脏页，大大提高了效率。

CMS并发标记的完整保障机制：

三色标记（理论基础）+ 写屏障（监测变化）+ 增量更新（处理新增引用，保正确性）+ 卡表（记录脏区，提效率）= CMS并发标记的组合拳。

7. CMS 的核心痛点详解

我们在前面提到了CMS的几个主要缺点，现在我们来更深入地探讨它们，特别是并发失败、内存碎片和浮动垃圾这三大痛点。

7.1. 并发失败 (Concurrent Mode Failure)

这是使用CMS时最需要关注和尽量避免的问题，因为它会导致长时间的STW。

复习：为什么会发生？

CMS的并发回收（标记、清除）需要时间。如果在GC线程完成回收之前，用户线程持续快速地分配内存（包括Young GC晋升的对象和直接在老年代分配的大对象），导致老年代空间不足以容纳新的对象，就会触发并发失败。本质上是 回收速度跟不上分配速度。

导致并发失败的具体场景：

Young GC 晋升失败： Young GC后，存活对象需要晋升到老年代，但此时老年代剩余空间（即使CMS正在并发回收）不足以容纳这些对象。
并发分配大对象失败： 用户线程尝试在老年代直接分配一个大对象，但由于内存碎片或者并发回收尚未释放足够连续空间，导致分配失败。
预留空间不足： -XX:CMSInitiatingOccupancyFraction 设置过高，或者应用内存增长模式突变，导致CMS启动回收时，剩余空间不足以支撑到并发回收完成。

后果：

JVM会停止所有用户线程（STW），然后调用 Serial Old 收集器（一个单线程、标记-整理算法的收集器）来对整个老年代进行垃圾回收，包括内存整理。这个过程非常缓慢，STW时间可能长达数秒甚至更久。

如何调优避免？

调优的核心思路是：让CMS尽早开始回收，或者让回收过程更快，或者减少内存分配压力。

降低触发阈值： 调低 -XX:CMSInitiatingOccupancyFraction=N 的值（N是百分比，例如60-80），让CMS在老年代占用率达到N%时就提前开始回收，预留更多的时间和空间。这是 最常用 的调优手段。需要根据应用的内存增长速率和GC日志来找到一个合适的值。太低会增加GC频率，太高则容易并发失败。
增加并发回收线程数： 通过 -XX:ConcGCThreads=N 适当增加并发标记和并发清除的线程数（如果CPU资源允许），加快回收速度。但线程过多也会增加CPU开销。
减少内存碎片：
- 开启Full GC时的压缩：-XX:+UseCMSCompactAtFullCollection (默认开启)。
- 调整压缩频率：-XX:CMSFullGCsBeforeCompaction=N。如果并发失败频繁且主要是由碎片引起，可以考虑设置为0，让每次后备的Full GC都进行压缩，但这会增加Full GC的STW时间。更理想的是通过其他方式减少大对象的产生或优化对象生命周期。
优化应用内存使用：
- 减少大对象的分配。
- 优化对象生命周期，避免大量对象集中晋升到老年代。
- 检查是否存在内存泄漏。
增大老年代空间： 如果物理内存允许，直接增大老年代的总大小 (-Xmx, -Xms 配合调整新生代比例 -XX:NewRatio 或大小 -Xmn)，可以给CMS更多缓冲空间。
在Remark前触发Young GC： 使用 -XX:+CMSScavengeBeforeRemark。在重新标记（STW）之前，先进行一次Young GC。这样做的好处是：
- 减少老年代的对象数量（一些短期对象被回收）。
- 减少重新标记阶段需要扫描的新生代对象（因为引用关系更少了）。
- 可以略微缩短Remark的STW时间，并可能减少并发阶段的引用变化。

监控： 密切关注GC日志，查找 “Concurrent Mode Failure” 或 “promotion failed” 关键字，分析失败前后的内存使用情况和GC活动。

7.2. 内存碎片 (Memory Fragmentation)

这是CMS采用标记-清除算法带来的先天不足。

复习：为什么会产生？

标记-清除算法只回收死亡对象占用的空间，但不移动存活对象。回收后，内存中会留下许多不连续的小块空闲区域。

影响：

大对象分配困难： 最直接的影响是，当需要分配一个较大的连续内存块时（比如一个大数组或大对象），即使总的空闲内存很多，也可能找不到足够大的连续空间，导致分配失败。
提前触发Full GC： 当碎片严重到无法满足正常分配（尤其是大对象分配）时，即使老年代整体占用率不高，JVM也可能被迫触发一次带压缩的Full GC（使用Serial Old或配置了压缩的CMS Full GC），导致长时间STW。

CMS的应对措施：

CMS本身 不直接 解决并发清除阶段的碎片问题。它依赖于：

Full GC时的整理： 通过 -XX:+UseCMSCompactAtFullCollection 和 -XX:CMSFullGCsBeforeCompaction 参数，在发生Full GC（包括并发失败后的Full GC）时进行内存整理。但这本身就是一种“亡羊补牢”，且会带来STW。
寄希望于分配策略： JVM的内存分配器（如TLAB - Thread Local Allocation Buffer）会尽量在现有的小块碎片中进行分配，但这无法根本解决大对象分配问题。

根本性解决：

真正能较好解决碎片问题的GC算法是 标记-复制（Mark-Copy） 和 标记-整理（Mark-Compact）。这也是为什么后续的G1、ZGC等收集器都采用了不同的策略（如G1的分区复制、ZGC的指针染色与重定位）来避免或处理碎片问题。

7.3. 浮动垃圾 (Floating Garbage)

复习：为什么会产生？

在CMS并发标记阶段之后、并发清除阶段完成之前，如果用户线程使得某个原本被标记为存活的对象变成了垃圾（断开了所有引用），CMS在本轮GC中无法回收它。

影响：

内存利用率下降： 这部分垃圾对象继续占用内存，直到下一次GC才能被回收。
需要预留空间： CMS需要预留一部分空间来容纳这些潜在的浮动垃圾，进一步增加了 -XX:CMSInitiatingOccupancyFraction 提前触发回收的必要性。
可能增加GC频率： 如果浮动垃圾积累过多，可能导致老年代更快达到触发阈值。

能否解决？

CMS的增量更新机制无法解决浮动垃圾问题（它主要解决漏标）。SATB策略（如G1使用）能更好地处理浮动垃圾（因为它基于快照，快照中存活的对象即使后来变垃圾了也会保留到本轮结束），但CMS没有采用。

对于CMS来说，浮动垃圾是其并发设计所必须接受的一个副作用。只能通过合理配置 -XX:CMSInitiatingOccupancyFraction 来为其预留足够的空间。

总结： CMS的这三大痛点——并发失败的风险、内存碎片的积累、浮动垃圾的存在——是其设计上的固有局限。现代GC如G1、ZGC等都在尝试用更先进的技术来克服这些问题。

8. CMS 适用场景与被取代的原因

8.1. 何时考虑使用 CMS？

在CMS还盛行的年代（大约在JDK 6、7、8时期），判断是否使用CMS主要基于以下考量：

应用对延迟的敏感度极高： 这是选择CMS的最主要原因。如果你的应用无法容忍几十毫秒以上的STW停顿，例如：
- 需要快速响应用户请求的Web服务器。
- 实时交易系统、金融报价系统。
- DNS服务器、电信网关。
- 对交互体验要求高的桌面应用。
服务器CPU资源充足： CMS并发阶段需要额外的CPU资源。如果服务器是多核（例如4核及以上），能够承受GC线程带来的额外开销而不至于严重影响应用吞吐量。
内存分配速率不是极端快： 如果应用内存分配速率非常惊人，导致CMS回收速度跟不上，频繁触发Concurrent Mode Failure，那么CMS可能不是好的选择。
对内存碎片有一定容忍度： 如果应用主要是分配中小对象，或者大对象分配不频繁，或者能够接受偶尔由碎片整理带来的Full GC停顿，那么碎片问题可能不构成主要障碍。
堆内存大小适中： CMS在处理超大堆（几十GB甚至上百GB）时，其并发标记和清除时间会相应变长，重新标记阶段的STW也可能变得不可忽视。虽然可以通过调优缓解，但对于非常大的堆，G1通常表现更好。

简单来说： 如果我们的首要目标是 低延迟，并且愿意牺牲一定的 吞吐量 和 内存空间，同时有足够的 CPU资源，那么CMS在当时是一个不错的选择。

8.2. 为什么 CMS 被废弃和移除？

随着技术的发展和更优秀替代品的出现，CMS逐渐暴露出的缺点和维护成本使其最终被淘汰。主要原因包括：

标记-清除算法的固有缺陷（内存碎片）： 内存碎片问题是CMS的硬伤，长期运行可能导致性能瓶颈或频繁的Full GC，需要复杂的调优和碎片整理策略，而碎片整理本身又会带来STW。
并发失败问题难以根治： Concurrent Mode Failure的风险始终存在，一旦发生，其带来的长STW惩罚非常严重，使得CMS的低延迟优势变得不稳定。调优复杂且依赖经验。
对CPU资源消耗较大： 在CPU资源本就紧张的场景下，CMS对吞吐量的影响比较明显。
浮动垃圾导致内存利用率低： 需要预留较多内存，实际可用堆空间小于预期。
实现复杂，维护成本高： CMS内部涉及大量复杂的并发控制和同步机制，对于JVM开发团队来说，维护和持续优化它的成本很高。
G1等更优秀的替代品出现：
- G1 (Garbage-First) 收集器 的出现是CMS被取代的关键因素。G1的设计目标之一就是取代CMS，它：
  - 采用了区域化（Region） 的堆内存布局，化整为零。
  - 引入了可预测的停顿时间模型 (-XX:MaxGCPauseMillis)，用户可以设定期望的最大停顿时间。
  - 使用了标记-复制（在Young GC和Mixed GC的部分阶段）和标记-整理（在Full GC时）算法，从根本上解决了内存碎片问题。
  - 通过优先回收价值最高（垃圾最多）的区域 (Garbage First) 来提高回收效率。
  - 兼具并发和并行特性。
- 后续的 ZGC 和 Shenandoah 更是将低延迟做到了极致（目标停顿在毫秒甚至亚毫秒级），虽然它们的应用场景和成熟度还在发展中。

结论： G1在解决了CMS核心痛点（碎片、并发失败可控性、可预测停顿）的同时，提供了相当不错的性能表现，并且配置相对更简单，成为了JDK 9及以后版本的默认垃圾收集器。这使得CMS的历史使命基本完成，被废弃和移除也就顺理成章了。

9. 总结：CMS 的历史价值

CMS作为第一款真正意义上的并发垃圾收集器，在JVM发展史上具有里程碑式的意义。它首次将“低延迟”作为核心设计目标，并通过创新的并发标记和并发清除技术，极大地改善了对响应时间敏感的应用的用户体验。

虽然CMS因为其固有的设计缺陷（内存碎片、并发失败风险、CPU消耗）以及更优秀的替代者（G1、ZGC等）的出现而被逐渐淘汰，但学习和理解CMS的工作原理仍然非常有价值：

理解GC的演进： CMS是理解G1、ZGC等现代并发GC设计思想的重要基础。很多现代GC的技术，如三色标记、写屏障、卡表等，都是在CMS或更早的GC探索中逐步发展和完善起来的。
深入JVM内存管理： 掌握CMS有助于更深入地理解JVM如何管理内存、如何平衡吞吐量与延迟、并发GC面临的挑战以及解决这些挑战的技术手段。
遗留系统维护： 在一些尚未升级JDK版本的旧系统中，可能仍然在使用CMS。理解其原理有助于对这些系统进行问题排查和性能调优。

CMS就像一位开创了新道路但自身并非完美的先行人。它证明了并发垃圾收集的可行性，为后续更先进、更完善的垃圾收集器的诞生铺平了道路。

你可能感兴趣的:(JVM,jvm)

并发编程——并发基础：守护线程和非守护线程 zlj1217 并发编程 java 后台线程守护线程并发基础
前言最近在复习的时候，发现一个运行线程池拒绝策略demo中的main方法在运行了之后，进程并没有关闭。看了jconsole线程池中的线程都处于waiting状态。这里是跟我设置线程池的线程工厂中的设置线程是否为后台线程有关。后台线程和非后台线程后台线程，也叫守护线程，指的是在程序运行的时候后台提供一种通用服务的线程，比如jvm里垃圾回收线程，这种线程并不属于程序中不可或缺的部分。因此，当所有的非守
黑马JVM解析笔记（六）：深入理解JVM类加载机制与运行时优化 null不是我干的 JVM jvm 笔记
1.JVM类加载类加载是Java虚拟机将描述类.class文件加载到内存，并对数据进行校验、转换解析和初始化，最终形成可以被JVM直接使用的Java类型的过程。核心阶段：加载—>连接—>初始化1.1加载，以jdk1.8为例类加载器先把Person.class字节码解析为InstanceKlass（底层是c++）结构，存放一些关键信息和对象的引用，生命周期与类加载器相同（类卸载时才释放）然后就是把新
jvm gc合适时间
1.yongGC执行时间小于或者等于50ms执行频率大于或者等于10s每次2.FullGC执行时间小于或者等于1s执行频率大于或者等于10分钟下面给一个比较粗的参考：YongGC执行的很快：小于50msYongGC执行的并不频繁：大概10s执行一次FullGC执行的很快：小于1sFullGC执行的并不频繁：10分钟执行一次
JVM调优实战 Day 9：JVM堆转储分析在未来等你 JVM调优实战 JVM Java 性能优化调优虚拟机
【JVM调优实战Day9】JVM堆转储分析文章内容开篇：Day9——JVM堆转储分析的核心价值在“JVM调优实战”系列的第9天，我们聚焦于JVM堆转储分析（HeapDumpAnalysis）。这是JVM性能诊断和内存问题排查的重要手段之一，尤其适用于解决内存泄漏、内存溢出、对象分布异常等问题。本节将详细介绍堆转储的基本概念、生成方式、分析工具及实际应用案例。通过本节的学习，读者可以掌握如何利用jm
互联网大厂Java面试实战：严肃面试官与搞笑谢飞机的三轮提问 Fu Dun Yao Java场景面试宝典 Java 面试 JUC JVM 多线程线程池 HashMap
互联网大厂Java面试实战：严肃面试官与搞笑谢飞机的三轮提问本文通过一个面试故事，展示了互联网大厂Java求职者与严肃面试官的对话。面试官就Java核心技术、JUC、JVM、多线程、线程池、HashMap、ArrayList、Spring及相关框架、分布式技术、消息队列、中间件、数据库、Linux、Docker、设计模式及DDD等多个技术点，分三轮提问。求职者谢飞机偶尔能准确回答简单问题获得认可，
Reactor框架介绍，和使用示例
Reactor框架介绍Reactor是一个基于JVM的非阻塞响应式编程框架，遵循ReactiveStreams规范，专为构建高并发、低延迟的异步应用设计[2][4]。其核心特点包括：异步流处理提供Flux（处理0或N个元素）和Mono（处理0或1个元素）两个核心抽象，支持链式操作（如map、filter、flatMap等）实现数据的异步处理[5][4]。背压支持通过ReactiveStreams协
Netty堆内存字节缓冲区深度解析 lifallen Netty java 后端 nio 开发语言算法
UnpooledHeapByteBufUnpooledHeapByteBuf是Netty中基于堆内存（JVM堆）的非池化字节缓冲区实现。它直接使用Java的byte[]数组作为底层存储，适用于常规的JVM堆内存分配场景。核心特点如下：非池化设计：每次分配都会创建新的字节数组，不涉及对象复用。堆内存存储：数据存储在JVM堆上，受GC管理。引用计数：继承AbstractReferenceCounted
Ehcache、Caffeine、Spring Cache、Redis、J2Cache、Memcached 和 Guava Cache 的主要区别 MonkeyKing.sun spring redis memcached
主流缓存技术Ehcache、Caffeine、SpringCache、Redis、J2Cache、Memcached和GuavaCache的主要区别，涵盖其架构、功能、适用场景和优缺点等方面：Ehcache类型:本地缓存（JVM内存缓存）特点:轻量级，运行在JVM内部，易于集成到Java应用中。支持堆内、堆外和磁盘缓存，适合处理中小型数据集。提供丰富的缓存配置，如TTL（生存时间）、TTI（空闲时
探索Java性能优化的利器：Java Microbenchmark Harness（JMH）柯茵沙
探索Java性能优化的利器：JavaMicrobenchmarkHarness（JMH）jmhhttps://openjdk.org/projects/code-tools/jmh项目地址:https://gitcode.com/gh_mirrors/jm/jmhJavaMicrobenchmarkHarness（简称JMH）是一个用于构建、运行和分析Java以及其他在JVM上运行的语言的微基准测
Google Guava Cache高效本地缓存 boonya 架构师 Guava 高效缓存策略
目录GuavaCache使用需求和场景需求场景缓存设置缓存的并发级别缓存的初始容量设置设置最大存储缓存清除策略基于存活时间的清除策略基于容量的清除策略基于权重的清除策略显式清除基于引用的清除策略数据内存加载CacheLoadingCacheGuavaCache使用需求和场景GuavaCache是GoogleFuava中的一个内存缓存模块，用于将数据缓存到JVM内存中。需求提供了get、put封装操
JMH (Java Microbenchmark Harness) 阙芸 python 测试工具开发语言
JMH是Java的微基准测试工具，由OpenJDK团队开发，专门用于编写、运行和分析Java代码的微基准测试（microbenchmark）。为什么需要JMH普通的基准测试方法（如多次循环调用方法并计时）存在很多问题：JVM的JIT编译优化（方法内联、死代码消除等）预热效应（JVM需要"热身"才能达到最佳性能）垃圾回收的干扰操作系统调度的影响JMH解决了这些问题，提供了准确的基准测试环境。基本使用
Java注解的实现原理 empti_ Java基础 java
Java注解的实现原理Java注解的实现涉及Java语言规范、编译器处理和JVM支持等多个层面。下面我将详细解释注解在Java中的实现机制。一、注解的本质注解本质上是一种特殊的接口，所有注解类型都隐式继承自java.lang.annotation.Annotation接口。当你定义一个注解时：public@interfaceMyAnnotation{Stringvalue();}编译器实际上会生成
JVM(9)——详解Serial垃圾回收器十六点五 jvm java 开发语言后端
Serial垃圾回收器是JVM最古老、最基础、最简单的垃圾回收器，也是理解其他更复杂回收器的基础。一、Serial回收器的定位与设计目标核心特点：单线程(Single-Threaded)这是Serial回收器最根本的特征。无论是进行垃圾标记(Marking)、清除(Sweeping)、复制(Copying)还是整理(Compacting)，它都只使用一个单独的线程来执行所有垃圾回收工作。工作模式：
Java底层原理：深入理解JVM内存模型与线程安全代码老y java 开发语言 jvm
一、JVM内存模型（JMM）JVM内存模型（JMM）是Java语言规范中定义的内存模型，它描述了Java程序中的变量存储在内存中的方式以及线程如何访问这些变量。JMM是Java并发编程的基础，理解它可以帮助我们更好地理解和解决线程安全问题。（一）JMM的基本概念主内存（MainMemory）主内存是所有线程共享的内存区域，存储了Java程序中的所有变量。主内存中的变量可以被所有线程访问和修改。工作
Java底层原理：深入理解JVM类加载机制与反射机制代码老y java jvm 开发语言
一、JVM类加载机制JVM类加载机制是Java运行时环境的重要组成部分，它负责将字节码文件加载到JVM内存中，并将其转换为可执行的类。类加载机制的实现涉及类加载器（ClassLoader）、类加载过程和类加载器的层次结构。（一）类加载器（ClassLoader）类加载器是Java类加载机制的核心组件，它负责加载字节码文件并将其转换为JVM能够识别的类。Java提供了三种内置的类加载器：启动类加载器
单例设计模式详解 Code溪 Java 设计模式
单例模式：懒汉式vs饿汉式单例模式是Java中最常用的设计模式之一，确保一个类只有一个实例，并提供全局访问点。其中懒汉式和饿汉式是两种最基础的实现方式，各有特点和适用场景。一、饿汉式（EagerInitialization）1.核心特点立即加载：在类加载时就创建实例线程安全：由JVM类加载机制保证线程安全资源利用率：可能造成资源浪费（如果实例未被使用）2.标准实现publicclassEagerS
自学Java怎么入门 Java鼠鼠吖 java 开发语言
自学Java其实没有想象中那么难，只要找对方法，循序渐进地学习，很快就能上手。下面我结合自己的经验，给你整理一条清晰的学习路径，咱们一步步来。一、先了解Java能做什么在开始之前，建议你先看看Java都能用在哪些地方。比如开发企业级系统、Android应用、大数据处理等等。这样你就能明白为什么要学它，也更有动力。Java最大的特点就是"一次编写，到处运行"，这要归功于JVM虚拟机。二、准备好学习环
Kotlin中的函数类型及扩展函数介绍：扩展函数,扩展属性,函数接收者,带有接收者的函数类型 Huang兄 kotlin
继续kotlin的学习，之前只是学了点皮毛中的皮毛，会了一些简单语法而已。最后面列了一个大纲，认真的学习一下。今天的内容是扩展。gradle：8.5，插件：id‘org.jetbrains.kotlin.jvm’version‘1.9.23’简介和使用kotlin中扩展可以给已有的类添加额外的方法和属性，看起来就像是修改了类的源码一样，而不是像java一样需要继承该类然后添加自己的方法。扩展又分为
黑马JVM解析笔记（一）：内存结构 null不是我干的 JVM jvm 笔记 java
1.一个JAVA对象在JVM执行的流程可以用这张图来描述：首先java对象通过ClassLoader被加载进内存然后就是到了JVM内部的结构，主要是将java类信息存储到JVM中的各个区域：方法区：存储类级别的信息，包括静态变量、方法数据和常量池等堆：存储对象实例和数组，动态的创建并管理对象的内存区域JVM栈：存储线程的栈帧，栈帧中包含了方法的调用的局部变量和部分结果程序计数器：存储当前正在执行的
Java虚拟机栈（JVM Stack）详解与工作流程分析 empti_ Java基础 java jvm
Java虚拟机栈（JVMStack）详解与工作流程分析1.虚拟机栈核心概念基本特性线程私有：每个线程在创建时都会分配一个独立的栈存储内容：栈帧（StackFrame）：每个方法调用对应一个栈帧生命周期：与线程相同，线程结束时栈被销毁异常情况：StackOverflowError：栈深度超过限制（如无限递归）OutOfMemoryError：线程过多导致栈内存耗尽2.栈帧（StackFrame）结构
Java引用类型String源码解析骆驼整理说 Java基础 java 开发语言
目录概述final关键字String类常用方法String常用方法源码String长度限制Java引用类型大致包括类、接口类型、数组类型、枚举类型、注解类型、字符串型。String类型就是引用类型。概述JVM运行时会分配一块空间给String，字符串的分配和其他对象分配一样，需要消耗高昂的时间和空间，JVM为了提高性能和减少内存的开销，在实例化字符串的时候进行了一些优化，使用字符串常量池，创建字符
JVM(7)——详解标记-整理算法十六点五 java jvm 开发语言后端
核心思想标记-整理算法同样分为两个主要阶段，但第二个阶段有所不同：标记阶段：与标记-清除算法完全一致。遍历所有可达对象（从GCRoots开始），标记它们为“存活”。整理阶段：不再简单地清除垃圾对象，而是将所有存活的对象向内存空间的一端（通常是起始地址或结束地址）移动，紧凑排列。移动完成后，边界之外的内存空间全部被视为空闲空间，可以一次性分配。算法步骤详解暂停应用程序线程：同样需要“Stop-The
用Linux命令排查Java问题
在Linux环境下，我们有诸多命令和工具来帮助我们解决Java应用的问题。这些问题可能包括性能瓶颈，内存泄漏，线程阻塞，垃圾回收问题等。下面将主要介绍一些实用的Linux命令和使用方法，来帮助我们排查Java问题。首先，我们要认识到的是，Java应用是运行在JVM上的。换句话说，对于Java应用的问题，我们往往需要通过理解JVM的运行状态来进行分析和诊断。（1）使用jps命令查看Java进程：jp
《深入理解Java虚拟机》Java虚拟机内存区域与内存溢出异常全栈追梦人 #深入理解Java虚拟机 java 开发语言
在学习Java的过程中，了解Java虚拟机（JVM）的内存管理机制是至关重要的。特别是在处理大型项目或复杂应用时，对JVM内存区域的深入理解能够帮助我们更好地优化代码，避免内存泄漏和内存溢出等问题。一、Java内存区域概览Java虚拟机在执行Java程序时，会将其管理的内存划分为几个不同的区域，每个区域都有其特定的功能和作用。方法区（MethodArea）方法区是JVM存储已被虚拟机加载的类信息、
Java继承关系中的内存分配居然我是萝卜 java
在Java继承关系中，内存分配与类的加载、对象创建过程紧密相关，核心逻辑如下：一、类加载阶段的内存布局1.静态区域分配（方法区）-父类和子类的静态变量（static）、静态代码块、类元数据（Class对象）会被加载到JVM的方法区（JDK8后为元空间）。-顺序：先加载父类静态成员，再加载子类静态成员。-示例：classParent{static{System.out.println("父类静态代码
Java SPI机制使用及实际案例分析不会先飞的笨鸟 springboot学习 java jvm
JavaSPI机制应用场景及案例分析前言一、什么是SPI机制？二、实现方式及使用场景1.接口全限定文件名方式使用场景一：结合场景一分析：2.spring.factories方式使用场景二结合场景二分析：总结前言在之前的JVM分析系列之类加载提到过JavaSPI机制，主要是类加载器反双亲委派的实现（第三方包不在指定jdk路径，一般类加载器无法加载，需要特殊的ContextClassLoader加载以
JVM探秘之旅：从class文件到垃圾回收的魔法世界 zhysunny Java那些事 jvm java
目录第一章：垃圾回收算法进化史JDK7时代：SerialGC（老式吸尘器）JDK8默认：ParallelGC（多线程清洁队）✈️JDK11+新宠：G1GC（智能分拣机器人）JDK12+实验品：Shenandoah（低延迟特工）⚡JDK15+新贵：ZGC（太空时代科技）第二章：GC算法原理实验室1.标记-清除（Mark-Sweep）2.标记-整理（Mark-Compact）3.复制算法（Copyin
JAVA基础| 反射 2301_79433391 开发语言 java jvm
目录1、反射定义2、class类class类的本质JVM对class的加载Class实例与class的关系获取Class实例的方法Class实例比较与instanceof的区别通过Class实例获取基本信息通过Class实例创建对象3、访问字段、调用方法访问字段调用方法4、调用构造方法、获取继承关系调用构造方法获取继承关系5、小结1、反射定义在Java中，只有JVM能创建Class实例，我们自己的
java全家桶之35: jvm如何调优 leijmdas java
JVM调优指南：提升性能与稳定性JVM调优是Java应用性能优化的关键环节，合理的调优可以显著提高应用吞吐量、降低延迟并减少资源消耗。以下是系统的JVM调优方法和实践：一、调优基础准备监控先行使用工具收集基线数据：jstat-监控GC情况jstack-分析线程堆栈jmap-内存分析VisualVM/Arthas-可视化监控Prometheus+Grafana-生产级监控确定优化目标吞吐量优先（批处
JVM专题#JVM内存参数设置 ❀顾 jvm
JVM内存参数设置元空间参数（方法区）-XX：MaxMetaspaceSize：设置元空间最大值，默认是-1，即不限制，或者说只受限于本地内存大小-XX：MetaspaceSize：指定元空间触发FullGC的初始阈值(元空间无固定初始大小)，以字节为单位，默认是21M，达到该值就会触发FullGC进行类型卸载，同时收集器会对该值进行调整：如果释放了大量的空间，就适当降低该值；如果释放了很少的空间
强大的销售团队背后竟然是大数据分析的身影蓝儿唯美数据分析
Mark Roberge是HubSpot的首席财务官，在招聘销售职位时使用了大量数据分析。但是科技并没有挤走直觉。大家都知道数理学家实际上已经渗透到了各行各业。这些热衷数据的人们通过处理数据理解商业流程的各个方面，以重组弱点，增强优势。 Mark Roberge是美国HubSpot公司的首席财务官，HubSpot公司在构架集客营销现象方面出过一份力——因此他也是一位数理学家。他使用数据分析
Haproxy+Keepalived高可用双机单活 bylijinnan 负载均衡 keepalived haproxy 高可用
我们的应用MyApp不支持集群，但要求双机单活（两台机器：master和slave）： 1.正常情况下，只有master启动MyApp并提供服务 2.当master发生故障时，slave自动启动本机的MyApp，同时虚拟IP漂移至slave，保持对外提供服务的IP和端口不变 F5据说也能满足上面的需求，但F5的通常用法都是双机双活，单活的话还没研究过服务器资源 10.7
eclipse编辑器中文乱码问题解决 0624chenhong eclipse乱码
使用Eclipse编辑文件经常出现中文乱码或者文件中有中文不能保存的问题，Eclipse提供了灵活的设置文件编码格式的选项，我们可以通过设置编码格式解决乱码问题。在Eclipse可以从几个层面设置编码格式：Workspace、Project、Content Type、File 本文以Eclipse 3.3（英文）为例加以说明： 1. 设置Workspace的编码格式： Windows-&g
基础篇--resources资源不懂事的小屁孩 android
最近一直在做java开发，偶尔敲点android代码，突然发现有些基础给忘记了，今天用半天时间温顾一下resources的资源。 String.xml 字符串资源涉及国际化问题 http://www.2cto.com/kf/201302/190394.html string-array
接上篇补上window平台自动上传证书文件的批处理问卷酷的飞上天空 window
@echo off : host=服务器证书域名或ip，需要和部署时服务器的域名或ip一致 ou=公司名称, o=公司名称 set host=localhost set ou=localhost set o=localhost set password=123456 set validity=3650 set salias=s
企业物联网大潮涌动：如何做好准备？蓝儿唯美企业
物联网的可能性也许是无限的。要找出架构师可以做好准备的领域然后利用日益连接的世界。尽管物联网（IoT）还很新，企业架构师现在也应该为一个连接更加紧密的未来做好计划，而不是跟上闸门被打开后的集成挑战。“问题不在于物联网正在进入哪些领域，而是哪些地方物联网没有在企业推进，” Gartner研究总监Mike Walker说。 Gartner预测到2020年物联网设备安装量将达260亿，这些设备在全
spring学习——数据库（mybatis持久化框架配置） a-john mybatis
Spring提供了一组数据访问框架，集成了多种数据访问技术。无论是JDBC，iBATIS(mybatis)还是Hibernate，Spring都能够帮助消除持久化代码中单调枯燥的数据访问逻辑。可以依赖Spring来处理底层的数据访问。 mybatis是一种Spring持久化框架，要使用mybatis，就要做好相应的配置： 1，配置数据源。有很多数据源可以选择，如：DBCP，JDBC，aliba
Java静态代理、动态代理实例 aijuans Java静态代理
采用Java代理模式，代理类通过调用委托类对象的方法，来提供特定的服务。委托类需要实现一个业务接口，代理类返回委托类的实例接口对象。按照代理类的创建时期，可以分为：静态代理和动态代理。所谓静态代理：　指程序员创建好代理类，编译时直接生成代理类的字节码文件。所谓动态代理：　在程序运行时，通过反射机制动态生成代理类。一、静态代理类实例： 1、Serivce.ja
Struts1与Struts2的12点区别 asia007 Struts1与Struts2
1) 在Action实现类方面的对比：Struts 1要求Action类继承一个抽象基类；Struts 1的一个具体问题是使用抽象类编程而不是接口。Struts 2 Action类可以实现一个Action接口，也可以实现其他接口，使可选和定制的服务成为可能。Struts 2提供一个ActionSupport基类去实现常用的接口。即使Action接口不是必须实现的，只有一个包含execute方法的P
初学者要多看看帮助文档不要用js来写Jquery的代码百合不是茶 jquery js
解析json数据的时候需要将解析的数据写到文本框中, 出现了用js来写Jquery代码的问题; 1, JQuery的赋值有问题代码如下: data.username 表示的是: 网易 $("#use
经理怎么和员工搞好关系和信任 bijian1013 团队项目管理管理
产品经理应该有坚实的专业基础，这里的基础包括产品方向和产品策略的把握，包括设计，也包括对技术的理解和见识，对运营和市场的敏感，以及良好的沟通和协作能力。换言之，既然是产品经理，整个产品的方方面面都应该能摸得出门道。这也不懂那也不懂，如何让人信服？如何让自己懂？就是不断学习，不仅仅从书本中，更从平时和各种角色的沟通
如何为rich:tree不同类型节点设置右键菜单 sunjing contextMenu tree Richfaces
组合使用target和targetSelector就可以啦，如下： <rich:tree id="ruleTree" value="#{treeAction.ruleTree}" var="node" nodeType="#{node.type}" selectionChangeListener=&qu
【Redis二】Redis2.8.17搭建主从复制环境 bit1129 redis
开始使用Redis2.8.17 Redis第一篇在Redis2.4.5上搭建主从复制环境，对它的主从复制的工作机制，真正的惊呆了。不知道Redis2.8.17的主从复制机制是怎样的，Redis到了2.4.5这个版本，主从复制还做成那样，Impossible is nothing! 本篇把主从复制环境再搭一遍看看效果，这次在Unbuntu上用官方支持的版本。 Ubuntu上安装Red
JSONObject转换JSON--将Date转换为指定格式白糖_ JSONObject
项目中，经常会用JSONObject插件将JavaBean或List<JavaBean>转换为JSON格式的字符串，而JavaBean的属性有时候会有java.util.Date这个类型的时间对象，这时JSONObject默认会将Date属性转换成这样的格式： {"nanos":0,"time":-27076233600000,
JavaScript语言精粹读书笔记 braveCS JavaScript
【经典用法】： //①定义新方法 Function .prototype.method=function(name, func){ this.prototype[name]=func; return this; } //②给Object增加一个create方法，这个方法创建一个使用原对
编程之美-找符合条件的整数用字符串来表示大整数避免溢出 bylijinnan 编程之美
import java.util.LinkedList; public class FindInteger { /** * 编程之美找符合条件的整数用字符串来表示大整数避免溢出 * 题目：任意给定一个正整数N，求一个最小的正整数M(M>1)，使得N*M的十进制表示形式里只含有1和0 * * 假设当前正在搜索由0，1组成的K位十进制数
读书笔记 chengxuyuancsdn 读书笔记
1、Struts访问资源 2、把静态参数传递给一个动作 3、<result>type属性 4、s:iterator、s:if c:forEach 5、StringBuilder和StringBuffer 6、spring配置拦截器 1、访问资源 (1)通过ServletActionContext对象和实现ServletContextAware,ServletReque
[通讯与电力]光网城市建设的一些问题 comsci 问题
信号防护的问题,前面已经说过了,这里要说光网交换机与市电保障的关系我们过去用的ADSL线路,因为是电话线,在小区和街道电力中断的情况下,只要在家里用笔记本电脑+蓄电池,连接ADSL,同样可以上网........
oracle 空间RESUMABLE daizj oracle 空间不足 RESUMABLE 错误挂起
空间RESUMABLE操作转 Oracle从9i开始引入这个功能，当出现空间不足等相关的错误时，Oracle可以不是马上返回错误信息，并回滚当前的操作，而是将操作挂起，直到挂起时间超过RESUMABLE TIMEOUT，或者空间不足的错误被解决。这一篇简单介绍空间RESUMABLE的例子。第一次碰到这个特性是在一次安装9i数据库的过程中，在利用D
重构第一次写的线程池 dieslrae 线程池 python
最近没有什么学习欲望,修改之前的线程池的计划一直搁置,这几天比较闲,还是做了一次重构,由之前的2个类拆分为现在的4个类. 1、首先是工作线程类:TaskThread,此类为一个工作线程,用于完成一个工作任务,提供等待(wait),继续(proceed),绑定任务(bindTask)等方法 #!/usr/bin/env python # -*- coding:utf8 -*-
C语言学习六指针 dcj3sjt126com c
初识指针，简单示例程序： /* 指针就是地址，地址就是指针地址就是内存单元的编号指针变量是存放地址的变量指针和指针变量是两个不同的概念但是要注意：通常我们叙述时会把指针变量简称为指针，实际它们含义并不一样 */ # include <stdio.h> int main(void) { int * p; // p是变量的名字， int *
yii2 beforeSave afterSave beforeDelete dcj3sjt126com delete
public function afterSave($insert, $changedAttributes) { parent::afterSave($insert, $changedAttributes); if($insert) { //这里是新增数据 } else { //这里是更新数据 } }
timertask shuizhaosi888 timertask
java.util.Timer timer = new java.util.Timer(true); // true 说明这个timer以daemon方式运行（优先级低， // 程序结束timer也自动结束），注意，javax.swing // 包中也有一个Timer类，如果import中用到swing包， // 要注意名字的冲突。 TimerTask task = new
Spring Security（13）——session管理 234390216 session Spring Security 攻击保护超时
session管理目录 1.1 检测session超时 1.2 concurrency-control 1.3 session 固定攻击保护
公司项目NODEJS实践0.3[ mongo / session ...] 逐行分析JS源代码 mongodb session nodejs
http://www.upopen.cn 一、前言书接上回，我们搭建了WEB服务端路由、模板等功能，完成了register 通过ajax与后端的通信，今天主要完成数据与mongodb的存取，实现注册 / 登录 /
pojo.vo.po.domain区别 LiaoJuncai java VO POJO javabean domain
　　POJO = "Plain Old Java Object"，是MartinFowler等发明的一个术语，用来表示普通的Java对象，不是JavaBean, EntityBean 或者 SessionBean。POJO不但当任何特殊的角色，也不实现任何特殊的Java框架的接口如，EJB， JDBC等等。　　　　即POJO是一个简单的普通的Java对象，它包含业务逻辑
Windows Error Code OhMyCC windows
0 操作成功完成. 1 功能错误. 2 系统找不到指定的文件. 3 系统找不到指定的路径. 4 系统无法打开文件. 5 拒绝访问. 6 句柄无效. 7 存储控制块被损坏. 8 存储空间不足, 无法处理此命令. 9 存储控制块地址无效. 10 环境错误. 11 试图加载格式错误的程序. 12 访问码无效. 13 数据无效. 14 存储器不足, 无法完成此操作. 15 系
在storm集群环境下发布Topology roadrunners 集群 storm topology spout bolt
storm的topology设计和开发就略过了。本章主要来说说如何在storm的集群环境中，通过storm的管理命令来发布和管理集群中的topology。 1、打包打包插件是使用maven提供的maven-shade-plugin，详细见maven-shade-plugin。 <plugin> <groupId>org.apache.maven.
为什么不允许代码里出现“魔数” tomcat_oracle java
　　在一个新项目中，我最先做的事情之一，就是建立使用诸如Checkstyle和Findbugs之类工具的准则。目的是制定一些代码规范，以及避免通过静态代码分析就能够检测到的bug。　　迟早会有人给出案例说这样太离谱了。其中的一个案例是Checkstyle的魔数检查。它会对任何没有定义常量就使用的数字字面量给出警告，除了-1、0、1和2。　　很多开发者在这个检查方面都有问题，这可以从结果
zoj 3511 Cake Robbery(线段树) 阿尔萨斯线段树
题目链接：zoj 3511 Cake Robbery 题目大意：就是有一个N边形的蛋糕，切M刀，从中挑选一块边数最多的，保证没有两条边重叠。解题思路：有多少个顶点即为有多少条边，所以直接按照切刀切掉点的个数排序，然后用线段树维护剩下的还有哪些点。 #include <cstdio> #include <cstring> #include <vector&