小杨向前冲

【JAVA基础——JAVA虚拟机JVM】

JVM

文章目录

JVM
- 一.JVM结构
- - 1.1.JVM包含两个子系统和两个组件
  - 1.2.运行时数据区
  - - 1.2.1.简介
    - 1.2.2.程序计数器
    - 1.2.3.虚拟机栈
    - 1.2.4.堆
    - 1.2.5.本地方法栈
    - 1.2.6.方法区(永久代实现)java8-
    - 1.2.7.元空间(Metaspace)
    - 1.2.8.JVM字节码执行引擎
    - 1.2.9.直接内存(Direct Memory)
    - 1.2.10.垃圾收集系统
- 二.垃圾回收
- - 2.1.GC
  - 2.2.内存分配规则
  - 2.3.新生代,老年代,永久代,元空间
  - - 2.3.1.分区
    - 2.3.2.比例
    - 2.3.3.原因
  - 2.4.垃圾回收算法
  - 2.5.垃圾收集器
  - 2.6.判断对象是否可以被回收(标记算法)？
  - 2.7.其他
  - - java内存溢出
    - System.gc()
- 三.内存分配
- - 3.1.对象创建方式
  - 3.2.对象的分配
  - 3.3.对象的内存布局
  - - 3.3.1.对象头
    - - 3.3.1.1.对象标记(Mark Word)
      - 3.3.1.2.类元信息(Class pointer类型指针)
    - 3.3.2.实例数据
    - 3.3.3.对齐填充
  - 3.4. 对象内存查看
  - 3.5.类加载的机制及过程
  - 3.6.JVM加载Class文件的原理机制
  - 3.7.类加载器定义与分类
  - 3.8.自定义类加载器
  - 3.9.双亲委派模型:
  - 3.10.JVM新建对象
  - 3.11.Java引用类型
- 四.JVM调优
- - 4.1.工具
  - 4.2.调优参数
  - 4.3.性能调优
  - 4.4.程序算法：改进程序逻辑算法提高性能
- 五.启动参数与命令
- - 5.1.设置参数方式
  - 5.2.java -help 标准参数(不会随着JDK 变化而变化版本的参数)
  - 5.3.java -X 非标准参数 (java -X命令，能够获得当前JVM支持的所有非标准参数列表)
  - 5.4.java -XX 非固定参数
  - 5.5.其他命令

JVM (Java Virtual Machine) JAVA虚拟机. 由堆、栈、方法区所组成，其中栈内存是给线程用的.
每个线程启动后，虚拟机就会为其分配一块栈内存。
每个栈由多个栈帧(Frame)组成，对应着每次方法调用时所占用的内存.
每个线程程只能有一个活动栈帧，对应着当前正在执行的那个方法.

一.JVM结构

1.1.JVM包含两个子系统和两个组件

两个子系统为类装载子系统 ClassLoader,执行引擎子系统 Execution engine;
- 类加载子系统:包含类加载器;根据给定的全限定类名装在class文件到运行时数据区的方法区;
- 执行引擎:包含即时编译器(JITCompiler)和垃圾回收器(Garbage Collector);执行class文件中的命令;
两个组件为运行时数据区 Runtime data Area,本地接口 Native Interface;
- 本地接口:与本地方法库交互,与其他变成语言交互的接口;
- 运行时数据区域: 是jvm的内存;包含方法区,虚拟机栈,本地方法栈,堆,程序计数器;

JAVA7:

1.2.运行时数据区

1.2.1.简介

程序计数器(Program Counter Register)
- 线程私有.
- 当前线程所执行的字节码的行号指示器，字节码解析器的工作是通过改变程序计数器的值，来选取下一条需要执行的字节码指令，
- 分支、循环、跳转、异常处理、线程恢复等基础功能，都依赖程序计数器来完成；线程是不具备记忆功能,需要程序计数器.
本地方法栈(Native Method Stack)
- 线程私有.
- C所编写的Native方法相关.本地方法栈是为虚拟机调用 Native本地方法服务.
Java虚拟机栈(Java Virtual Machine Stacks)
- 线程共享.
- 虚拟机栈描述的是 Java方法执行的内存模型：
- 每个方法在执行的同时都会创建一个栈帧(Stack Frame)用于存储局部变量表(基本类型，对象引用，和 returnAddress)、操作数栈、动态链接、方法出口等信息。
- 每一个方法调用直至执行完的过程，就对应着一个栈帧在虚拟机栈中入栈到出栈的过程。
Java堆(Java Heap)
- 线程共享.
- 虚拟机启动时创建.JVM 中内存最大的一块，被所有线程共享，java堆唯一目的就是存放对象实例，'几乎’所有的对象实例都在这里分配内存;
- 堆空间是垃圾收集器管理的主要区域.
方法区(Method Area)java8-
- 线程共享,非堆内存.
- 用于存储已被虚拟机加载的类信息、常量、静态变量、JIT即时编译后的代码等数据。在Java8之后被更改为元数据空间.
- (JAVA7-)在方法区中有一个叫’运行时常量池’的区域，主要用来存放编译器生成的各种字面量和符号引用，在类加载完成后载入到运行时常量池中，以便后续使用。
- JAVA7时已从方法区转移到堆内存,为了java8移除永久代做准备.

程序计数器,java虚拟机栈为线程私有;
本地方法栈,Java堆,方法区为线程共享;

1.2.2.程序计数器

程序计数器是一块较小的内存空间，可以看作：保存当前线程所正在执行的字节码指令的地址(行号)
程序计数器线程私有, Java虚拟机的多线程是通过线程轮流切换并分配处理器执行时间的方式来实现的，同一时刻一个处理器都只会执行一条线程中的指令。
因此，为了线程切换后能恢复到正确地执行位置，每条线程都有一个独立的程序计数器，各个线程之间计数器互不影响，独立存储。
程序计数器内存区域是虚拟机中唯一没有规定 OutOfMemoryError 情况的区域。

1.2.3.虚拟机栈

Java虚拟机是线程私有的，生命周期和线程相同。
虚拟机栈描述的是Java方法执行的内存模型：每个方法在执行的同时都会创建一个栈帧用于存储局部变量表、操作数栈、动态链接、方法出口等信息.

java虚拟机栈的单位为栈帧:

局部变量表：是用来存储临时8个基本数据类型、对象引用地址、returnAddress 类型。(returnAddress 中保存的是return后要执行的字节码的指令地址)
操作数栈：操作数栈就是用来操作的数据，例如代码中有个 i = 3*4，他在一开始的时候就会进行操作，读取我们的代码，进行计算后再放入局部变量表中去
动态链接：方法中需要链接到别的方法中去(动态链接),存储链接的地方
方法出口：出口正常就是return 不正常就是抛出异常

一个方法调用另一个方法，会创建很多栈帧吗？

如果一个栈中有动态链接调用别的方法，就会去创建新的栈帧.

栈指向堆是什么意思？

栈中要使用成员变量时,栈中不会存储成员变量，只会存储一个应用地址

递归的调用自己会创建很多栈帧吗？

递归的话也会创建多个栈帧，就是在栈中一直从上往下排下去.

1.2.4.堆

java堆是java虚拟机所管理的内存中最大的一块，是被所有线程共享的一块内存区域，在虚拟机启动时创建。java堆目的就是存放对象实例。
所有的对象实例以及数组都要在堆上分配。

java堆是垃圾收集器管理的主要区域,从内存回收角度来看java堆可分为：新生代和老年代。
从内存分配的角度看，线程共享的Java堆中可能划分出多个线程私有的分配缓冲区。
无论哪个区域，存储的都是对象实例，进一步地划分都是为了更好地回收内存，或者更快的分配内存。

根据Java虚拟机规范的规定，java堆可以处于物理上不连续的内存空间中。
当前主流的虚拟机都是可扩展的(通过 -Xmx 和 -Xms 控制)。
如果堆中没有内存可以完成实例分配，并且堆也无法再扩展时，将会抛出 OutOfMemoryError 异常。

栈与堆的区别:

对比	堆	栈
物理地址	堆的物理地址分配对对象是不连续的。因此性能慢些。在GC的时候也要考虑到不连续的分配，所以有各种算法。	栈使用的是数据结构中的栈，先进后出的原则，物理地址分配是连续的。所以性能快。
内存分配	堆因为是不连续的，分配的内存是在运行期确认的，因此大小不固定。一般堆远远大于栈。	栈是连续的，分配的内存大小要在编译期就确认，大小是固定。
存放内容	堆存放对象的实例和数组。更关注的是数据的存储	栈存放局部变量，操作数栈，返回结果。该区更关注的是程序方法的执行。
可见度	堆对于整个应用程序都是共享、可见的。	栈只对于线程是可见的。线程私有。生命周期和线程相同。

1.2.5.本地方法栈

线程私有的.

用于执行本地方法，这些方法是使用其他语言编写的，并且与Java程序进行交互。本地方法栈中的帧用于保存本地方法的执行上下文和局部变量信息.
本地方法栈提供了与本地库（Native Library）的连接，使得Java程序能够调用本地库中的函数和方法。

1.2.6.方法区(永久代实现)java8-

方法区是所有线程共享的内存区域，它用于存储已被Java虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。
别命叫Non-Heap(非堆)。当方法区无法满足内存分配需求时，抛出 OutOfMemoryError 异常。
java8版本永久代已移除,使用元空间实现方法区

运行时常量池:

1.7- 运行时常量池在永久代中(HotSpot虚拟机对方法区的实现);
1.7+ 常量池已经从永久代移动到堆内存中。仍然存在永久代，但从这个版本开始，JVM逐渐将永久代的功能移动到堆内存中，包括运行时常量池的位置。
1.8+ 常量池依旧在堆内存中.移除永久代,由元空间代替永久代(本地内存).

1.2.7.元空间(Metaspace)

在Java8开始取代了永久代的一种内存区域。与永久代不同，元空间不使用Java虚拟机堆内存，而是使用本地内存来存储类的元数据信息。

存储类的元数据：元空间用于存储加载的类的元数据信息，包括类的结构信息、字段信息、方法信息、注解、字节码等。这些元数据信息在程序运行时被JVM使用。
动态大小调整：与永久代不同，元空间的大小不再受到默认固定大小的限制，可以根据需要进行动态调整。元空间的大小受限于系统的可用本地内存大小，可以通过设置JVM参数来限制元空间的最大大小。
自动回收和垃圾回收：由于元空间存储的是类的元数据信息而不是对象实例，所以不再需要像永久代进行垃圾回收。元空间的自动回收主要发生在类加载和卸载过程中，当某个类不再被引用或者无法被访问时，相关的元数据将会被卸载。
类型信息的存储方式：元空间使用了一种新的机制来存储类的类型信息，即虚拟机中的Class对象被替换为一种叫作Klass Metadata（Klass元数据）的结构。Klass元数据是在运行时根据类的加载和转换而动态生成的，它包含了与类相关的信息，并被存储在元空间中。
元空间的内存管理：元空间的内存管理由操作系统进行控制，不再依赖于Java虚拟机的垃圾回收机制。元空间的分配和释放是基于本地内存的管理操作，可通过操作系统提供的API进行管理。

1.2.8.JVM字节码执行引擎

执行引擎，负责执行虚拟机的字节码，一般先进行编译成机器码后执行。
“虚拟机”是一个相对于“物理机”的概念，虚拟机的字节码是不能直接在物理机上运行的，需要 JVM字节码执行引擎编译成机器码后才可在物理机上执行。

1.2.9.直接内存(Direct Memory)

直接内存是基于物理内存和Java虚拟机内存的中间内存,能在一些场景中显著提高性能。
直接内存不受Java堆大小限制，它的分配和释放不依赖于JVM的垃圾回收机制，而是通过操作系统提供的本地内存管理函数进行操作。
直接内存是通过操作系统的本地内存管理函数（如malloc()、free()等）来进行分配和释放的，不需要经过JVM的对象分配和垃圾回收机制。

在JDK1.4中引入了NIO(New Input/Output)类，一种基于通道(Chanel)与缓冲区(Buffer)的I/O方式，NIO提供了一套非阻塞式的I/O操作方式，使用直接内存可以提高I/O操作的效率和性能。
可以使用 Native函数库直接分配堆外内存，然后通过一个存储在 Java 中的 DirectByteBuffer 对象作为对这块内存的引用进行操作。

1.2.10.垃圾收集系统

负责自动管理内存的组成部分。帮助Java程序管理内存，对于垃圾对象的清除、存活对象的管理以及内存碎片的回收等工作，都交由GC系统负责。

二.垃圾回收

GC发生在堆中,java语言最显著的特点就是引入了垃圾回收机制，使java程序员在编写程序时不再考虑内存管理的问题。

程序在运行过程中，会产生大量的内存垃圾.为了确保程序运行时的性能，java虚拟机在程序运行的过程中不断地进行自动的垃圾回收(GC)。

在java中，不需要显式的去释放一个对象的内存的，而是由虚拟机自行执行。
JVM中的垃圾回收线程，是低优先级的，在正常情况下是不会执行的，只有在虚拟机空闲或者当前堆内存不足时，才会触发执行，

执行时扫描那些没有被任何引用的对象，并将它们添加到要回收的集合中，进行回收。

2.1.GC

Minor GC(YoungGC) 清理整个新生代的过程，eden，S0\S1都会在空间不足时,触发minorGC的清理.
因为Java对象大多都是朝生夕死，Minor GC非常频繁，一般回收速度也非常快.
Major GC(Full GC)老年代区内存不足，触发Major GC(Major GC通常是跟full GC是等价的).
出现了Major GC通常会伴随至少一次Minor GC。Major GC的速度通常会比Minor GC慢10倍以上。
Mixed GC 混合GC,覆盖整个新生代空间及部分年老代空间的GC.
目前只有G1存在该行为，其他收集器均不支持.

full gc触发时机:

每次晋升到老年代的对象平均大小 > 老年代剩余空间
MinorGC后存活的对象超过了老年代剩余空间(除CMS收集器)
元空间空间不足
执行System.gc()
CMS标记清除收集器 GC异常
堆内存分配很大的对象
晋升失败promotion failed (年轻代晋升失败,比如eden区的存活对象晋升到幸存者区放不下，又尝试直接晋升到老年区又放不下，那么晋升失败,会触发 FullGC)

在发生Minor GC之前，虚拟机会先检查老年代最大可用的连续空间是否大于新生代所有对象的总空间。
如果大于则进行 Minor GC，如果小于则看 HandlePromotionFailure 设置是否允许担保失败(不允许则直接Full GC)。
如果允许担保失败，继续检查老年代最大可用的连续空间是否大于历次晋升到老年代对象的平均大小，
如果大于则尝试 Minor GC(如果尝试失败也会触发Full GC)，如果小于则进行 Full GC。

2.2.内存分配规则

对象优先在Eden区分配
多数情况，对象都在新生代 Eden 区分配。当 Eden 区分配没有足够的空间进行分配时，虚拟机将会发起一次 Minor GC。
如果本次GC后还是没有足够的空间，则将启用分配担保机制在老年代中分配内存。
大对象直接进入老年代
-XX:PretenureSizeThreshold 大于此值得对象直接分配在老年代(只对Serial和ParNew两款收集器有效),以B为单位,1kb为1024
大对象是指需要大量连续内存空间的对象，频繁出现大对象是致命的，会导致在内存还有不少空间的情况下提前触发GC以获取足够的连续空间来安置新对象。
前面我们介绍过新生代使用的是标记-清除算法来处理垃圾回收的，如果大对象直接在新生代分配就会导致Eden区和两个Survivor区之间发生大量的内存复制。
因此对于大对象都会直接在老年代进行分配。
(考虑ParNew加CMS的收集器组合)
长期存活对象将进入老年代
数 -XX:MaxTenuringThreshold 晋升老年代阈值
虚拟机给每个对象定义了一个对象年龄的计数器，如果对象在Eden区出生，并且能够被Survivor容纳，将被移动到Survivor空间中，
这时设置对象年龄为1。对象在Survivor区中每熬过一次Minor GC年龄就加 1，当年龄达到一定程度(默认 15) 就会被晋升到老年代。
动态对象年龄判定
虚拟机并不是永远地要求对象的年龄必须达到了MaxTenuringThreshold才能晋升老年代.如果在Survivor空间中某年龄所有对象大小的总和大于Survivor空间的一半，
年龄大于或等于该年龄的对象就可以直接进入老年代,无须等到 MaxTenuringThreshold 中要求的年龄。
空间分配担保
在发生Minor GC之前，虚拟机会先检查老年代最大可用的连续空间是否大于新生代所有对象总空间，如果老年代最大可用的连续空间大于新生代所有对象总空间，那么Minor GC可以确保是安全的。
如果不成立，则虚拟机会查看 HandlePromotionFailure 设置值是否允许担保失败。
- 如果允许，那么会继续检查老年代最大可用的连续空间是否大于历次晋升到老年代对象的平均大小，
  - 如果大于，将尝试着进行一次有风险的Minor GC.
  - 如果小于改为进行一次Full GC。
- 允许担保失败，进行一次Full GC。

2.3.新生代,老年代,永久代,元空间

2.3.1.分区

在 Java 中，堆被划分成两个不同的区域：新生代 ( Young )、老年代 ( Old )。

新生代 ( Young )被划分为三个区域：Eden、From Survivor、To Survivor。目的是为了使 JVM 能够更好的管理堆内存中的对象，包括内存的分配以及回收。
新生代中一般保存新出现的对象，所以每次垃圾收集时都发现大批的对象死去，只有少量的对象存活，便采用了复制算法，只需要付出少量存活对象的复制成本就可以完成收集。
老年代中一般保存存活了很久的对象，他们存活率高、没有额外空间对它进行分配担保，就必须采用 “标记-清理”或者“标记-整理” 算法。

Java8- 永久代就是JVM的方法区。放着一些被虚拟机加载的类信息，静态变量，常量等数据。这个区中的东西比老年代和新生代更不容易回收。
Java8中已经移除了永久代，新加了一个叫做空间的本地内存区.

2.3.2.比例

新生代:堆1/3 老年代:堆2/3 通过参数 –XX:NewRatio=2来指定
eden:新生代8/10 survivor:新生代1/10 通过参数 –XX:SurvivorRatio=8来设定

2.3.3.原因

为什么要这样分代?
其实主要原因就是可以根据各个年代的特点进行对象分区存储，更便于回收，采用最适当的收集算法：
新生代中，每次垃圾收集时都发现大批对象死去，只有少量对象存活，便采用了复制算法，只需要付出少量存活对象的复制成本就可以完成收集。
老年代中因为对象存活率高、没有额外空间对它进行分配担保，就必须采用“标记-清理”或者“标记-整理”算法。

新生代又分为Eden和Survivor (From与To)两个区。加上老年代就这三个区。
数据会首先分配到Eden区当中(特殊情况，如果是大对象(大于PretenureSizeThreshold阈值)那么会直接放入到老年代(大对象是指需要大量连续内存空间的java对象)。

当Eden没有足够空间的时候就会触发jvm发起一次Minor GC。
如果对象经过一次Minor-GC还存活，并且又能被Survivor空间接受，那么将被移动到Survivor空间当中。并将其年龄设为1，对象在Survivor每熬过一次Minor GC，年龄就加1，
当年龄达到一定的程度(默认15)时，就会被晋升到老年代中了，-XX:MaxTenuringThreshold=15,设置晋升年龄.

为什么新生代要分Eden和两个 Survivor 区域？

如果没有Survivor，Eden区每进行一次Minor GC，存活的对象就会被送到老年代。老年代很快被填满，触发Major GC.
老年代的内存空间远大于新生代，进行一次Full GC消耗的时间比Minor GC长得多,所以需要分为Eden和Survivor。
Survivor的存在意义，就是减少被送到老年代的对象，进而减少Full GC的发生，Survivor的预筛选保证，只有经历15次Minor GC还能在新生代中存活的对象，才会被送到老年代。
设置两个Survivor区最大的好处就是解决了碎片化
刚刚新建的对象在Eden中，经历一次MinorGC，Eden中的存活对象就会被移动到第一块survivor space S0，Eden被清空；
等Eden区再满了，就再触发一次Minor GC，Eden和S0中的存活对象又会被复制送入第二块survivor spaceS1.
(这种复制算法保证了S1中来自S0和Eden两部分的存活对象占用连续的内存空间，避免了碎片化的发生)

元空间metaSpace替换永久代perm(方法区移至Metaspace，字符串常量池移至Java Heap)

字符串常量池存在永久代中，容易出现性能问题和内存溢出。
类及方法的信息等比较难确定其大小，因此对于永久代的大小指定比较困难，太小容易出现永久代溢出，太大则容易导致老年代溢出。
永久代会为 GC 带来不必要的复杂度，并且回收效率偏低。

2.4.垃圾回收算法

标记-清除算法：标记无用对象，然后进行清除回收。
a,标记(使用可达性分析算法;不使用引用计数法,存在循环引用);
b,回收;
- 缺点：效率低，产生大量不连续的内存碎片，提高了垃圾回收的频率。
复制算法：按照容量划分两个大小相等的内存区域，每次只使用其中一个区域.当一块用完的时候将活着的对象复制到另一块上，然后再把已使用的内存空间一次清理掉。
- 缺点：内存使用率不高，只有原来的一半。对象存活率高时会频繁进行复制。
- 实现:年轻代分为一个Eden和两个Survivor区,Eden与Survivor比例为 8:1:1,当其中eden和正在使用的survivor满时,发生gc,将存活对象复制到另一个幸存者区中.
标记-整理算法：标记无用对象，让所有存活的对象都向一端移动，然后直接清除掉端边界以外的内存。
- 优点：解决了标记-清理算法存在的内存碎片问题。
- 缺点：仍需要进行局部对象移动，一定程度上降低了效率.
分代算法：根据对象存活周期的不同将内存划分为几块，一般是新生代和老年代，新生代基本采用复制算法，老年代采用标记整理算法。(永久代为方法区)
分代回收器有两个分区：老年代和新生代，新生代默认的空间占比总空间的 1/3，老年代的默认占比是 2/3。
新生代使用的是复制算法，新生代里有 3 个分区：Eden、To Survivor、From Survivor，它们的默认占比是 8:1:1.
- 执行流程如下：
  - 把Eden + From Survivor 存活的对象放入 To Survivor 区；
  - 清空 Eden 和 From Survivor 分区；
  - From Survivor 和 To Survivor 分区交换，From Survivor 变 To Survivor，To Survivor 变 From Survivor。
  - 每次在 From Survivor 到 To Survivor 移动时都存活的对象，年龄就 +1，当年龄到达15(默认配置)时，升级为老生代。大对象也会直接进入老生代。
  - 老年代当空间占用到达某个值之后就会触发全局垃圾收回，一般使用标记整理的执行算法。
  - 以上循环往复就构成了整个分代垃圾回收的整体执行流程。

2.5.垃圾收集器

垃圾收集器是垃圾回收算法(标记清除法、标记整理法、复制算法、分代算法)的具体实现，不同垃圾收集器、不同版本的JVM所提供的垃圾收集器可能会有很在差别。

年轻代 Serial,Parallel Scavenge,PraNew
老年代 Serial Old、Parallel Old、CMS
堆(包括老年代和年轻代) G1

收集器分为分代收集器和分区收集器:
分代收集器：Serial、ParNew、Parallel Scavenge、CMS、Serial Old、Parallel Old
分区收集器：G1、ZGC(java11)、Shenandoah(java12)

收集器间搭配:
Serial可搭配: Serial Old、CMS
Parallel Scavenge可搭配: Serial Old、Parallel Old
PraNew可搭配: Serial Old、CMS

Serial 收集器(复制算法): 新生代单线程收集器.优点:简单高效. 适合单线程环境和对暂停时间要求不高的应用场景。
ParNew 收集器 (复制算法): 新生代收并行收集器，实际上是Serial收集器的多线程版本，在多核CPU环境下有着比Serial更好的表现.用于搭配CMS的新生代收集器.
Parallel Scavenge 收集器 (复制算法): 新生代并行收集器，追求高吞吐量，高效利用CPU。
吞吐量 = 用户线程时间/(用户线程时间+GC线程时间)，
高吞吐量可以高效率的利用CPU时间，尽快完成程序的运算任务，适合后台应用等对交互响应要求不高的场景.
Serial Old 收集器 (标记-整理算法): 老年代单线程收集器，Serial收集器的老年代版本；
Parallel Old 收集器 (标记-整理算法)：老年代并行收集器，吞吐量优先，Parallel Scavenge收集器的老年代版本;
CMS(Concurrent Mark Sweep 并发标记清除回收器)收集器：
老年代并发收集器，以获取最短回收停顿时间为目标的收集器，具有高并发、低停顿的特点，追求最短GC回收停顿时间。
以牺牲吞吐量为代价来获得最短回收停顿时间的垃圾回收器。对于要求服务器响应速度的应用上，非常适合。
在启动 JVM 的参数加上“-XX:+UseConcMarkSweepGC”来指定使用CMS垃圾回收器。
CMS 使用的是标记-清除的算法实现的，所以在gc的时候会产生大量的内存碎片，当剩余内存不能满足程序运行要求时，系统将会出现 Concurrent Mode Failure，
临时CMS会采用 Serial Old 回收器进行垃圾清除(标记整理算法)，此时的性能将会被降低。
CMS收集器有单独收集年老代空间的行为.(其他收集器发生老年代GC时,年轻代GC会一起发生)
- 回收过程:
  1. 初始标记：仅标记GcRoot节点直接关联的对象，该阶段速度会很快，需在STW中进行。
  2. 并发标记：该阶段主要是做GC溯源工作（GcTracing），从根节点出发，对整个堆空间进行可达性分析，找出所有存活对象，该阶段的GC线程会与用户线程同时执行。
  3. 重新标记：这个阶段主要是为了修正“并发标记”阶段由于用户线程执行造成的GC标记变动的那部分对象，该阶段需要在STW中执行，并且该阶段的停顿时间会比初始阶段要长不少。
  4. 并发清除：在该阶段主要是对存活对象之外的垃圾对象进行清除，该阶段不需要停止用户线程，是并发执行的。
G1(Garbage First)收集器 (标记-整理算法)：
Java堆 并发分区回收 收集器，G1收集器是JDK1.7提供的一个新收集器，G1收集器基于“标记-整理”算法实现，不会产生内存碎片。
在不牺牲吞吐量前提下，实现低停顿垃圾回收。
此外，G1收集器回收的范围是整个Java堆(包括新生代，老年代)
- 特性:
  - 并发收集,与用户线程同时执行
  - 标记整理,不会产生内存碎片
  - GC时，停顿时间可控,尽可能会保证高吞吐量。
  - 对于堆的未使用内存可以返还给操作系统。JDK12
JAVA9时变为默认使用的收集器.
堆中的内存区域被划为了一个个Region区。Region区的默认数量限制为2048个.每个区大小为堆空间大小/2048.(不推荐用XX:G1HeapRegionSize指定)
每个分区都可能是年轻代也可能是老年代，但是在同一时刻只能属于某个代。运行时，每个分区都会被打上唯一的分区标识。

JVM不需要再为堆空间分配连续的内存，堆空间可以是不连续物理内存来组成Region的集合.
有的区域垃圾对象少,有的垃圾对象多,G1优先回收垃圾对象多的区域.
-XX:G1NewSizePercent 设置新生代初始占比(默认5)
-XX:G1MaxNewSizePercent 设置新生代最大占比(默认60)
新生代中的Eden区和Survivor区对应的Region区比例默认8:1:1.

G1中的年老代晋升条件和之前的相同，达到年龄阈值的对象会被转入年老代的Region区中.
对于大对象的分配，在G1中不会让大对象进入年老代，在G1中由专门存放大对象的Region区叫做 Humongous 区，
如果在分配对象时，判定出一个对象属于大对象，那么则会直接将其放入Humongous区存储。(超过单个普通Region区的50%为大对象，单个Humongous区存不下时，可能会横跨多个Region区存储)
可以避免一些生命周期短的大对象直接进入年老代，节约年老代的内存空间，可以有效避免年老代因空间不足时的GC开销。
FullGC时，也会对Humongous区进行回收。
- YoungGC:
  在G1中，当Eden域被用完时，G1首先会计算回收当前的新生代空间需要花费的时间，如果回收时间远远小于参数-XX:MaxGCPauseMills 值(默认200ms)，那么不会触发YoungGC,
  而是会继续为新生代增加新的Region区用于存放新分配的对象实例。
  直至某次Eden区空间再次被放满并经过计算后，此次回收的耗时接近-XX:MaxGCPauseMills参数设定的值，才触发YoungGC。
  YoungGC被触发时，首先会将目标Region区中的存活对象移动(多线程并行复制)至幸存区空间(Survivor-from标签的区域).达到晋升年龄标准的对象也会被移入至年老代区中存储.
  G1内部做了优化，一旦发现没有引用指向巨型对象，则可直接在年轻代收集周期中被回收。
- MixedGC:
  当整个堆中年老代的区域占有率达到参数 -XX:InitiatingHeapOccupancyPercent(默认45) 设定的值后触发MixedGC.
  触发时会回收所有新生代区和部分年老代区（根据期望的GC停顿时间选择合适的年老代Region区优先回收）以及大对象Humongous区.
- FullGC:
  当 G1 无法在堆空间中申请新的分区时，G1便会触发担保机制，执行一次STW式单线程的 Full GC，Full GC会对整堆做标记清除和压缩，最后将只包含纯粹的存活对象。
  - 从年轻代分区拷贝存活对象时，无法找到可用的空闲分区
  - 从老年代分区转移存活对象时，无法找到可用的空闲分区
  - 分配巨型对象时在老年代无法找到足够的连续分区
- MixedGC 回收过程:
  1. 初始标记（InitialMark）：先触发STW，然后使用单条GC线程快速标记GCRoots直连的对象。
  2. 并发标记（ConcurrentMarking）：与CMS的并发标记过程一致(三色标记算法)，采用多条GC线程与用户线程共同执行，根据Root根节点标记所有对象。
  3. 最终标记（Remark）：同CMS的重新标记阶段，主要是为了纠正并发标记阶段因用户操作导致的错标、误标、漏标对象。
  4. 筛选回收（Cleanup）：先对各个Region区的回收价值和成本进行排序，找出「回收价值最大」的Region优先回收。
    根据用户指定的期望停顿时间（即-XX:MaxGCPauseMillis参数设定的值）选择「价值最大且最符合用户预期」的Region区进行回收.
- 缺点:
  - 停顿时间过短时,导致每次回收的空间只占堆内存的小部分.回收速度跟不上分配速度时导致垃圾堆积.
  - 相比CMS更高的内存开销和处理开销:需要维护额外的数据结构来管理分区和跟踪对象的存活情况.以及GC过程中的标记阶段、内存整理等操作.
  - 在小内存的应用中可能不如CMS
- 优点:
  - 相比CMS采用的标记清除算法,G1的标记整理不会产生内存碎片.
  - 在不牺牲吞吐量前提下，实现低停顿垃圾回收。(同时注重吞吐量和低延迟场景)
Epsilon(JDK11): 用于测试的无操作收集器,装配该款GC收集器的JVM，在运行期间不会发生任何GC相关的操作，程序所分配的堆空间一旦用完，Java程序就会因OOM原因退出。
ZGC(JDK11):
ZGC主打的是超低延迟与吞吐量，ZGC也会在尽可能堆吞吐量影响不大的前提下，
实现在任意堆内存大小下都可以把垃圾回收的停顿时间限制在10ms以内的低延迟。没有实现分代架构.
ZGC的目的主要有如下四点：
1. 奠定未来GC特性的基础。
2. 为了支持超大级别堆空间（TB级别），最高支持16TB。
3. 在最糟糕的情况下，对吞吐量的影响也不会降低超过15%。
4. GC触发产生的停顿时间不会偏差10ms。
ShenandoahGC(JDK12):追求极致低延迟.没有实现分代架构.
ZGC是基于colored pointers染色指针实现的，而ShenandoahGC是基于brooks pointers转发指针实现。

2.6.判断对象是否可以被回收(标记算法)？

一般有两种方法来判断：

引用计数器法：为每个对象创建一个引用计数，有对象引用时计数器+1，引用被释放时计数-1，当计数器为0时就可以被回收。不能解决循环引用的问题!
可达性分析算法：从GC Roots开始向下搜索，搜索所走过的路径称为引用链。涉及到的对象不能从GC Roots强引用可到达，垃圾回收器都会进行清理来释放内存。
当一个对象到 GC Roots没有任何引用链相连时，则证明此对象是可以被回收的。
GC Roots有:
- 类，由系统类加载器加载的类。这些类从不会被卸载，可以通过静态属性的方式持有对象的引用。一般情况下由自定义的类加载器加载的类不能成为GC Roots.
- 线程，存活的线程
- Java方法栈中的局部变量或者参数
- JNI方法栈中的局部变量或者参数
- JNI全局引用
- 用做同步监控的对象
- 被JVM持有的对象，由于特殊的目的不被GC回收。可能是系统类加载器，重要的异常处理类，为处理异常预留的对象，正在执行类加载的自定义的类加载器等.

2.7.其他

java内存溢出

Java存在着内存泄漏的情况，导致内存泄露的原因：长生命周期的对象持有短生命周期对象的引用就很可能发生内存泄露，
尽管短生命周期对象已经不再需要，但是因为长生命周期对象持有它的引用而导致不能被回收。

System.gc()

public static void gc() {
    Runtime.getRuntime().gc();
}

-XX:+ DisableExplicitGC 禁用gc()方法.
ExplicitGCInvokesConcurrent 是G1垃圾回收器的一个JVM参数，用于在执行显式垃圾回收时并发执行部分清理操作。
当设置为true时,当应用程序显式调用System.gc()方法或通过JMX接口执行显式的垃圾回收请求时，
G1垃圾回收器将在执行垃圾回收的同时尽可能地启动并发标记和清理阶段。可以在显式垃圾回收请求期间减少停顿时间。

堆外内存常配合使用System GC
堆外内存主要针对java.nio.DirectByteBuffer，这些对象的创建过程会通过Unsafe接口直接通过os::malloc来分配内存，
然后将内存的起始地址和大小存到java.nio.DirectByteBuffer对象里，这样就可以直接操作这些内存。
这些内存只有在DirectByteBuffer回收掉之后才有机会被回收，因此如果这些对象大部分都移到了old区，但是一直没有触发GC，物理内存可能被他们耗尽.
因此为了避免这种悲剧的发生，通过 -XX:MaxDirectMemorySize 来指定最大的堆外内存大小，
当使用达到了阈值的时候将调用System.gc来做一次full gc，以此来回收掉没有被使用的堆外内存.
显式调用System.gc垃圾回收并不能直接回收堆外内存，而是通过垃圾回收器清理无法访问到的DirectByteBuffer对象，并触发finalize()方法。
在finalize()方法中，可以手动释放堆外内存的资源，通常使用Unsafe接口的freeMemory()方法来释放内存。

三.内存分配

3.1.对象创建方式

new关键字调用了构造函数
Class的 newInstance方法调用了构造函数
Constructor类的 newInstance方法调用了构造函数
clone方法没有调用构造函数
反序列化没有调用构造函数

3.2.对象的分配

对象优先在 Eden 区分配
当 Eden 区分配没有足够的空间进行分配时，虚拟机将会发起一次 Minor GC。如果本次 GC 后还是没有足够的空间，则将启用分配担保机制在老年代中分配内存。
大对象直接进入老年代
需要大量连续内存空间的对象，频繁出现大对象是致命的，会导致在内存还有不少空间的情况下提前触发 GC 以获取足够的连续空间来安置新对象。
如果大对象直接在新生代分配就会导致 Eden 区和两个 Survivor 区之间发生大量的内存复制。因此对于大对象都会直接在老年代进行分配。
长期存活对象将进入老年代
虚拟机采用分代收集的思想来管理内存，内存回收时必须判断对象应该放在新生代或老年代。
虚拟机给每个对象定义了一个对象年龄的计数器，如果对象在 Eden区出生，并且能够被 Survivor 容纳，将被移动到 Survivor 空间中，这时设置对象年龄为 1。
对象在 Survivor 区中每「熬过」一次 Minor GC 年龄就加 1，当年龄达到一定程度(默认 15) 就会被晋升到老年代.(-XX:MaxTenuringThreshold=15,设置晋升年龄)

3.3.对象的内存布局

在 HotSpot 虚拟机里，对象在堆内存中的存储布局可以划分为三个部分:对象头、实例数据和对齐填充.

3.3.1.对象头

3.3.1.1.对象标记(Mark Word)

用于存储对象自身的运行时数据，如哈希码(hashCode)、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等等。
占用空间大小根据JVM决定，为JVM的一个字大小，也就是32位JVM中Mark Word占用4个字节，64位JVM中占用8个字节。

默认存储对象的HashCode、分代年龄和锁标志位等信息。
这些信息都是与对象自身定义无关的数据，所以MarkWord被设计成一个非固定的数据结构以便在极小的空间内存存储尽量多的数据。

根据对象的状态复用自己的存储空间，也就是说在运行期间MarkWord里存储的数据会随着’锁标志位’的变化而变化。

32位JVM

64位JVM

Epoch（时间戳）：用于记录偏向锁的撤销条件，当其他线程尝试获取该对象的锁时，需要检查该时间戳是否与对象头中的时间戳匹配。
如果不匹配，则偏向锁会被撤销，对象将升级为轻量级锁或重量级锁。

3.3.1.2.类元信息(Class pointer类型指针)

对象指向它的类元数据的指针，虚拟机通过这个指针来确定这个对象是哪个类的实例。(4字节)

3.3.2.实例数据

存放类的属性(Field)数据信息，包括父类的属性信息.
数组的实例部分还包括数组的长度.
这部分内存按4字节对齐。

3.3.3.对齐填充

虚拟机要求对象起始地址必须是8字节的整数倍。
填充数据不是必须存在的，仅仅是为了字节对齐这部分内存按8字节补充对齐。

3.4. 对象内存查看

依赖:



    org.openjdk.jol
    jol-core
    0.16

查看对象内存占用信息:

System.out.println(ClassLayout.parseInstance(object).toPrintable());

//省略getter,setter,constructor
public class ObjectHeadTest {
    static class LongObject {
        private Long num;
    }
    static class SimpleLongObject {
        private long num;
    }
    static class IntegerObject {
        private Integer num;
    }
    static class IntObject {
        private int num;
    }
    static class LongObjInObj {
        private LongObject num;
    }
    static class SimpleLongObjObjInObj {
        private SimpleLongObject num;
    }

    public static void main(String[] args) {
        LongObject longObject = new LongObject(1L);
        System.out.println("longObject = " + ClassLayout.parseInstance(longObject).toPrintable());
        LongObject nullLongObject = new LongObject();
        System.out.println("nullLongObject = " + ClassLayout.parseInstance(nullLongObject).toPrintable());

        SimpleLongObject simpleLongObject = new SimpleLongObject(1L);
        System.out.println("simpleLongObject = " + ClassLayout.parseInstance(simpleLongObject).toPrintable());
        SimpleLongObject nullSimpleLongObject = new SimpleLongObject();
        System.out.println("nullSimpleLongObject = " + ClassLayout.parseInstance(nullSimpleLongObject).toPrintable());

        IntegerObject integerObject = new IntegerObject(1);
        System.out.println("integerObject = " + ClassLayout.parseInstance(integerObject).toPrintable());
        IntObject intObject = new IntObject(1);
        System.out.println("intObject = " + ClassLayout.parseInstance(intObject).toPrintable());
        LongObjInObj longObjInObj = new LongObjInObj(longObject);
        System.out.println("longObjInObj = " + ClassLayout.parseInstance(longObjInObj).toPrintable());
        SimpleLongObjObjInObj simpleLongInObj = new SimpleLongObjObjInObj(simpleLongObject);
        System.out.println("simpleLongInObj = " + ClassLayout.parseInstance(simpleLongInObj).toPrintable());
    }
}

3.5.类加载的机制及过程

程序主动使用某个类时，如果该类还未被加载到内存中，则JVM会通过加载、连接、初始化3个步骤来对该类进行初始化。

加载
加载指的是将类的class文件读入到内存，并将这些静态数据转换成方法区中的运行时数据结构，
并在堆中生成一个代表这个类的java.lang.Class对象，作为方法区类数据的访问入口，这个过程需要类加载器参与。
类加载的最终产物就是位于堆中的 Class对象(不是目标类对象)，该对象封装了类在方法区中的数据结构，并且向用户提供了访问方法区数据结构的接口，即Java反射的接口.
Java类加载器由JVM提供，是所有程序运行的基础，JVM提供的这些类加载器通常被称为系统类加载器。
除此之外，可以通过继承 ClassLoader基类来创建自己的类加载器。
类加载器，可以从不同来源加载类的二进制数据，比如：本地 Class文件、Jar包 Class文件、网络Class文件等。
连接过程
连接阶段负责把类的二进制数据合并到JRE中(意思就是将java类的二进制代码合并到JVM的运行状态之中)。
类连接可分为3个阶段:
1. 验证：确保加载的类信息符合JVM规范，没有安全方面的问题。主要验证是否符合Class文件格式规范，并且是否能被当前的虚拟机加载处理;
2. 准备：正式为类变量(static变量)分配内存并设置类变量初始值的阶段，这些内存都将在方法区中进行分配;
3. 解析：虚拟机常量池的符号引用替换为字节引用过程;
初始化(初始化是为类的静态变量赋予正确的初始值)
初始化阶段是执行类构造器 () 方法的过程。
类构造器 ()方法是Java编译器生成的字节码中出现的一个特殊方法。负责执行类的静态变量初始化和静态代码块中的代码.代码从上往下执行。
当初始化一个类的时候，如果发现其父类还没有进行过初始化，则需要先触发其父类的初始化.
虚拟机会保证一个类的 () 方法在多线程环境中被正确加锁和同步.

3.6.JVM加载Class文件的原理机制

虚拟机把描述类的数据从Class文件加载到内存，并对数据进行校验，解析和初始化，最终形成可以被虚拟机直接使用的java类型。
Java中的所有类，都需要由类加载器装载到JVM中才能运行。类加载器本身也是一个类，而它的工作就是把class文件从硬盘读取到内存中。
在写程序的时候，几乎不需要关心类的加载，因为这些都是隐式装载的，除非有特殊的用法，像是反射，就需要显式的加载所需要的类。
类装载方式，有两种：

隐式装载，程序在运行过程中当碰到通过new等方式生成对象时，隐式调用类装载器加载对应的类到jvm中.
显式装载，通过class.forName() 等方法，显式加载需要的类.

为了节省内存开销,Java类的加载是动态的，并不会一次性将所有类全部加载后再运行，而是保证程序运行的基础类(像是基类)完全加载到jvm中.其他类，在需要的时候才加载。

3.7.类加载器定义与分类

实现通过类的全限定名获取类的二进制字节流的代码块叫做类加载器。
存在多种类加载器:

分工，各自负责各自的区块
为了实现委托模型

类加载器顺序:

启动类加载器(Bootstrap ClassLoader):用来加载java核心类库，无法被java程序直接引用。
扩展类加载器(extensions class loader):用来加载Java的扩展库。Java虚拟机的实现会提供一个扩展库目录。该类加载器在此目录里面查找并加载 Java 类。
系统类加载器(system class loader ):根据Java应用的类路径(CLASSPATH )来加载Java类。一般来说，Java应用的类都是由它来完成加载的。
可以通过ClassLoader.getSystemClassLoader()获取。
自定义类加载器: 通过继承java.lang.ClassLoader 类的方式实现。

类装载步骤

3.8.自定义类加载器

自定义类加载器的应用场景：

加密：Java代码可以轻易的被反编译，如果你需要把自己的代码进行加密以防止反编译，可以先将编译后的代码用某种加密算法加密，
类加密后就不能再用Java的ClassLoader去加载类了，这时就需要自定义ClassLoader在加载类的时候先解密类，然后再加载。
从非标准的来源加载代码：如果字节码是放在数据库、甚至是在云端，就可以自定义类加载器，从指定的来源加载类。

综合运用：比如应用需要通过网络来传输 Java 类的字节码，为了安全性，这些字节码经过了加密处理。
这个时候就需要自定义类加载器来从某个网络地址上读取加密后的字节代码，接着进行解密和验证，最后定义出在Java虚拟机中运行的类。

3.9.双亲委派模型:

双亲委派模型的工作过程：
一个类加载器收到了类加载的请求，不会先自己尝试去加载这个类，而是把这个请求委派给父类加载器去完成，每一层的类加载器都是如此，
这样所有的加载请求都会被传送到顶层的启动类加载器中，只有当父加载无法完成加载请求(它的搜索范围中没找到所需的类)时，子加载器才会尝试去加载类。

//双亲委派模型的工作过程源码
protected synchronized Class<?> loadClass(String name, boolean resolve) throws ClassNotFoundException{
    // 检查类是否已存在
    Class c = findLoadedClass(name);
    if (c == null) {
        try {
            if (parent != null) {
                c = parent.loadClass(name, false);
            } else {
                c = findBootstrapClassOrNull(name);
            }
        }
        catch (ClassNotFoundException e) {
        // 加载失败 抛出ClassNotFoundException thrown if class not found
        // from the non-null parent class loader
        //父类加载器无法完成类加载请求
        }
        if (c == null) {
            // If still not found, then invoke findClass in order to find the class
            //子加载器进行类加载
            c = findClass(name);
        }
    }
    if (resolve) {
        //判断是否需要链接过程，参数传入
        resolveClass(c);
    }
    return c;
}

好处：

安全性，避免用户编写的类动态替换Java的核心类，比如 String。
避免了类的重复加载，因为JVM中区分不同类，不仅仅是根据类名，相同的class文件被不同的ClassLoader加载就是不同的两个类。

3.10.JVM新建对象

User user = new User();JVM做了哪些操作?

加载类信息:JVM将首先加载 User 类的字节码文件，并解析其结构。这包括验证字节码的正确性，并构建类的运行时数据结构.
分配对象内存:JVM将根据 User 类的定义，在堆上分配内存空间以创建一个新的对象。这个对象包含了类的实例变量和一些额外的管理信息。
初始化对象:JVM会调用 User 类的构造函数来初始化这个对象。构造函数会为实例变量设置初始值，执行其他必要的初始化代码。
引用赋值:将对象的引用存储在 user 变量中，使得可以通过该变量访问对象。

对象内存布局

3.11.Java引用类型

强引用发生gc的时候不会被回收。
软引用 SoftReference：有用但不是必须的对象，在发生内存溢出之前会被回收。
弱引用 WeakReference：有用但不是必须的对象，在下一次GC时会被回收。
虚引用 PhantomReference：无法通过虚引用获得对象，用 PhantomReference 实现虚引用，虚引用的用途是在gc时返回一个通知。

四.JVM调优

4.1.工具

JDK 自带了很多监控工具，都位于 JDK 的 bin 目录下，其中最常用的是jconsole和jvisualvm这两款视图监控工具。
jconsole：用于对JVM中的内存、线程和类等进行监控；
jvisualvm：JDK自带的全能分析工具，可以分析：内存快照、线程快照、程序死锁、监控内存的变化、gc变化等。

4.2.调优参数

堆配置:

-Xms2g：初始化推大小为2g
-Xmx2g：堆最大内存为2g (为了防止垃圾收集器在最小、最大之间收缩堆而产生额外的时间，通常把最大、最小设置为相同的值)
-XX:NewSize=m;设置年轻代大小
-XX:NewRatio=4：设置年轻代的和老年代的内存比例为 1:4；年轻代和年老代将根据默认的比例(1：2)分配堆内存.
-XX:SurvivorRatio=8：设置新生代Eden和Survivor比例为 8:1

收集器配置:

串行收集器
- -XX:+UseSerialGC:设置串行收集器,只适用小数据量,一般不使用
并行收集器(吞吐量优先)
- -XX:+UseParallelGC:设置并行收集器,年轻代
- -XX:ParallelGCThreads=n:设置并行收集器收集时使用的CPU数。并行收集线程数,此值最好配置与处理器数目相同。
- -XX:+UseParalledlOldGC:设置并行年老代收集器;
- -XX:MaxGCPauseMillis=n:设置年轻代并行收集最大的暂停时间(如果到这个时间了，垃圾回收器依然没有回收完，也会停止回收)
- -XX:+UseAdaptiveSizePolicy:设置此选项以后，并行收集器会自动选择年轻代区大小和相应的Survivor区比例，以达到目标系统规定的最低响应时间或者收集频率等，
  此值建议使用并行收集器时，一直打开并发收集器(响应时间优先) ，减少垃圾收集时的停顿时间。适用于应用服务器、电信领域等
- -XX:+UseConcMarkSweepGC:设置并发收集器;指定使用 CMS + Serial Old 垃圾回收器组合；
- -XX:CMSFullGCsBeforeCompaction=n:由于并发收集器不对内存空间进行压缩、整理、所以运行一段时间以后会产生“碎片”，
  使得运行效率降低。此值设置运行多少次GC以后对内存空间进行压缩、整理
- -XX:+UseCMSCompactAtFullCollection：打开对年老代的压缩。可能会影响性能，但是可以消除碎片
- –XX:+UseParNewGC：指定使用 ParNew 垃圾回收器
- -XX:GCTimeRatio=n:设置垃圾回收时间占程序运行时间的百分比。公式为：1/(1+n)
- -XX:+CMSIncrementalMode:设置为增量模式。适用于单CPU情况.
辅助的GC典型配置参数:
- -XX:+PrintGC：开启打印 gc 信息；
- -XX:+PrintGCDetails：打印 gc 详细信息。
- -XX:+PrintGCTimeStamps：用于输出GC时间戳（JVM启动到当前日期的总时长的时间戳形式）
  0.855: [GC (Allocation Failure) [PSYoungGen: 33280K->5118K(38400K)] 33280K->5663K(125952K), 0.0067629 secs] [Times: user=0.01 sys=0.01, real=0.00 secs]
- -XX:+PrintGCDateStamps 用于输出GC时间戳（日期形式）
  2022-01-27T16:22:20.885+0800: 0.299: [GC pause (G1 Evacuation Pause) (young), 0.0036685 secs]
- -XX:+PrintHeapAtGC 在进行GC前后打印出堆的信息。
- -Xloggc:…/logs/gc.log:将日志输出到指定的文件中(已存在追加)

推荐配置

通过-XX:MaxRAMPercentage限制堆大小:

//参数需JDK 8u191+、JDK 10及以上版本。
/使用容器内存。允许JVM从主机读取cgroup限制，例如可用的CPU和RAM，并进行相应的配置。当容器超过内存限制时，会抛出OOM异常，而不是强制关闭容器。
-XX:+UseContainerSupport
//设置JVM使用容器内存的初始百分比。建议与-XX:MaxRAMPercentage保持一致，推荐设置为70.0。
-XX:InitialRAMPercentage=70.0
//设置JVM使用容器内存的最大百分比。由于存在系统组件开销，建议最大不超过75.0，推荐设置为70.0。
-XX:MaxRAMPercentage=70.0
//输出GC详细信息。
-XX:+PrintGCDetails
//输出GC时间戳。日期形式
-XX:+PrintGCDateStamps
//GC日志文件路径。需保证Log文件所在容器路径已存在. 
-Xloggc:/home/admin/nas/gc-${POD_IP}-$(date '+%s').log
//JVM发生OOM时，自动生成DUMP文件。
-XX:+HeapDumpOnOutOfMemoryError
//DUMP文件路径。需保证DUMP文件所在容器路径已存在. 
-XX:HeapDumpPath=/home/admin/nas/dump-${POD_IP}-$(date '+%s').hprof

通过-Xms -Xmx限制堆大小:
存在问题:

当规格大小调整后，需要重新设置堆大小参数。
当参数设置不合理时，会出现应用堆大小未达到阈值但容器OOM被强制关闭的情况。

//设置JVM初始内存大小。建议与-Xmx相同，避免每次垃圾回收完成后JVM重新分配内存。 推荐百分之70左右内存大小.
-Xms2048m 
//设置JVM最大可用内存大小。为避免容器OOM，请为系统预留足够的内存大小。
-Xmx2048m 
-XX:+PrintGCDetails 
-XX:+PrintGCDateStamps 
-Xloggc:/home/admin/nas/gc-${POD_IP}-$(date '+%s').log 
-XX:+HeapDumpOnOutOfMemoryError 
-XX:HeapDumpPath=/home/admin/nas/dump-${POD_IP}-$(date '+%s').hprof

4.3.性能调优

线程池：解决用户响应时间长的问题
连接池
JVM启动参数：调整各代的内存比例和垃圾回收算法，提高吞吐量
目标: GC的时间足够的小;GC的次数足够的少;发生Full GC的周期足够的长;
- 为了防止垃圾收集器在最小、最大之间收缩堆而产生额外的时间，通常把最大、最小设置为相同的值
- 年轻代和年老代将根据默认的比例(1：2)分配堆内存
- 更大的年轻代必然导致更小的年老代，大的年轻代会延长普通GC的周期，但会增加每次GC的时间；小的年老代会导致更频繁的Full GC;
  更小的年轻代必然导致更大年老代，小的年轻代会导致普通GC很频繁，但每次的GC时间会更短；大的年老代会减少Full GC的频率;
- 在配置较好的机器上(比如多核、大内存)，可以为年老代选择并行收集算法： -XX:+UseParallelOldGC ，默认为Serial收集
- 线程堆栈的设置：每个线程默认会开启1M的堆栈，用于存放栈帧、调用参数、局部变量等，对大多数应用而言这个默认值太了，
  -Xss 一般256K就足用。理论上，在内存不变的情况下，减少每个线程的堆栈，可以产生更多的线程，但实际上还受限于操作系统。
- 可以通过下面的参数打印Heap Dump信息
  -XX:HeapDumpPath: 指定堆转储(JVM中对象的所有详细信息)文件的输出路径
  -XX:+PrintGCDetails 打印 gc 详细信息。
  -XX:+PrintGCTimeStamps 打印 gc 详细信息。
  -Xloggc:/usr/aaa/dump/heap_trace.txt
- 通过下面参数可以控制 OutOfMemoryError 时打印堆的信息
  -XX:+HeapDumpOnOutOfMemoryError
- 请看一下一个时间的Java参数配置：(服务器：Linux 64Bit，8Core×16G)
  JAVA_OPTS=“$JAVA_OPTS -server -Xms3G -Xmx3G -Xss256k -XX:PermSize=128m -XX:MaxPermSize=128m
  -XX:+UseParallelOldGC -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/usr/aaa/dump
  -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -Xloggc:/usr/aaa/dump/heap_trace.txt
  -XX:NewSize=1G -XX:MaxNewSize=1G”

4.4.程序算法：改进程序逻辑算法提高性能

五.启动参数与命令

5.1.设置参数方式

开发工具

IDEA 、Eclipse 在run configuration 里设置VM option
运行jar包， java -XX:+UseG1GC xxx.jar

线上环境:

web容器：Tomcat， startup.sh -> catalina.sh(卡特琳娜) 里设置JVM 参数
jsp + jinfo 查看某个java进程的参数，然后再调整设置

真实调优:

java -XX:+UseG1GC xxx.jar

5.2.java -help 标准参数(不会随着JDK 变化而变化版本的参数)

-d32 使用 32 位数据模型 (如果可用)
-d64 使用 64 位数据模型 (如果可用)
-server 选择 “server” VM ;默认 VM 是 server.
-cp <目录和 zip/jar 文件的类搜索路径>
-classpath <目录和 zip/jar 文件的类搜索路径> 用 ; 分隔的目录, JAR 档案和 ZIP 档案列表, 用于搜索类文件。
-D<名称>=<值> 设置系统属性可用System.getProperty(“property”)获取
-verbose:[class|gc|jni] 启用详细输出
-version 输出产品版本并退出
-showversion 输出产品版本并继续
-? -help 输出此帮助消息
-X 输出非标准选项的帮助
-enableassertions[:…|:]
-ea[:…|:] 按指定的粒度启用断言
-disableassertions[:…|:]
-da[:…|:] 禁用具有指定粒度的断言
-esa | -enablesystemassertions 启用系统断言
-dsa | -disablesystemassertions 禁用系统断言
-agentlib:[=<选项>] 加载本机代理库 , 例如 -agentlib:hprof 另请参阅 -agentlib:jdwp=help 和 -agentlib:hprof=help
-agentpath:[=<选项>] 按完整路径名加载本机代理库
-javaagent:[=<选项>] 加载 Java 编程语言代理, 请参阅 java.lang.instrument
-splash: 使用指定的图像显示启动屏幕

5.3.java -X 非标准参数 (java -X命令，能够获得当前JVM支持的所有非标准参数列表)

-Xmixed 混合模式执行 (默认)
-Xint 仅解释模式执行
-Xbootclasspath: <用 ; 分隔的目录和 zip/jar 文件> 设置搜索路径以引导类和资源
-Xbootclasspath/a: <用 ; 分隔的目录和 zip/jar 文件> 附加在引导类路径末尾
-Xbootclasspath/p: <用 ; 分隔的目录和 zip/jar 文件> 置于引导类路径之前
-Xdiag 显示附加诊断消息
-Xnoclassgc 禁用类垃圾收集
-Xincgc 启用增量垃圾收集
-Xloggc: 将 GC 状态记录在文件中 (带时间戳)
-Xbatch 禁用后台编译
-Xprof 输出 cpu 配置文件数据
-Xfuture 启用最严格的检查, 预期将来的默认值
-Xrs 减少 Java/VM 对操作系统信号的使用
-Xcheck:jni 对 JNI 函数执行其他检查
-Xshare:off 不尝试使用共享类数据
-Xshare:auto 在可能的情况下使用共享类数据 (默认)
-Xshare:on 要求使用共享类数据, 否则将失败。
-XshowSettings 显示所有设置并继续
-XshowSettings:all 显示所有设置并继续
-XshowSettings:vm 显示所有与 vm 相关的设置并继续
-XshowSettings:properties 显示所有属性设置并继续
-XshowSettings:locale 显示所有与区域设置相关的设置并继续

5.4.java -XX 非固定参数

使用方式:

-XX:+ 启用选项
-XX:- 不启用选项
-XX:= 给选项设置一个数字类型值，可跟单位，例如 32k, 1024m, 2g
-XX:= 给选项设置一个字符串值，例如-XX:HeapDumpPath=./dump.core

行为参数(功能开关):

-XX:-UseSerialGC 启用串行GC
-XX:-UseParallelGC 启用并行GC
-XX:GCTimeRatio=99 设置用户执行时间占总时间的比例(默认值99，即1%的时间用于GC)
-XX:MaxGCPauseMillis=time 设置GC的最大停顿时间(只对Parallel Scavenge有效)
-XX:+UseParNewGC 使用ParNew+Serial Old收集器组合
-XX:ParallelGCThreads 设置执行内存回收的线程数，在 +UseParNewGC 的情况下使用
-XX:-UseParallelOldGC 对Full GC启用并行，当-XX:-UseParallelGC 启用时该项自动启用,使用Parallel Scavenge +Parallel Old组合收集器
-XX:-UseConcMarkSweepGC 对老生代采用标记清除交换算法进行GC CMS(Concurrent Mark Sweep)收集器(标记-清除算法)
-XX:+ScavengeBeforeFullGC 新生代GC优先于Full GC执行
-XX:-DisableExplicitGC 禁止调用System.gc()；但jvm的gc仍然有效
-XX:+MaxFDLimit 最大化文件描述符的数量限制
-XX:+UseGCOverheadLimit 在抛出OOM之前限制jvm耗费在GC上的时间比例
-XX:+UseThreadPriorities 启用本地线程优先级
-XX:AutoBoxCacheMax 缓存最大值,默认为127 (Integer默认缓存 -128~127)

性能调优:

-Xms 设置初始 Java 堆大小
-Xmx 设置最大 Java 堆大小
-Xss 设置 Java 线程堆栈大小,默认1m
-XX:PretenureSizeThreshold 大于此值得对象直接分配在老年代(只对Serial和ParNew两款收集器有效),以B为单位,1kb学制为1024
-XX:NewSize=2.125m 新生代对象生成时占用内存的默认值
-XX:MaxNewSize=size 新生成对象能占用内存的最大值
-XX:PermSize=64m 方法区分配的初始内存
-XX:MaxPermSize=64m 方法区能(永久代)占用内存的最大值
-XX:NewRatio=2 新生代内存容量与老生代内存容量的比例,默认2,即 1:2
-XX:SurvivorRatio=8 Eden区域Survivor区的容量比值，如默认值为8，代表Eden：Survivor1：Survivor2=8:1:1
-XX:MaxTenuringThreshold=15 对象在新生代存活区切换的次数(坚持过MinorGC的次数，每坚持过一次，该值就增加1),大于该值会进入老年代(年龄阈值)
-XX:MinHeapFreeRatio=40 GC后java堆中空闲量占的最小比例
-XX:MaxHeapFreeRatio=70 GC后java堆中空闲量占的最大比例
-XX:ThreadStackSize=512 设置线程栈大小，若为0则使用系统默认值
-XX:MetaspaceSize=128m 元空间(永久代) 初始大小;元空间的默认初始大小是20.75MB
-XX:MaxMetaspaceSize=128m 元空间(永久代) 最大空间一般建议在JVM参数中将MetaspaceSize和MaxMetaspaceSize设置成一样的值
-XX:LargePageSizeInBytes=4m 设置用于Java堆的大页面尺寸
-XX:ReservedCodeCacheSize=32m 保留代码占用的内存容量
-XX:+UseLargePages 使用大页面内存

调试参数:

-XX:-CITime 打印消耗在JIT编译的时间
-XX:ErrorFile=./hs_err_pid.log 保存错误日志或者数据到文件中
-XX:-ExtendedDTraceProbes 开启solaris特有的dtrace探针
-XX:HeapDumpPath=./java_pid.hprof 指定导出堆信息时的路径或文件名
-XX:-HeapDumpOnOutOfMemoryError 当首次遭遇OOM时导出此时堆中相关信息
-XX:OnError=“;” 出现致命ERROR之后运行自定义命令
-XX:OnOutOfMemoryError=“;” 当首次遭遇OOM时执行自定义命令
-XX:-PrintClassHistogram 遇到Ctrl-Break后打印类实例的柱状信息，与jmap -histo功能相同
-XX:-PrintConcurrentLocks 遇到Ctrl-Break后打印并发锁的相关信息，与jstack -l功能相同
-XX:-PrintCommandLineFlags 打印在命令行标记,用于查看jvm参数
-XX:-PrintCompilation 当一个方法被编译时打印相关信息
-XX:-PrintGC 每次GC时打印相关信息
-XX:-PrintGC Details 每次GC时打印详细信息
-XX:-PrintGCTimeStamps 打印每次GC的时间戳
-XX:-TraceClassLoading 跟踪类的加载信息
-XX:-TraceClassLoadingPreorder 跟踪被引用到的所有类的加载信息
-XX:-TraceClassResolution 跟踪常量池
-XX:-TraceClassUnloading 跟踪类的卸载信息
-XX:-TraceLoaderConstraints 跟踪类加载器约束的相关信息

5.5.其他命令

JPS 查看java进程id
jinfo [options]
- -flags：显示 JVM 启动时设置的标志（Flag）信息。
- -sysprops：显示 Java 系统属性（System Property）信息。
- -commandline：显示 Java 进程的启动命令行参数信息。
- -flag ：显示指定 Flag 的设置值。
- -flag [+/-]：将指定 Flag 的设置值在运行时开启或关闭。
- -help：帮助信息。
jstat 查看性能类加载、内存、垃圾收集情况、 JIT 实时编译的运行时数据
- jstat [-t] [-h]
- jstat [option [interval [s|m] [count] ] ]

option参数	解释
-class	显示ClassLoad的相关信息
-compiler	显示JIT编译的相关信息
-gc	显示和gc相关的堆信息-
-gccapacity	显示各个代的容量以及使用情况
-gccause	显示垃圾回收的相关信息(通-gcutil)，同时显示最后一次或当前正在发生的垃圾回收的诱因
-gcnew	显示新生代的信息
-gcnewcapacity	显示新生代大小和使用情况
-gcold	显示老年代和永久代的信息
-gcoldcapacity	显示老年代的大小
-gcpermcapacity	显示永久代的大小
-gcutil	显示垃圾收集信息
-printcompilation	输出JIT编译的方法信息

参数	解释
-t	可以在打印的列上加上Timestamp列，用于显示系统运行的时间
-h	可以在周期性数据的时候，可以在指定输出多少行以后输出一次表头
interval	执行每次的间隔时间，单位为毫秒
count	用于指定输出多少次记录，缺省则会一直打印

你可能感兴趣的:(JAVA,java,jvm)

Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
【华为OD机试真题2023B卷 JAVA&JS】We Are A Team 若博豆 java 算法华为 javascript
华为OD2023（B卷）机试题库全覆盖，刷题指南点这里WeAreATeam时间限制：1秒|内存限制：32768K|语言限制：不限题目描述：总共有n个人在机房，每个人有一个标号（1<=标号<=n），他们分成了多个团队，需要你根据收到的m条消息判定指定的两个人是否在一个团队中，具体的：1、消息构成为：abc，整数a、b分别代
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
Java 重写(Override)与重载(Overload) 叨唧唧的
Java重写(Override)与重载(Overload)重写(Override)重写是子类对父类的允许访问的方法的实现过程进行重新编写,返回值和形参都不能改变。即外壳不变，核心重写！重写的好处在于子类可以根据需要，定义特定于自己的行为。也就是说子类能够根据需要实现父类的方法。重写方法不能抛出新的检查异常或者比被重写方法申明更加宽泛的异常。例如：父类的一个方法申明了一个检查异常IOExceptio
简单了解 JVM 记得开心一点啊 jvm
目录♫什么是JVM♫JVM的运行流程♫JVM运行时数据区♪虚拟机栈♪本地方法栈♪堆♪程序计数器♪方法区/元数据区♫类加载的过程♫双亲委派模型♫垃圾回收机制♫什么是JVMJVM是JavaVirtualMachine的简称，意为Java虚拟机。虚拟机是指通过软件模拟的具有完整硬件功能的、运行在一个完全隔离的环境中的完整计算机系统（如：JVM、VMwave、VirtualBox）。JVM和其他两个虚拟机
1分钟解决 -bash: mvn: command not found，在Centos 7中安装Maven Energet!c 开发语言
1分钟解决-bash:mvn:commandnotfound，在Centos7中安装Maven检查Java环境1下载Maven2解压Maven3配置环境变量4验证安装5常见问题与注意事项6总结检查Java环境Maven依赖Java环境，请确保系统已经安装了Java并配置了环境变量。可以通过以下命令检查：java-version如果未安装，请先安装Java。1下载Maven从官网下载：前往Apach
Java企业面试题3 马龙强_ java
1.break和continue的作用(智*图)break：用于完全退出一个循环（如for,while）或一个switch语句。当在循环体内遇到break语句时，程序会立即跳出当前循环体，继续执行循环之后的代码。continue：用于跳过当前循环体中剩余的部分，并开始下一次循环。如果是在for循环中使用continue，则会直接进行条件判断以决定是否执行下一轮循环。2.if分支语句和switch分
JVM、JRE和 JDK：理解Java开发的三大核心组件 Y雨何时停T Java java
Java是一门跨平台的编程语言，它的成功离不开背后强大的运行环境与开发工具的支持。在Java的生态中，JVM（Java虚拟机）、JRE（Java运行时环境）和JDK（Java开发工具包）是三个至关重要的核心组件。本文将探讨JVM、JDK和JRE的区别，帮助你更好地理解Java的运行机制。1.JVM：Java虚拟机（JavaVirtualMachine）什么是JVM？JVM，即Java虚拟机，是Ja
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
白骑士的Java教学基础篇 2.5 控制流语句白骑士所长 Java 教学 java 开发语言
欢迎继续学习Java编程的基础篇！在前面的章节中，我们了解了Java的变量、数据类型和运算符。接下来，我们将探讨Java中的控制流语句。控制流语句用于控制程序的执行顺序，使我们能够根据特定条件执行不同的代码块，或重复执行某段代码。这是编写复杂程序的基础。通过学习这一节内容，你将掌握如何使用条件语句和循环语句来编写更加灵活和高效的代码。条件语句条件语句用于根据条件的真假来执行不同的代码块。if语句‘
python语法——三目运算符 HappyRocking python python 三目运算符
在java中，有三目运算符，如：intc=(a>b)?a:b表示c取两者中的较大值。但是在python，不能直接这样使用，估计是因为冒号在python有分行的关键作用。那么在python中，如何实现类似功能呢？可以使用ifelse语句，也是一行可以完成，格式为：aifbelsec表示如果b为True，则表达式等于a，否则等于c。如：c=(aif(a>b)elseb)同样是完成了取最大值的功能。
ArrayList 源码解析程序猿进阶 Java基础 ArrayList List java 面试性能优化架构设计 idea
ArrayList是Java集合框架中的一个动态数组实现，提供了可变大小的数组功能。它继承自AbstractList并实现了List接口，是顺序容器，即元素存放的数据与放进去的顺序相同，允许放入null元素，底层通过数组实现。除该类未实现同步外，其余跟Vector大致相同。每个ArrayList都有一个容量capacity，表示底层数组的实际大小，容器内存储元素的个数不能多于当前容量。当向容器中添
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
Java：爬虫框架 dingcho Java java 爬虫
一、ApacheNutch2【参考地址】Nutch是一个开源Java实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。Nutch致力于让每个人能很容易,同时花费很少就可以配置世界一流的Web搜索引擎.为了完成这一宏伟的目标,Nutch必须能够做到:每个月取几十亿网页为这些网页维护一个索引对索引文件进行每秒上千次的搜索提供高质量的搜索结果简单来说Nutch支持分
python怎么将png转为tif_png转tif weixin_39977276
发国外的文章要求图片是tif，cmyk色彩空间的。大小尺寸还有要求。比如网上大神多，找到了一段代码，感谢！https://www.jianshu.com/p/ec2af4311f56https://github.com/KevinZc007/image2Tifimportjava.awt.image.BufferedImage;importjava.io.File;importjava.io.Fi
JavaScript 中，深拷贝（Deep Copy）和浅拷贝（Shallow Copy）跳房子的前端前端面试 javascript 开发语言 ecmascript
在JavaScript中，深拷贝（DeepCopy）和浅拷贝（ShallowCopy）是用于复制对象或数组的两种不同方法。了解它们的区别和应用场景对于避免潜在的bugs和高效地处理数据非常重要。以下是对深拷贝和浅拷贝的详细解释，包括它们的概念、用途、优缺点以及实现方式。1.浅拷贝（ShallowCopy）概念定义：浅拷贝是指创建一个新的对象或数组，其中包含了原对象或数组的基本数据类型的值和对引用数
JAVA·一个简单的登录窗口 MortalTom java 开发语言学习
文章目录概要整体架构流程技术名词解释技术细节资源概要JavaSwing是Java基础类库的一部分，主要用于开发图形用户界面（GUI）程序整体架构流程新建项目，导入sql.jar包（链接放在了文末），编译项目并运行技术名词解释一、特点丰富的组件提供了多种可视化组件，如按钮（JButton）、文本框（JTextField）、标签（JLabel）、下拉列表（JComboBox）等，可以满足不同的界面设计
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
00. 这里整理了最全的爬虫框架（Java + Python）有一只柴犬爬虫系列爬虫 java python
目录1、前言2、什么是网络爬虫3、常见的爬虫框架3.1、java框架3.1.1、WebMagic3.1.2、Jsoup3.1.3、HttpClient3.1.4、Crawler4j3.1.5、HtmlUnit3.1.6、Selenium3.2、Python框架3.2.1、Scrapy3.2.2、BeautifulSoup+Requests3.2.3、Selenium3.2.4、PyQuery3.2
深入浅出 -- 系统架构之负载均衡Nginx的性能优化 xiaoli8748_软件开发系统架构系统架构负载均衡 nginx
一、Nginx性能优化到这里文章的篇幅较长了，最后再来聊一下关于Nginx的性能优化，主要就简单说说收益最高的几个优化项，在这块就不再展开叙述了，毕竟影响性能都有多方面原因导致的，比如网络、服务器硬件、操作系统、后端服务、程序自身、数据库服务等，对于性能调优比较感兴趣的可以参考之前《JVM性能调优》中的调优思想。优化一：打开长连接配置通常Nginx作为代理服务，负责分发客户端的请求，那么建议开启H
常见的 JVM 调优方法有哪些？爪哇天下 jvm
常见的JVM调优方法有哪些？可以具体到调整哪个参数，调成什么值？对年轻代的EdenSurvivor的比例进行配置-XX:SurvivorRatio=8：表示设置2个Survivor区：1个Eden区的大小比值为2:8，这意味着Survivor区占整个年轻代的1/5，这个参数默认为8如果经常性的SurvivorTo放不下YGC的剩余的对象时候，可以适当的调整比例常用的CMS收集器：设置回收阈值，需要
JAVA学习笔记之23种设计模式学习 victorfreedom Java技术设计模式 android java 常用设计模式
博主最近买了《设计模式》这本书来学习，无奈这本书是以C++语言为基础进行说明，整个学习流程下来效率不是很高，虽然有的设计模式通俗易懂，但感觉还是没有充分的掌握了所有的设计模式。于是博主百度了一番，发现有大神写过了这方面的问题，于是博主迅速拿来学习。一、设计模式的分类总体来说设计模式分为三大类：创建型模式，共五种：工厂方法模式、抽象工厂模式、单例模式、建造者模式、原型模式。结构型模式，共七种：适配器
JavaScript `Map` 和 `WeakMap`详细解释跳房子的前端 JavaScript 原生方法 javascript 前端开发语言
在JavaScript中，Map和WeakMap都是用于存储键值对的数据结构，但它们有一些关键的不同之处。MapMap是一种可以存储任意类型的键值对的集合。它保持了键值对的插入顺序，并且可以通过键快速查找对应的值。Map提供了一些非常有用的方法和属性来操作这些数据对：set(key,value):将一个键值对添加到Map中。如果键已经存在，则更新其对应的值。get(key):获取指定键的值。如果键
切换淘宝最新npm镜像源是 hai40587 npm 前端 node.js
切换淘宝最新npm镜像源是一个相对简单的过程，但首先需要明确当前淘宝npm镜像源的状态和最新的镜像地址。由于网络环境和服务更新，镜像源的具体地址可能会发生变化，因此，我将基于当前可获取的信息，提供一个通用的切换步骤，并附上最新的镜像地址（截至回答时）。一、了解npm镜像源npm（NodePackageManager）是JavaScript的包管理器，用于安装、更新和管理项目依赖。由于npm官方仓库
分享100个最新免费的高匿HTTP代理IP mcj8089 代理IP 代理服务器匿名代理免费代理IP 最新代理IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ 120.198.243.130:80,中国/广东省 58.251.78.71:8088,中国/广东省 183.207.228.22:83,中国/
mysql高级特性之数据分区 annan211 java 数据结构 mongodb 分区 mysql
mysql高级特性 1 以存储引擎的角度分析，分区表和物理表没有区别。是按照一定的规则将数据分别存储的逻辑设计。器底层是由多个物理字表组成。 2 分区的原理分区表由多个相关的底层表实现，这些底层表也是由句柄对象表示，所以我们可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样(所有底层表都必须使用相同的存储引擎)，分区表的索引只是
JS采用正则表达式简单获取URL地址栏参数 chiangfai js 地址栏参数获取
GetUrlParam:function GetUrlParam(param){ var reg = new RegExp("(^|&)"+ param +"=([^&]*)(&|$)"); var r = window.location.search.substr(1).match(reg); if(r!=null
怎样将数据表拷贝到powerdesigner (本地数据库表) Array_06 powerDesigner
================================================== 1、打开PowerDesigner12，在菜单中按照如下方式进行操作 file->Reverse Engineer->DataBase 点击后，弹出 New Physical Data Model 的对话框 2、在General选项卡中 Model name:模板名字，自
logbackのhelloworld 飞翔的马甲日志 logback
一、概述 1.日志是啥？当我是个逗比的时候我是这么理解的：log.debug()代替了system.out.print(); 当我项目工作时，以为是一堆得.log文件。这两天项目发布新版本，比较轻松，决定好好地研究下日志以及logback。传送门1：日志的作用与方法： http://www.infoq.com/cn/articles/why-and-how-log 上面的作
新浪微博爬虫模拟登陆随意而生新浪微博
转载自：http://hi.baidu.com/erliang20088/item/251db4b040b8ce58ba0e1235 近来由于毕设需要，重新修改了新浪微博爬虫废了不少劲，希望下边的总结能够帮助后来的同学们。现行版的模拟登陆与以前相比，最大的改动在于cookie获取时候的模拟url的请求
synchronized 香水浓 java thread
Java语言的关键字，可用来给对象和方法或者代码块加锁，当它锁定一个方法或者一个代码块的时候，同一时刻最多只有一个线程执行这段代码。当两个并发线程访问同一个对象object中的这个加锁同步代码块时，一个时间内只能有一个线程得到执行。另一个线程必须等待当前线程执行完这个代码块以后才能执行该代码块。然而，当一个线程访问object的一个加锁代码块时，另一个线程仍然
maven 简单实用教程 AdyZhang maven
1. Maven介绍 1.1. 简介 java编写的用于构建系统的自动化工具。目前版本是2.0.9，注意maven2和maven1有很大区别，阅读第三方文档时需要区分版本。 1.2. Maven资源见官方网站；The 5 minute test，官方简易入门文档；Getting Started Tutorial，官方入门文档；Build Coo
Android 通过 intent传值获得null aijuans android
我在通过intent 获得传递兑现过的时候报错，空指针,我是getMap方法进行传值，代码如下 1 2 3 4 5 6 7 8 9 public void getMap(View view){ Intent i =
apache 做代理报如下错误：The proxy server received an invalid response from an upstream baalwolf response
网站配置是apache＋tomcat,tomcat没有报错，apache报错是： The proxy server received an invalid response from an upstream server. The proxy server could not handle the request GET /. Reason: Error reading fr
Tomcat6 内存和线程配置 BigBird2012 tomcat6
1、修改启动时内存参数、并指定JVM时区（在windows server 2008 下时间少了8个小时）在Tomcat上运行j2ee项目代码时，经常会出现内存溢出的情况，解决办法是在系统参数中增加系统参数： window下，在catalina.bat最前面 set JAVA_OPTS=-XX:PermSize=64M -XX:MaxPermSize=128m -Xms5
Karam与TDD bijian1013 Karam TDD
一.TDD 测试驱动开发（Test-Driven Development,TDD）是一种敏捷（AGILE）开发方法论，它把开发流程倒转了过来，在进行代码实现之前，首先保证编写测试用例，从而用测试来驱动开发（而不是把测试作为一项验证工具来使用）。 TDD的原则很简单： a.只有当某个
[Zookeeper学习笔记之七]Zookeeper源代码分析之Zookeeper.States bit1129 zookeeper
public enum States { CONNECTING, //Zookeeper服务器不可用，客户端处于尝试链接状态 ASSOCIATING, //？？？ CONNECTED, //链接建立，可以与Zookeeper服务器正常通信 CONNECTEDREADONLY, //处于只读状态的链接状态，只读模式可以在
【Scala十四】Scala核心八：闭包 bit1129 scala
Free variable A free variable of an expression is a variable that’s used inside the expression but not defined inside the expression. For instance, in the function literal expression (x: Int) => (x
android发送json并解析返回json ronin47 android
package com.http.test; import org.apache.http.HttpResponse; import org.apache.http.HttpStatus; import org.apache.http.client.HttpClient; import org.apache.http.client.methods.HttpGet; import
一份IT实习生的总结 brotherlamp PHP php资料 php教程 php培训 php视频
今天突然发现在不知不觉中自己已经实习了 3 个月了，现在可能不算是真正意义上的实习吧，因为现在自己才大三，在这边撸代码的同时还要考虑到学校的功课跟期末考试。让我震惊的是，我完全想不到在这 3 个月里我到底学到了什么，这是一件多么悲催的事情啊。同时我对我应该 get 到什么新技能也很迷茫。所以今晚还是总结下把，让自己在接下来的实习生活有更加明确的方向。最后感谢工作室给我们几个人这个机会让我们提前出来
据说是2012年10月人人网校招的一道笔试题-给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。将重物放到天平左侧，问在两边如何添加砝码 bylijinnan java
public class ScalesBalance { /** * 题目： * 给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。（假设N无限大，但一种重量的砝码只有一个） * 将重物放到天平左侧，问在两边如何添加砝码使两边平衡 * * 分析： * 三进制 * 我们约定括号表示里面的数是三进制，例如 47=(1202
dom4j最常用最简单的方法 chiangfai dom4j
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要
简单HBase笔记 chenchao051 hbase
一、Client-side write buffer 客户端缓存请求描述：可以缓存客户端的请求，以此来减少RPC的次数，但是缓存只是被存在一个ArrayList中，所以多线程访问时不安全的。可以使用getWriteBuffer()方法来取得客户端缓存中的数据。默认关闭。二、Scan的Caching 描述： next( )方法请求一行就要使用一次RPC,即使
mysqldump导出时出现when doing LOCK TABLES daizj mysql mysqdump 导数据
　　执行　mysqldump -uxxx -pxxx -hxxx -Pxxxx database tablename > tablename.sql　导出表时，会报 mysqldump: Got error: 1044: Access denied for user 'xxx'@'xxx' to database 'xxx' when doing LOCK TABLES 解决
CSS渲染原理 dcj3sjt126com Web
从事Web前端开发的人都与CSS打交道很多，有的人也许不知道css是怎么去工作的，写出来的css浏览器是怎么样去解析的呢？当这个成为我们提高css水平的一个瓶颈时，是否应该多了解一下呢？一、浏览器的发展与CSS
《阿甘正传》台词 dcj3sjt126com
Part Ⅰ: 《阿甘正传》Forrest Gump经典中英文对白 Forrest: Hello! My names Forrest. Forrest Gump. You wanna Chocolate? I could eat about a million and a half othese. My momma always said life was like a box ochocol
Java处理JSON dyy_gusi json
Json在数据传输中很好用，原因是JSON 比 XML 更小、更快，更易解析。在Java程序中，如何使用处理JSON，现在有很多工具可以处理，比较流行常用的是google的gson和alibaba的fastjson，具体使用如下： 1、读取json然后处理 class ReadJSON { public static void main(String[] args)
win7下nginx和php的配置 geeksun nginx
1. 安装包准备 nginx : 从nginx.org下载nginx-1.8.0.zip php：从php.net下载php-5.6.10-Win32-VC11-x64.zip， php是免安装文件。 RunHiddenConsole: 用于隐藏命令行窗口 2. 配置 # java用8080端口做应用服务器，nginx反向代理到这个端口即可 p
基于2.8版本redis配置文件中文解释 hongtoushizi redis
转载自： http://wangwei007.blog.51cto.com/68019/1548167 在Redis中直接启动redis-server服务时, 采用的是默认的配置文件。采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务。下面是Redis2.8.9的配置文
第五章常用Lua开发库3-模板渲染 jinnianshilongnian nginx lua
动态web网页开发是Web开发中一个常见的场景，比如像京东商品详情页，其页面逻辑是非常复杂的，需要使用模板技术来实现。而Lua中也有许多模板引擎，如目前我在使用的lua-resty-template，可以渲染很复杂的页面，借助LuaJIT其性能也是可以接受的。如果学习过JavaEE中的servlet和JSP的话，应该知道JSP模板最终会被翻译成Servlet来执行；而lua-r
JZSearch大数据搜索引擎颠覆者 JavaScript
系统简介：大数据的特点有四个层面：第一，数据体量巨大。从TB级别，跃升到PB级别；第二，数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。第四，处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume，Variety，Value，Velocity。大数据搜索引
10招让你成为杰出的Java程序员 pda158 java 编程框架
如果你是一个热衷于技术的 Java 程序员，那么下面的 10 个要点可以让你在众多 Java 开发人员中脱颖而出。　　 1. 拥有扎实的基础和深刻理解 OO 原则　　对于 Java 程序员，深刻理解 Object Oriented Programming（面向对象编程）这一概念是必须的。没有 OOPS 的坚实基础，就领会不了像 Java 这些面向对象编程语言
tomcat之oracle连接池配置小网客 oracle
tomcat版本7.0 配置oracle连接池方式：修改tomcat的server.xml配置文件： <GlobalNamingResources> <Resource name="utermdatasource" auth="Container" type="javax.sql.DataSou
Oracle 分页算法汇总 vipbooks oracle sql 算法 .net
这是我找到的一些关于Oracle分页的算法，大家那里还有没有其他好的算法没？我们大家一起分享一下！ -- Oracle 分页算法一 select * from ( select page.*,rownum rn from (select * from help) page -- 20 = (currentPag