屈家全

JVM java虚拟机入门指南

文章目录

为什么学习JVM
JVM的执行流程
JVM的组成部分
- 类加载
- 运行时数据区
- 本地方法接口
- 执行引擎
垃圾回收
- 什么样的对象是垃圾呢
- 内存溢出和内存泄漏
- 定位垃圾的方法
- 对象的finalization机制
- 垃圾回收算法
- 分代回收
- 垃圾回收器
JVM调优参数
JVM调优工具
Java内存泄漏排查思路
CPU飙高排查方案与思路

为什么学习JVM

JVM是Java的运行环境，优点是一次编译，到处运行。这是因为JVM是运行在操作系统上的，无论在什么操作系统都可以执行，所以常说Java是跨平台性的。
学习JVM能更深入的理解Java这门语言，理解Java语言底层代码的执行过程，为后期写出优质代码做好准备。比如很多时候一个问题需要深入字节码层次去分析才能得到准确的结论，字节码就是JVM的一部分。并且项目上线去排查一些程序log日志中无法呈现的问题，如：内存溢出等。
相较于C/C++Java不需要手动的去进行垃圾回收，但是正因为Java将内存控制交给JVM，一旦出现内存泄漏和溢出方面的问题，如果不了解JVM，是很难进行排查的。

JVM的执行流程

程序在执行前先要把Java代码转换成字节码（.class）文件，JVM需要将字节码文件通过一定方式的类加载器（ClassLoader）把文件加载到内存的运行时数据区（Runtime Data Area），而字节码文件是JVM的一套指令集规范，并不能直接由底层操作系统区执行，因此需要特定的命令解析器**执行引擎（Execution Engine）将字节码翻译成底层系统指令再交给CPU去执行，这个过程中需要调用其他语言的接口本地库接口（Native Interface）**来实现整个程序的功能。

JVM的组成部分

类加载、运行时数据区（内存区域）、本地方法接口、执行引擎。

类加载

加载：读取字节码文件，转换并存储，为每个类创建一个class类对象并存储在方法区中。
链接：
- 验证：检查被加载的类内部结构是否正确，对字节码文件格式进行验证，判断文件是否污染并对基本语法格式验证。
- 准备：为静态的变量分配内存，并设置默认初始值，不包含使用final修饰的static常量。
- 解析：将符号引用（方法名）转化为直接引用（使用指针指向地址），将字节码中的表现形式转为内存中的表现形式。
初始化：类的初始化，为类中定义的静态变量进行赋值。
类加载器分类：引导(启动)类加载器（C+）、扩展类加载器、应用程序类加载器（默认）、自定义类加载器。
双亲委派机制及其打破：如果一个类加载器收到了类加载请求，它并不会自己先去加载，而是把这个请求委托给父类的加载器去执行，如果父加载器还存在其父加载器，则继续向上委托，最终将到达顶层的启动类加载器，如果父类加载器可以完成类的加载任务，就成功返回，若无法完成加载任务，子加载器才会尝试自己去加载。如果都加载失败，则抛出异常ClassNotFoundException。目的：为了确保加载系统类。优点：安全，可以避免用户自己编写的类替换Java的核心类库，并避免类重复加载。打破：通过集成ClassLoader类，重写loaclClass/findClass方法，实现自定义类加载。Tomcat就是自定义的类加载。

运行时数据区

程序计数器：线程私有的，内部保存的是字节码的行号，用于记录正在执行的字节码指令的地址。
- 字节码的行号：Java代码运行时，编译后的字节码文件是一行一行执行的，PC计数器就是记录当前线程执行的行号的，目的是其他线程抢占该线程后，下次接着之前执行的位置执行。
Java虚拟机栈：线程私有的，随着线程创建而创建，随着线程销毁而死亡。每个线程在运行时所需要的内存就是虚拟机栈。每个栈都是由一个个栈帧组成，对应的每次方法调用占用的内存。每个栈帧：局部变量表，操作数栈，动态链接，方法返回地址。每个线程中只能有一个活动栈帧，对应着当前正在执行的那个方法。
本地方法栈：本地方法栈和Java虚拟机栈发挥的作用相似，区别在于Java虚拟机栈为虚拟机执行Java方法服务，而本地方法栈则为虚拟机使用到的Native方法服务，也就是执行native()方法，这些方法是C、C++写的。
堆：线程共享区域，主要保存对象的实例、数组等。
方法区：共享的内存区域，主要用来存储类信息、即时编译器编译后的信息以及运行时常量池。JVM启动时创建，关闭JVM释放。
- 常量池：是一张表，主要存储的是要执行的类名、方法名、参数类型、字面量等信息，JVM根据指令会在这张表中进行查找。
- 运行时常量池：常量池是.class文件中的，当类被加载时，它的常量池信息会放入运行时常量池，并将里面的符号地址变为真实地址（#1 #2 之类的）。

本地方法接口

简单地讲，一个 Native Method 是一个Java调用非Java代码的接囗。一个 Native Method 是这样一个Java方法：该方法的实现由非Java语言实现，比如C。特点：用native关键字修饰的方法称为一个本地方法，没有方法体。

为什么使用：因为Java在有些层次的任务使用Java实现起来不容易，Java语言需要与外部环境进行交互，直接访问操作系统接口即可，JVM本身开发也是在底层使用了C语言。

执行引擎

解释器：解释器有两种，一种是古老的字节码解释器：在执行时通过纯软件代码翻译字节码的执行，效率非常低下。另一种现在普遍使用的模板解释器：将每一条字节码和一个模板函数相关联，模板函数中直接产生这条字节码执行时的机器码，提高了解释器的性能。
JIT即时编译器：可以将整个函数体编译成机器码，有效的避免函数体被解释执行，在重复执行时直接执行编译后的机器码即可，大大提升了执行效率。通俗的说就是如果遇到经常执行的字节码指令，只要执行过一次，将一些频繁执行的热点代码进行编译，并缓存到方法区中，后续再来执行就不需要翻译，可以直接取出对应的机器指令，性能更快，提高了执行效率。

垃圾回收

什么样的对象是垃圾呢

Java中的垃圾对象是指没有被任何引用变量所引用的对象。这些对象无法被访问，也无法被使用，因此它们占用内存空间而不被程序所使用，成为垃圾对象

内存溢出和内存泄漏

内存溢出指的是程序在申请内存时，由于没有足够的内存可用，而导致程序崩溃或者出现其他异常情况的现象。这通常是因为程序错误地使用了内存，例如未及时释放不需要的内存或者使用了太多内存资源，导致系统无法提供足够的内存来满足应用程序的需求。

内存泄漏指的是程序中存在一些对象或变量没有被垃圾回收器及时回收，导致这些对象一直占用着内存空间并最终耗尽可用内存的现象。通常是因为程序中存在不合理的设计或编码问题，例如忘记释放动态分配的内存、使用循环引用等等。还有就是打开了使用对象的东西，但是没有关闭，导致垃圾处理时认为对象处于运行状态，不会被回收处理，IO流close和jdbc链接close没有关闭。

两者区别在于，内存泄漏是程序代码中存在的开发问题，内存溢出则是由于系统资源有限造成的结果。需要解决内存泄漏问题，通常需要审查代码并进行调试，而需要解决内存溢出问题，则需要考虑优化应用程序，增加可用内存资源，并可能需要进行代码重新设计，以便更有效地使用和释放内存。

定位垃圾的方法

引用计数法：当一个对象被引用了一次，就在当前对象头上递增一次引用次数，如果这个对象的引用次数为0，代表这个对象可回收。比如创建一个demo对象，在JVM内存中会在栈中存储一个变量然后指向在堆中开辟对的一块空间来存储这个对象，引用计数法会给堆中的对象添加一个引用的参数ref=1，当demo=null，此时栈中的变量不会指向内存中的对象，ref变为0。引用计数法原理简单，效率也很高，但是目前主流的虚拟机中并没有选择这个算法来管理内存，主要原因是引用计数就很难解决对象之间相互循环引用的问题。当相互引用时ref次数增加了两次，此时如果demo=null，ref就会变为1，不会被识别为垃圾，这就是循环引用，会引发内存泄漏。
根搜索算法：目前的虚拟机都是通过可达性分析算法来确定哪些内容是垃圾，核心思想是沿着GC Root对象，遍历寻找关联着的对象就不是垃圾对象，扫描过程中，不能GC Root访问到该对象的就是可以被回收的。
GC Root可以是：虚拟机栈（栈帧中的本地变量表）中引用的对象。方法区中类静态属性引用的对象。方法区中常量引用的对象。本地方法栈中JNI（Native方法）引用的对象。

对象的finalization机制

对象的 finalization 机制是一种内存管理模式，它允许程序在对象被垃圾回收之前执行特定的清理和释放操作。在Java中，finalize() 方法是用于实现对象的 finalization 机制的。当一个对象变为垃圾之前，JVM会在内部自动调用其 finalize() 方法（如果该对象的 finalize() 方法未被重写，则不会执行任何操作），并在 finalize() 方法执行结束之后回收该对象。开发人员可以在 finalize() 方法中编写释放资源、关闭打开的文件、清除临时数据等操作，以便程序尽快回收不再使用的内存空间。

垃圾回收算法

标记清除：使用GC Root标记处存活的对象，清除没有标记的对象。优点：标记和清除速度快。缺点：内存碎片化严重，内存不连贯。
标记复制：将内存区域分为两块，当使用GC Root标记出存活的对象，将这些对象复制到另外一块之前清空的区域中。优点：当垃圾对象多的时候效率高，清理后内存没有碎片。缺点：需要两块内存空间，同一时刻只能使用一块空间，内存使用率较低。
标记整理：使用GC Root标记出存活的对象，清除没有标记的对象，将标记存活的对象向一端移动，避免了内存碎片化，但是由于移动，相较于标记清除性能是有一定影响。

分代回收

MinorGC（young GC）：发生在新生代的垃圾回收，SWT时间短。
MixedGC：新生代+老年代垃圾部分区域垃圾回收，G1收集器特有。
FullGC：新生代+老年代完整垃圾回收，STW时间长，应尽量避免。
SWT（Stop The World）：暂停所有应用程序线程，等待垃圾回收的完成。

垃圾回收器

串行垃圾回收器： Serial和SerialOld，单线程垃圾回收，堆内存较小。Serial作用于新生代，采用标记复制算法。SerialOld作用于老年代，采用标记整理算法。工作原理：垃圾回收时只有一个线程在工作，并且需要SWT。
并行垃圾回收器：Paraller New和Paraller Old，并行垃圾回收器。Paraller New作用于新生代，采用标记复制算法。Paraller Old作用于老年代，采用标记整理算法。这个垃圾回收器是JKD8中默认使用的，工作原理是垃圾回收时多个线程工作，Java应用中所有线程SWT。
CMS（并发）垃圾回收器：主要是针对老年代的垃圾回收器，并发执行的，使用标记清除的垃圾回收器，是一款以获取最短停顿时间为目标的收集器，停顿时间短用户体验是比较良好的，最大的特点是在进行垃圾回收时，应用仍能正常运行。主要过程：
- 初始标记（SWT）：标记直接与GC Root关联的对象。
- 并发标记：标记与GC Root间接关联的对象。
- 重新标记：防止之前标记时有的垃圾被关联，漏标。
- 并发清理
G1垃圾回收器：和其他垃圾回收器不同的是G1垃圾回收器是将堆区域分为多个区域，每个区域都可以充当eden、survivor、old、humongous（为大对象准备），采用的是标记复制算法进行垃圾回收。特点是响应时间与吞吐量兼顾，垃圾回收主要分为三个阶段新生代回收、并发标记、混合收集。如果回收的速度赶不上创建新对象的速度就会触发Full GC。
- 新生代垃圾回收：新生代的内存区域一般在G1堆中分配5%-6%，如果达到这个区间就会触发垃圾回收，使用标记复制算法将存活的对象复制到幸存者区中（挑出一个空闲区域），需要暂停用户线程。有新对象创建会将一块区域创建为eden区进行存储，之后进行垃圾回收时会将eden和幸存者区中存活的对象复制到另一个区域（幸存者区），超过15次的对象会复制到创建的老年区中。
- 并发标记：当老年代占总堆内存超过45%就会触发并发标记，并发标记就是将老年代中所有的存活对象标记出来，这个过程是并发的，无需暂停用户线程。
- 混合收集：在并发标记之后，会有一个重新标记阶段，用来解决标记阶段的漏标问题，此时需要swt。在回收老年代时，并不是一次将所有的老年代区域进行垃圾回收，而是有一个人为设置的预期的暂停时间，根据这个暂停时间优先回收价值高的区域（标记期间存活对象少，这个也是G1名称的由来），将这些回收价值高的老年代以及伊甸园，幸存者区一同进行一次垃圾回收，这就是混合收集，然后将伊甸园区和幸存者区中存活的对象放入新创建的幸存者区中，将老年代中存活的对象放入新创建的老年区中。

JVM调优参数

堆空间大小：-Xms -Xmx : 设置堆的初始大小和最大大小，为了防止垃圾收集器在初始大小和最大大小之间收缩堆，而产生额外的时间，通常将最大和初始大小设置为相同的值，不指定的话默认单位是字节。
- 堆空间设置多少合适：一般最大大小默认为物理内存的1/4，初始大小是物理内存的1/64，堆太小的话，可能会频繁导致GC，会产生stw，暂停用户线程，对空间大肯定好，但是也有风险，假如发生Full GC扫描整堆空间，暂停用户进程时间较长。
虚拟机栈的设置：-Xss : 默认值为1M，栈中一般存放栈帧，调用参数、局部变量表等，每个线程都会创建虚拟机栈，如果设置太大会导致线程数量减少，如果太小会导致栈内存溢出，一般建议设置256K或512K。
年轻代和老年代大小比例：-XXSurvivorRatio=8 表示survivor:eden=2:8，这是默认的比例，我们也可以设置增大eden区的大小，用来减少YGC发生的次数，但是虽然减少了，但是eden区满时占用空间大，导致释放缓慢，此时STW时间较长，因此还是需要根据程序情况去调优。
年轻代晋升老年代阈值：-XX:MaxTenuringThreshold=threshold 默认15，取值范围0-15
设置垃圾回收器：-XX:+useParallerGC，-XX:+useParalloldGC，-XX:+useG1GC
可以通过增大吞吐量来提高系统性能，可以通过这个设置并行垃圾回收器。

JVM调优工具

命令工具：jps查看进程状态、jstack查看进程内线程的堆栈信息、jmap查看堆转信息、jhat堆转储快照分析工具、jstatJVM统计检测工具。可视化工具：jconsole用于对JVM的内存线程，类的监控、
VisualVM能够监控线程内存情况。

命令工具： jmap：通过jmap =heap pid 显示Java堆的信息

jmap -dump:format=b，file=heap hprof pid，fomat=b表示以hprof=进制格式转Java堆的内存
file= 用于指定快照dump文件的文件名
使用以上命令生成一个进程或系统在某一时间的快照，比如在进程崩溃时甚至是任何时候，我们都可以通过工具将系统或进程的内存备份出来供调试分析使用。dump文件中包含了程序进行的模块信息，线程信息，堆栈调用信息，异常信息等数据，方便系统技术人员进行错误排查。

jstat: jstat -gcutil pid 总结垃圾回收统计
jstat -gc pid 垃圾回收统计
jconsole: 通过java/bin/jconsole.ext可以直接打开线程信息。

VisualVM：目前只有1.8中有，高版本没有，通过java/bin/jvisualvm.exe打开。

Java内存泄漏排查思路

获取堆内存快照dump。
- 使用jmap命令获取运行中程序的dump文件，有的情况是内存一处之后程序中断了但是jmap只能打印运行中的程序，所以可以通过使用Vm参数获取dump文件。
- 使用VisualVM可以加载离线的dump文件。
VisualVM去分析dump文件。
通过查看堆信息的情况去定位内存溢出的问题。
找到对应代码，通过阅读上下文情况，进行修复即可。

CPU飙高排查方案与思路

使用top命令查看哪一个命令占用CPU较高，可以拿到相应的pid。
使用ps H =eo pid,tid,%cpu | grep 进程pid 可以找到进程中所有线程的信息。
使用jstack 进程id 打印当前进程的所有线程信息，将刚才进程的线程id转换为16进制的线程id（打印的线程信息的id是16进制的），然后根据相应的线程id，定位到问题代码的代码行。

Long类型前后端数据不一致 igotyback 前端
响应给前端的数据浏览器控制台中response中看到的Long类型的数据是正常的到前端数据不一致前后端数据类型不匹配是一个常见问题，尤其是当后端使用Java的Long类型（64位）与前端JavaScript的Number类型（最大安全整数为2^53-1，即16位）进行数据交互时，很容易出现精度丢失的问题。这是因为JavaScript中的Number类型无法安全地表示超过16位的整数。为了解决这个问
LocalDateTime 转 String igotyback java 开发语言
importjava.time.LocalDateTime;importjava.time.format.DateTimeFormatter;publicclassMain{publicstaticvoidmain(String[]args){//获取当前时间LocalDateTimenow=LocalDateTime.now();//定义日期格式化器DateTimeFormatterformat
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
【华为OD机试真题2023B卷 JAVA&JS】We Are A Team 若博豆 java 算法华为 javascript
华为OD2023（B卷）机试题库全覆盖，刷题指南点这里WeAreATeam时间限制：1秒|内存限制：32768K|语言限制：不限题目描述：总共有n个人在机房，每个人有一个标号（1<=标号<=n），他们分成了多个团队，需要你根据收到的m条消息判定指定的两个人是否在一个团队中，具体的：1、消息构成为：abc，整数a、b分别代
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
Java 重写(Override)与重载(Overload) 叨唧唧的
Java重写(Override)与重载(Overload)重写(Override)重写是子类对父类的允许访问的方法的实现过程进行重新编写,返回值和形参都不能改变。即外壳不变，核心重写！重写的好处在于子类可以根据需要，定义特定于自己的行为。也就是说子类能够根据需要实现父类的方法。重写方法不能抛出新的检查异常或者比被重写方法申明更加宽泛的异常。例如：父类的一个方法申明了一个检查异常IOExceptio
简单了解 JVM 记得开心一点啊 jvm
目录♫什么是JVM♫JVM的运行流程♫JVM运行时数据区♪虚拟机栈♪本地方法栈♪堆♪程序计数器♪方法区/元数据区♫类加载的过程♫双亲委派模型♫垃圾回收机制♫什么是JVMJVM是JavaVirtualMachine的简称，意为Java虚拟机。虚拟机是指通过软件模拟的具有完整硬件功能的、运行在一个完全隔离的环境中的完整计算机系统（如：JVM、VMwave、VirtualBox）。JVM和其他两个虚拟机
1分钟解决 -bash: mvn: command not found，在Centos 7中安装Maven Energet!c 开发语言
1分钟解决-bash:mvn:commandnotfound，在Centos7中安装Maven检查Java环境1下载Maven2解压Maven3配置环境变量4验证安装5常见问题与注意事项6总结检查Java环境Maven依赖Java环境，请确保系统已经安装了Java并配置了环境变量。可以通过以下命令检查：java-version如果未安装，请先安装Java。1下载Maven从官网下载：前往Apach
Java企业面试题3 马龙强_ java
1.break和continue的作用(智*图)break：用于完全退出一个循环（如for,while）或一个switch语句。当在循环体内遇到break语句时，程序会立即跳出当前循环体，继续执行循环之后的代码。continue：用于跳过当前循环体中剩余的部分，并开始下一次循环。如果是在for循环中使用continue，则会直接进行条件判断以决定是否执行下一轮循环。2.if分支语句和switch分
JVM、JRE和 JDK：理解Java开发的三大核心组件 Y雨何时停T Java java
Java是一门跨平台的编程语言，它的成功离不开背后强大的运行环境与开发工具的支持。在Java的生态中，JVM（Java虚拟机）、JRE（Java运行时环境）和JDK（Java开发工具包）是三个至关重要的核心组件。本文将探讨JVM、JDK和JRE的区别，帮助你更好地理解Java的运行机制。1.JVM：Java虚拟机（JavaVirtualMachine）什么是JVM？JVM，即Java虚拟机，是Ja
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
白骑士的Java教学基础篇 2.5 控制流语句白骑士所长 Java 教学 java 开发语言
欢迎继续学习Java编程的基础篇！在前面的章节中，我们了解了Java的变量、数据类型和运算符。接下来，我们将探讨Java中的控制流语句。控制流语句用于控制程序的执行顺序，使我们能够根据特定条件执行不同的代码块，或重复执行某段代码。这是编写复杂程序的基础。通过学习这一节内容，你将掌握如何使用条件语句和循环语句来编写更加灵活和高效的代码。条件语句条件语句用于根据条件的真假来执行不同的代码块。if语句‘
python语法——三目运算符 HappyRocking python python 三目运算符
在java中，有三目运算符，如：intc=(a>b)?a:b表示c取两者中的较大值。但是在python，不能直接这样使用，估计是因为冒号在python有分行的关键作用。那么在python中，如何实现类似功能呢？可以使用ifelse语句，也是一行可以完成，格式为：aifbelsec表示如果b为True，则表达式等于a，否则等于c。如：c=(aif(a>b)elseb)同样是完成了取最大值的功能。
ArrayList 源码解析程序猿进阶 Java基础 ArrayList List java 面试性能优化架构设计 idea
ArrayList是Java集合框架中的一个动态数组实现，提供了可变大小的数组功能。它继承自AbstractList并实现了List接口，是顺序容器，即元素存放的数据与放进去的顺序相同，允许放入null元素，底层通过数组实现。除该类未实现同步外，其余跟Vector大致相同。每个ArrayList都有一个容量capacity，表示底层数组的实际大小，容器内存储元素的个数不能多于当前容量。当向容器中添
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
Java：爬虫框架 dingcho Java java 爬虫
一、ApacheNutch2【参考地址】Nutch是一个开源Java实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。Nutch致力于让每个人能很容易,同时花费很少就可以配置世界一流的Web搜索引擎.为了完成这一宏伟的目标,Nutch必须能够做到:每个月取几十亿网页为这些网页维护一个索引对索引文件进行每秒上千次的搜索提供高质量的搜索结果简单来说Nutch支持分
python怎么将png转为tif_png转tif weixin_39977276
发国外的文章要求图片是tif，cmyk色彩空间的。大小尺寸还有要求。比如网上大神多，找到了一段代码，感谢！https://www.jianshu.com/p/ec2af4311f56https://github.com/KevinZc007/image2Tifimportjava.awt.image.BufferedImage;importjava.io.File;importjava.io.Fi
JavaScript 中，深拷贝（Deep Copy）和浅拷贝（Shallow Copy）跳房子的前端前端面试 javascript 开发语言 ecmascript
在JavaScript中，深拷贝（DeepCopy）和浅拷贝（ShallowCopy）是用于复制对象或数组的两种不同方法。了解它们的区别和应用场景对于避免潜在的bugs和高效地处理数据非常重要。以下是对深拷贝和浅拷贝的详细解释，包括它们的概念、用途、优缺点以及实现方式。1.浅拷贝（ShallowCopy）概念定义：浅拷贝是指创建一个新的对象或数组，其中包含了原对象或数组的基本数据类型的值和对引用数
JAVA·一个简单的登录窗口 MortalTom java 开发语言学习
文章目录概要整体架构流程技术名词解释技术细节资源概要JavaSwing是Java基础类库的一部分，主要用于开发图形用户界面（GUI）程序整体架构流程新建项目，导入sql.jar包（链接放在了文末），编译项目并运行技术名词解释一、特点丰富的组件提供了多种可视化组件，如按钮（JButton）、文本框（JTextField）、标签（JLabel）、下拉列表（JComboBox）等，可以满足不同的界面设计
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
00. 这里整理了最全的爬虫框架（Java + Python）有一只柴犬爬虫系列爬虫 java python
目录1、前言2、什么是网络爬虫3、常见的爬虫框架3.1、java框架3.1.1、WebMagic3.1.2、Jsoup3.1.3、HttpClient3.1.4、Crawler4j3.1.5、HtmlUnit3.1.6、Selenium3.2、Python框架3.2.1、Scrapy3.2.2、BeautifulSoup+Requests3.2.3、Selenium3.2.4、PyQuery3.2
深入浅出 -- 系统架构之负载均衡Nginx的性能优化 xiaoli8748_软件开发系统架构系统架构负载均衡 nginx
一、Nginx性能优化到这里文章的篇幅较长了，最后再来聊一下关于Nginx的性能优化，主要就简单说说收益最高的几个优化项，在这块就不再展开叙述了，毕竟影响性能都有多方面原因导致的，比如网络、服务器硬件、操作系统、后端服务、程序自身、数据库服务等，对于性能调优比较感兴趣的可以参考之前《JVM性能调优》中的调优思想。优化一：打开长连接配置通常Nginx作为代理服务，负责分发客户端的请求，那么建议开启H
常见的 JVM 调优方法有哪些？爪哇天下 jvm
常见的JVM调优方法有哪些？可以具体到调整哪个参数，调成什么值？对年轻代的EdenSurvivor的比例进行配置-XX:SurvivorRatio=8：表示设置2个Survivor区：1个Eden区的大小比值为2:8，这意味着Survivor区占整个年轻代的1/5，这个参数默认为8如果经常性的SurvivorTo放不下YGC的剩余的对象时候，可以适当的调整比例常用的CMS收集器：设置回收阈值，需要
JAVA学习笔记之23种设计模式学习 victorfreedom Java技术设计模式 android java 常用设计模式
博主最近买了《设计模式》这本书来学习，无奈这本书是以C++语言为基础进行说明，整个学习流程下来效率不是很高，虽然有的设计模式通俗易懂，但感觉还是没有充分的掌握了所有的设计模式。于是博主百度了一番，发现有大神写过了这方面的问题，于是博主迅速拿来学习。一、设计模式的分类总体来说设计模式分为三大类：创建型模式，共五种：工厂方法模式、抽象工厂模式、单例模式、建造者模式、原型模式。结构型模式，共七种：适配器
JavaScript `Map` 和 `WeakMap`详细解释跳房子的前端 JavaScript 原生方法 javascript 前端开发语言
在JavaScript中，Map和WeakMap都是用于存储键值对的数据结构，但它们有一些关键的不同之处。MapMap是一种可以存储任意类型的键值对的集合。它保持了键值对的插入顺序，并且可以通过键快速查找对应的值。Map提供了一些非常有用的方法和属性来操作这些数据对：set(key,value):将一个键值对添加到Map中。如果键已经存在，则更新其对应的值。get(key):获取指定键的值。如果键
切换淘宝最新npm镜像源是 hai40587 npm 前端 node.js
切换淘宝最新npm镜像源是一个相对简单的过程，但首先需要明确当前淘宝npm镜像源的状态和最新的镜像地址。由于网络环境和服务更新，镜像源的具体地址可能会发生变化，因此，我将基于当前可获取的信息，提供一个通用的切换步骤，并附上最新的镜像地址（截至回答时）。一、了解npm镜像源npm（NodePackageManager）是JavaScript的包管理器，用于安装、更新和管理项目依赖。由于npm官方仓库
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16][email protected]:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s