–> go to 总目录
Java
从 1.5 开始提供了java.lang.instrument(doc)
包,该包为检测(instrument) Java
程序提供API
,比如用于监控、收集性能信息、诊断问题。通过java.lang.instrument
实现工具被称为Java Agent。Java Agent
可以修改类文件的字节码,通常是,在字节码方法插入额外的字节码来完成检测。关于如何使用java.lang.instrument
包,可以参考javadoc
的包描述(en, zh)。Java Agent
支持两种方式加载,启动时加载,即在 JVM 程序启动时在命令行指定一个选项来启动代理;启动后加载,这种方式使用从 JDK 1.6 开始提供的Attach API
来动态加载代理。
写一个agent.jar
可以分为以下几步
java -javaagent:"proj-premain.jar=hello agent" -cp "target/classes/java/main" com.demo.App
jvm
运行时加载,获取目标JVM的对象,执行loadgent动作。VirtualMachine jvm = VirtualMachine.attach(jvmPid);
jvm.loadAgent(agentJar, options);
jvm.detach();
示例的运行,可以参考入门博客中demo。包含两种方式的启动。
博客
JVMTI
是基于事件驱动的,JVM每执行到一定的逻辑就会调用一些事件的回调接口,这些接口可以供开发者扩展自行的逻辑。
ClassFileLoadHook 事件
。比如我想监听JVM加载某个类的事件,那么我们就可以实现一个回调函数赋给jvmtiEnv
的回调方法集合里的ClassFileLoadHook(Class类加载事件)
,
那么当JVM进行类加载时就会触发回调函数,我们就可以在JVM加载类的时候做一些扩展操作。
比如上面提到的更改这个类的Class
文件信息来增强这个类的方法。
JVMTI运行时,一个JVMTIAgent
对应一个jvmtiEnv或者是多个,JVMTIAgent
是一个动态库,利用JVMTI
暴露出来的接口来进行扩展。
主要有三个函数:
Agent_OnLoad
方法:如果agent是在启动时加载的,那么在JVM启动过程中会执行这个agent里的Agent_OnLoad
函数(通过-agentlib加载vm参数中)Agent_OnAttach
方法:如果agent
不是在启动时加载的,而是attach到目标程序上,然后给对应的目标程序发送load命令来加载,则在加载过程中会调用Agent_OnAttach
方法Agent_OnUnload
方法:在agent
卸载时调用,要么主动下发卸载命令,要么jvm
关闭是触发。
这个没有分析源码,网上找的资料。应该是分析JPLISAgent的源码,有兴趣的可以了解下
回到主题,Instrument
就是一种 JVMTIAgent
,它实现了Agent_OnLoad
和Agent_OnAttach
两个方法,也就是在使用时,Instrument
既可以在启动时加载,也可以再运行时加动态加载
-javaagent:XXXAgent.jar
的方式attach
机制来实现,通过发送load
命令来加载Instrument agent
启动时加载会实现Agent_OnLoad
方法,具体实现逻辑如下:JPLISAgent
VMInit
事件,在vm
初始化完成之后执行下面逻辑Instrumentation
接口的实例,也就是InstrumentationImpl对象ClassFileLoadHook
事件(类加载事件,通过set callback)InstrumentationImpl
类的loadClassAndCallPremain
方法,这个方法会调用javaagent
的jar
包中里的MANIFEST.MF
里指定的Premain-Class
类的premain
方法MANIFEST.MF
里的参数,并根据这些参数来设置JPLISAgent
里的内容Instrument agent
运行时加载会使用Agent_OnAttach
方法,会通过JVM的attach机制来请求目标JVM加载对应的agent,过程如下
JPLISAgent
javaagent
里的MANIFEST.MF
里的参数InstrumentationImpl
对象ClassFileLoadHook
事件InstrumentationImpl
类的loadClassAndCallAgentmain
方法,这个方法会调用javaagent
的jar包中里的MANIFEST.MF
里指定的agentmain-Class
类的agentmain
方法启动时加载和运行时加载都是监听同一个jvmti事件那就是ClassFileLoadHook
,这个是类加载的事件,在读取类文件字节码之后回调用的,这样就可以对字节码进行修改操作。
在JVM加载类文件时,执行回调,加载Instrument agent
,创建Instrumentation
接口的实例并且执行premain
方法,premain
方法中注册自定义的ClassFileTransformer
来对字节码文件进行操作,这个就是在加载时进行字节码增强的过程。
那么如果java类已经加载完成了,在运行的过程中需要进行字节码增强的时候还可以使用Instrumentation接口的redifineClasses方法,
有兴趣的可以自行研究源码,这里只描述大致过程。
通过执行该方法,在JVM中相当于是创建了一个VM_RedifineClasses
的VM_Operation
,此时会stop_the_world,具体的执行过程如下:
- 挨个遍历要批量重定义的 jvmtiClassDefinition
- 然后读取新的字节码,如果有关注 ClassFileLoadHook 事件的,还会走对应的 transform 来对新的字节码再做修改字节码解析好,创建一个 klassOop
- 对象对比新老类,并要求如下:
- 父类是同一个实现的接口数也要相同,并且是相同的接口类
- 访问符必须一致
- 字段数和字段名要一致
- 新增的方法必须是 private static/final 的
- 可以删除修改方法
- 对新类做字节码校验
- 合并新老类的常量池
- 如果老类上有断点,那都清除掉
- 对老类做 JIT 去优化
- 对新老方法匹配的方法的 jmethodId 做更新,将老的 jmethodId 更新到新的 method 上
- 新类的常量池的 holer 指向老的类
- 将新类和老类的一些属性做交换,比如常量池,methods,内部类
- 初始化新的
vtable
和itable
- 交换
annotation
的method、field、paramenter
- 遍历所有当前类的子类,修改他们的
vtable
及itable
下面先介绍核心的类,再说明用法。
这个是在premain
和agentmain
中如何使用instrument
。注意三个方法
addTransformer(new Transformer, true)
–jdk5retransformClass(Target.class)
--JDK6redineClass(new ClassDefintion[] (def))
— jdk5
这个三个方法就是用来执行转化字节码的
default byte[] transform(ClassLoader loader,String className,Class<?> classBeingRedefined,ProtectionDomain protectionDomain,byte[] classfileBuffer)
参数解析
ClassLoader
: 被加载类的loaderclassName
: 正在加载类的名称classBeingRedefined
: 目标类为A,需要被重定义,被重定义的类记为A1,那么classBeingRedefined
: 就代表着A1classFileBuffer当前类的定义instrument
内拥有一个TransformerManager
,包含了TransFormer
数组。也就是说存在多个TransFormer
时,TransFormer
会形成一个链。上一个transformer
对字节的修改,被传递到下一个transformer
。
jdk6支持对本地方法的修改,所以会对分为4类,4类按顺序执行
TransFormer
TransFormerNative
TransFormer
TransFormerNative
在这里插入图片描述
这个函数的作用是,添加到transfomer数组中去。每当有一个类加载时
会触发ClassFileLoadHook的回调,
这个回调会执行transfomer链,得到被加工过的字节码—保留在classFileBuffer类,最后被加载进方法区。
接受多个类的定义。再经过所transfomer
数组(通常不添加)的加工,最后被加载进方法区。
这个方法是来源于jdk5
官方文档用来替换类内不存在任何引用(refrence
)的类。往往修改一个类A也会导致相关联的B也要被修改。所以这里参数可以传入多个类。如果被redefine
的方法,在栈stack
中有了,此时再发生redefine
。那么结果是,stack
中方法继续执行老的定义,新的调用将会采用redefine
后的方法。
这个类在JDK6引入,和redefine
类似但更强大。
可以对于已经加载的类(包括被redined的类)进行修改。
当类第一次加载时或者被redefined时,类的字节码byte[] ,会经过transfomer数组的加工。这个函数就是用来重放这个过程,不管内存中的类是否被装换过。
retransformed遵从以下步骤
注意
如果所有的transfomer
为flase,那么他从最原始的类的定义出发,跳过所有transfomer
,得到结果还是最原始的类。
如果内存类已经被修改了,那么会发生原始的类定义替换被修改过的类,相当于还原。参数:ClassDefinition... definitions
需要重新转化的类。
只要使用了addTransformer
,那么每有类加载的时候,就会触发transfomer链
加工。redefine
接受一组类的定义,然后触发transfomer
的加工,替换进内存里。retransform
和redefine类
似,从最原始的类定义,开始重放transfomer链接的加工
(只重放所有被标记为canRetransform
的transfomer
),替换进内存。