IDEA 2021 的 debug 是怎么實(shí)現(xiàn)?出于這個(gè)好奇心,我越挖越深。。。
來源:https://zhenbianshu.github.io/
但 Java 是靜態(tài)語言,運(yùn)行之前是要先進(jìn)行編譯的,難道我寫的這些代碼是被實(shí)時(shí)編譯又”注入”到我正在 Debug 的服務(wù)里了嗎?
隨著對(duì) Java 的愈加熟悉,我也了解了反射、字節(jié)碼等技術(shù),直到前些天的周會(huì)分享,有位同事分享了 Btrace 的使用和實(shí)現(xiàn),提到了 Java 的 ASM 框架和 JVM TI 接口。Btrace 修改代碼能力的實(shí)現(xiàn)與 Debug 的 Evaluate 有很多相似之處,這大大吸引了我。
分享就像一個(gè)引子,從中學(xué)到的東西只是皮毛,要了解它還是要自己研究。于是自己查看資料并寫代碼學(xué)習(xí)了下其具體實(shí)現(xiàn)。
# ASM
動(dòng)態(tài)生成字節(jié)碼
我們知道,我們編寫的 Java 代碼都是要被編譯成字節(jié)碼后才能放到 JVM 里執(zhí)行的,而字節(jié)碼一旦被加載到虛擬機(jī)中,就可以被解釋執(zhí)行。
字節(jié)碼文件(.class)就是普通的二進(jìn)制文件,它是通過 Java 編譯器生成的。而只要是文件就可以被改變,如果我們用特定的規(guī)則解析了原有的字節(jié)碼文件,對(duì)它進(jìn)行修改或者干脆重新定義,這不就可以改變代碼行為了么。
Java 生態(tài)里有很多可以動(dòng)態(tài)生成字節(jié)碼的技術(shù),像 BCEL、Javassist、ASM、CGLib 等,它們各有自己的優(yōu)勢。有的使用復(fù)雜卻功能強(qiáng)大、有的簡單確也性能些差。
ASM 框架
ASM 是它們中最強(qiáng)大的一個(gè),使用它可以動(dòng)態(tài)修改類、方法,甚至可以重新定義類,連 CGLib 底層都是用 ASM 實(shí)現(xiàn)的。
當(dāng)然,它的使用門檻也很高,使用它需要對(duì) Java 的字節(jié)碼文件有所了解,熟悉 JVM 的編譯指令。雖然我對(duì) JVM 的字節(jié)碼語法不熟,但有大神開發(fā)了可以在 IDEA 里查看字節(jié)碼的插件:ASM Bytecode Outline ,在要查看的類文件里右鍵選擇 Show bytecode Outline 即可以右側(cè)的工具欄查看我們要生成的字節(jié)碼。對(duì)照著示例,我們就可以很輕松地寫出操作字節(jié)碼的 Java 代碼了。
而切到 ASMified 標(biāo)簽欄,我們甚至可以直接獲取到 ASM 的使用代碼。
常用方法
visitMethod()/visitAnnotation() 等方法,用以定義對(duì)類結(jié)構(gòu)(如方法、字段、注解)的訪問方法。
而 ClassWriter 接口繼承了 ClassVisitor 接口,我們在實(shí)例化類訪問器時(shí),將 ClassWriter “注入” 到里面,以實(shí)現(xiàn)對(duì)類寫入的聲明。
# Instrument
介紹
字節(jié)碼是修改完了,可是 JVM 在執(zhí)行時(shí)會(huì)使用自己的類加載器加載字節(jié)碼文件,加載后并不會(huì)理會(huì)我們做出的修改,要想實(shí)現(xiàn)對(duì)現(xiàn)有類的修改,我們還需要搭配 Java 的另一個(gè)庫 instrument。
instrument 是 JVM 提供的一個(gè)可以修改已加載類文件的類庫。1.6以前,instrument 只能在 JVM 剛啟動(dòng)開始加載類時(shí)生效,之后,instrument 更是支持了在運(yùn)行時(shí)對(duì)類定義的修改。
使用
要使用 instrument 的類修改功能,我們需要實(shí)現(xiàn)它的 ClassFileTransformer 接口定義一個(gè)類文件轉(zhuǎn)換器。它唯一的一個(gè) transform() 方法會(huì)在類文件被加載時(shí)調(diào)用,在 transform 方法里,我們可以對(duì)傳入的二進(jìn)制字節(jié)碼進(jìn)行改寫或替換,生成新的字節(jié)碼數(shù)組后返回,JVM 會(huì)使用 transform 方法返回的字節(jié)碼數(shù)據(jù)進(jìn)行類的加載。
# JVM TI
定義完了字節(jié)碼的修改和重定義方法,但我們怎么才能讓 JVM 能夠調(diào)用我們提供的類轉(zhuǎn)換器呢?這里又要介紹到 JVM TI 了。
介紹
JVM TI(JVM Tool Interface)JVM 工具接口是 JVM 提供的一個(gè)非常強(qiáng)大的對(duì) JVM 操作的工具接口,通過這個(gè)接口,我們可以實(shí)現(xiàn)對(duì) JVM 多種組件的操作,從JVMTM Tool Interface 這里我們認(rèn)識(shí)到 JVM TI 的強(qiáng)大,它包括了對(duì)虛擬機(jī)堆內(nèi)存、類、線程等各個(gè)方面的管理接口。
JVM TI 通過事件機(jī)制,通過接口注冊各種事件勾子,在 JVM 事件觸發(fā)時(shí)同時(shí)觸發(fā)預(yù)定義的勾子,以實(shí)現(xiàn)對(duì)各個(gè) JVM 事件的感知和反應(yīng)。
Agent
Agent 是 JVM TI 實(shí)現(xiàn)的一種方式。我們在編譯 C 項(xiàng)目里鏈接靜態(tài)庫,將靜態(tài)庫的功能注入到項(xiàng)目里,從而才可以在項(xiàng)目里引用庫里的函數(shù)。我們可以將 agent 類比為 C 里的靜態(tài)庫,我們也可以用 C 或 C++ 來實(shí)現(xiàn),將其編譯為 dll 或 so 文件,在啟動(dòng) JVM 時(shí)啟動(dòng)。
這時(shí)再來思考 Debug 的實(shí)現(xiàn),我們在啟動(dòng)被 Debug 的 JVM 時(shí),必須添加參數(shù) -agentlib:jdwp=transport=dt_socket,suspend=y,address=localhost:3333,而 -agentlib 選項(xiàng)就指定了我們要加載的 Java Agent,jdwp 是 agent 的名字,在 linux 系統(tǒng)中,我們可以在 jre 目錄下找到 jdwp.so 庫文件。
Java 的調(diào)試體系 jdpa 組成,從高到低分別為 jdi->jdwp->jvmti,我們通過 JDI 接口發(fā)送調(diào)試指令,而 jdwp 就相當(dāng)于一個(gè)通道,幫我們翻譯 JDI 指令到 JVM TI,最底層的 JVM TI 最終實(shí)現(xiàn)對(duì) JVM 的操作。
使用
JVM TI 的 agent 使用很簡單,在啟動(dòng) agent 時(shí)添加 -agent 參數(shù)指定我們要加載的 agent jar包即可。
而要實(shí)現(xiàn)代碼的修改,我們需要實(shí)現(xiàn)一個(gè) instrument agent,它可以通過在一個(gè)類里添加 premain() 或 agentmain() 方法來實(shí)現(xiàn)。而要實(shí)現(xiàn) 1.6 以上的動(dòng)態(tài) instrument 功能,實(shí)現(xiàn) agentmain 方法即可。
在 agentmain 方法里,我們調(diào)用 Instrumentation.retransformClasses() 方法實(shí)現(xiàn)對(duì)目標(biāo)類的重定義。
agent生成
另外,我們還需要注意 agent 的打包,它需要指定一個(gè) Agent-Class 參數(shù)指定我們的包括 agentmain 方法的類,可以算是指定入口類吧。
此外,還需要配置 MANIFEST.MF 文件的一些參數(shù),允許我們重新定義類。如果你的 agent 實(shí)現(xiàn)還需要引用一些其他類庫時(shí),還需要將這些類庫都打包到此 jar 包中,下面是我的 pom 文件配置。
<build><plugins><plugin><groupId>org.apache.maven.plugins</groupId><artifactId>maven-assembly-plugin</artifactId><configuration><archive><manifestEntries><Agent-Class>asm.TestAgent</Agent-Class><Can-Redefine-Classes>true</Can-Redefine-Classes><Can-Retransform-Classes>true</Can-Retransform-Classes><Manifest-Version>1.0</Manifest-Version><Permissions>all-permissions</Permissions></manifestEntries></archive><descriptorRefs><descriptorRef>jar-with-dependencies</descriptorRef></descriptorRefs></configuration></plugin></plugins></build>
另外在打包時(shí)需要使用 mvn assembly:assembl 命令生成 jar-with-dependencies 作為 agent。
# 代碼實(shí)現(xiàn)
我在測試時(shí)寫了一個(gè)用以上技術(shù)實(shí)現(xiàn)了一個(gè)簡單的字節(jié)碼動(dòng)態(tài)修改的 Demo。
被修改的類
TransformTarget 是要被修改的目標(biāo)類,正常執(zhí)行時(shí),它會(huì)三秒輸出一次 “hello”。
public class TransformTarget {public static void main(String[] args) {while (true) {try {Thread.sleep(3000L);} catch (Exception e) {break;}printSomething();}}public static void printSomething() {System.out.println("hello");}}
Agent
Agent 是執(zhí)行修改類的主體,它使用 ASM 修改 TransformTarget 類的方法,并使用 instrument 包將修改提交給 JVM。
入口類,也是代理的 Agent-Class。
public class TestAgent {public static void agentmain(String args, Instrumentation inst) {inst.addTransformer(new TestTransformer(), true);try {inst.retransformClasses(TransformTarget.class);System.out.println("Agent Load Done.");} catch (Exception e) {System.out.println("agent load failed!");}}}
執(zhí)行字節(jié)碼修改和轉(zhuǎn)換的類。
public class TestTransformer implements ClassFileTransformer {public byte[] transform(ClassLoader loader, String className, Class<?> classBeingRedefined, ProtectionDomain protectionDomain, byte[] classfileBuffer) throws IllegalClassFormatException {System.out.println("Transforming " + className);ClassReader reader = new ClassReader(classfileBuffer);ClassWriter classWriter = new ClassWriter(ClassWriter.COMPUTE_FRAMES);ClassVisitor classVisitor = new TestClassVisitor(Opcodes.ASM5, classWriter);reader.accept(classVisitor, ClassReader.SKIP_DEBUG);return classWriter.toByteArray();}class TestClassVisitor extends ClassVisitor implements Opcodes {TestClassVisitor(int api, ClassVisitor classVisitor) {super(api, classVisitor);}@Overridepublic MethodVisitor visitMethod(int access, String name, String desc, String signature, String[] exceptions) {MethodVisitor mv = super.visitMethod(access, name, desc, signature, exceptions);if (name.equals("printSomething")) {mv.visitCode();Label l0 = new Label();mv.visitLabel(l0);mv.visitLineNumber(19, l0);mv.visitFieldInsn(Opcodes.GETSTATIC, "java/lang/System", "out", "Ljava/io/PrintStream;");mv.visitLdcInsn("bytecode replaced!");mv.visitMethodInsn(Opcodes.INVOKEVIRTUAL, "java/io/PrintStream", "println", "(Ljava/lang/String;)V", false);Label l1 = new Label();mv.visitLabel(l1);mv.visitLineNumber(20, l1);mv.visitInsn(Opcodes.RETURN);mv.visitMaxs(2, 0);mv.visitEnd();TransformTarget.printSomething();}return mv;}}}
Attacher
使用 tools.jar 里方法將 agent 動(dòng)態(tài)加載到目標(biāo) JVM 的類。
public class Attacher {public static void main(String[] args) throws AttachNotSupportedException, IOException, AgentLoadException, AgentInitializationException {VirtualMachine vm = VirtualMachine.attach("34242"); // 目標(biāo) JVM pidvm.loadAgent("/path/to/agent.jar");}}
# 小結(jié)
不得不說 Java 的生態(tài)真的非常繁榮,當(dāng)真是博大精深,查閱一個(gè)模塊的資料時(shí)能總引出一大堆新的概念,永遠(yuǎn)有學(xué)不完的新東西。
1、2019 年 9 月全國程序員工資統(tǒng)計(jì),你是什么水平?
3、從零開始搭建創(chuàng)業(yè)公司后臺(tái)技術(shù)棧
5、37歲程序員被裁,120天沒找到工作,無奈去小公司,結(jié)果懵了...
6、滴滴業(yè)務(wù)中臺(tái)構(gòu)建實(shí)踐,首次曝光
