Android学习心得(16) --- Dex文件结构实例解析(2)

我在博客上发表一些我的Android学习心得,希望对大家能有帮助。
这一篇我们讲述一下通过一个实例来分析dex文件结构和组成。

参考Leb128数据类型 Android学习心得(5) --- dex数据类型LEB128
参考实例分析学习理解dex文件结构Android学习心得(15) --- Dex文件结构解析(1)
参考baksmali工具使用Android学习心得(4) --- MAC下smali文件编写与运行

1、编译

我们通过一个例子来分析dex文件的构成

创建一个Hello.java文件,输入下面的值,这个是我们学习的样本
public class Hello {
    public static void main(String[] argc) {
        System.out.println("Hello world");
    }
}
通过编译成.class文件之后再编译成.dex文件

1
Android学习心得(16) --- Dex文件结构实例解析(2)_第1张图片

使用0xED打开进行查看 

Android学习心得(16) --- Dex文件结构实例解析(2)_第2张图片

2、Header

我们通过前一张中Dex Header解析
通过dex文件中前0x70的header数据查询并填入表格

前0x70数据

Android学习心得(16) --- Dex文件结构实例解析(2)_第3张图片
Android学习心得(16) --- Dex文件结构实例解析(2)_第4张图片
Android学习心得(16) --- Dex文件结构实例解析(2)_第5张图片

3、MapList

在Header中MapOff指向的是MapList结构
MapList结构第四节中已经定义,我们查询并填写表格

map_off中偏移地址为0x0240,查询相应地址
第一个16位是MapItem的数目:0x000D(14个)

Android学习心得(16) --- Dex文件结构实例解析(2)_第6张图片
Android学习心得(16) --- Dex文件结构实例解析(2)_第7张图片

4、string_id_item

首先我们查看MapList中string_id_item,size是14个,从0x70开始
9

我们分别从0x176、0x17E等读取出14个字符串,并填入表格

Android学习心得(16) --- Dex文件结构实例解析(2)_第8张图片

5、type_id_item

我们查看MapList中type_id_item,个数是7个,从0xA8开始
11

由于这个是表示stringids的索引,查string_id_item表得出

Android学习心得(16) --- Dex文件结构实例解析(2)_第9张图片

6、proto_id_item

查看proto_id_item,个数是3个,从0xC4开始
13

通过查看proto_id_item结构,填入表格

Android学习心得(16) --- Dex文件结构实例解析(2)_第10张图片

7、field_id_item

我们查看MapList中field_id_item,个数是1个,从0xE8开始
15

通过查看field_id_item结构,填入表格

Android学习心得(16) --- Dex文件结构实例解析(2)_第11张图片

8、method_id_item

我们查看MapList中method_id_item,个数是4个,从0xF0开始
17

通过查看上一节中对method_id_item描述,填入表格

Android学习心得(16) --- Dex文件结构实例解析(2)_第12张图片

9、class_def_item

我们查看MapList中class_def_item,个数是1个,从0x110开始
19

通过上一节中DexClassDef结构,我们填写表格

Android学习心得(16) --- Dex文件结构实例解析(2)_第13张图片

我们查看MapList中class_def_item,的确偏移地址和个数都相同。

21

由于DexClass.h定义的u4是属于Leb128

Android学习心得(16) --- Dex文件结构实例解析(2)_第14张图片

下面紧跟的是两个直接方法

23

第一个是00 81 80 04 B0 02

Android学习心得(16) --- Dex文件结构实例解析(2)_第15张图片

从0x130开始分析code_item结构

25
Android学习心得(16) --- Dex文件结构实例解析(2)_第16张图片
分析思路整理如下

(1) 《Dalvik VM Instruction Format》 里操作符 op 都是位于首个 16bit 数据的低 8 bit 
起始的是 op = 0x70
(2) 在 《Bytecode for Dalvik VM》 里找到对应的 Syntax 和 format 。
syntax = invoke-direct
format = 0x35c 
(3) 在《Dalvik VM Instruction Format》里查找 35c , 得知 op = 0x70 的指令占据 2 个 16 bit 数据 ,
格式是 B|A|op CCCC G|F|E|D ,其中,B=1,A=0。
我们查询到: [B=1] op {vD}, kind@CCCC
有上述得出CCCC = 3,D = 0;
0E操作码是对应的是return-void

得到指令是:

invoke-direct {v0}, Ljava/lang/Object;.<init>:()V 
return-void

第二个是01 09 C8 02

Android学习心得(16) --- Dex文件结构实例解析(2)_第17张图片

从0x148开始分析code_item结构

28
Android学习心得(16) --- Dex文件结构实例解析(2)_第18张图片
分析思路整理如下

(1) 《Dalvik VM Instruction Format》 里操作符 op 都是位于首个 16bit 数据的低 8 bit 
起始的是 op = 0x62
(2) 在 《Bytecode for Dalvik VM》 里找到对应的 Syntax 和 format 。
syntax = sget-object
format = 0x21c 
(3) 在《Dalvik VM Instruction Format》里查找 21c , 得知 op = 0x62 的指令占据 2 个 16 bit 数据 ,
格式是 AA|op BBBB ,其中,AA=00,BBBB=0。

得到指令是:

sget-object v0, Ljava/lang/System;.out:Ljava/io/PrintStream;

继续进行

(1) 《Dalvik VM Instruction Format》 里操作符 op 都是位于首个 16bit 数据的低 8 bit 
起始的是 op = 0x1A
(2) 在 《Bytecode for Dalvik VM》 里找到对应的 Syntax 和 format 。
syntax = const-string vAA, string@BBBB
format = 0x21c 
(3) 在《Dalvik VM Instruction Format》里查找 21c , 得知 op = 0x1A 的指令占据 2 个 16 bit 数据 ,
格式是 onst-string vAA, string@BBBB ,其中,AA=01,BBBB=1。

得到指令是:

const-string v1, "Hello World!"

继续进行

(1) 《Dalvik VM Instruction Format》 里操作符 op 都是位于首个 16bit 数据的低 8 bit 
起始的是 op = 0x6E
(2) 在 《Bytecode for Dalvik VM》 里找到对应的 Syntax 和 format 。
syntax = invoke-virtual
format = 0x35c 
(3) 在《Dalvik VM Instruction Format》里查找 21c , 得知 op = 0x6E 的指令占据 2 个 16 bit 数据 ,
格式是 B|A|op CCCC G|F|E|D,其中,B=2, CCCC=2, E=1, D=0。
其格式为:[B=2] op {vD, vE}, kind@CCCC

得到指令是:

invoke-virtual {v0, v1}, Ljava/io/PrintStream; -> println(Ljava/lang/String;)V
return-void

最终分析核心代码

invoke-direct {v0}, Ljava/lang/Object;.<init>:()V 
sget-object v0, Ljava/lang/System;.out:Ljava/io/PrintStream;
const-string v1, "Hello World!"
invoke-virtual {v0, v1}, Ljava/io/PrintStream; -> println(Ljava/lang/String;)V
return-void

对比baksmali文件生成smali文件

.class public LHello;
.super Ljava/lang/Object;
.source "Hello.java"


# direct methods
.method public constructor <init>()V
    .registers 1

    .prologue
    .line 1
    invoke-direct {p0}, Ljava/lang/Object;-><init>()V

    return-void
.end method

.method public static main([Ljava/lang/String;)V
    .registers 3

    .prologue
    .line 3
    sget-object v0, Ljava/lang/System;->out:Ljava/io/PrintStream;

    const-string v1, "Hello world!"

    invoke-virtual {v0, v1}, Ljava/io/PrintStream;->println(Ljava/lang/String;)V

    .line 4
    return-void
.end method

核心代码相同,分析正确。

你可能感兴趣的:(android,实例,dex,Smali,dex结构)