iOS逆向之还原高级代码&状态寄存器(四)

知识回顾

  • bl指令跳转,将下一条执行的指令放入lr(X30)寄存器
  • ret指令返回到lr寄存器所保存的地址 执行代码
  • pc寄存器 指向马上要执行的代码地址
  • sp寄存器指向了我们栈
    栈平衡(每个函数调用完毕之后,将拉伸的栈空间平衡(将sp加回去))
  • 函数调用会开辟一段空间(栈空间)
    函数的局部变量、参数、寄存器的保护
  • 参数:x0 -- x7(个数有关系、数据类型也有关)
    多余的就会入栈
  • 函数嵌套调用:
    | - A(开辟) --> B(开辟) --> A(开辟)
    | - A<-->A 死的递归(内存溢出)

内存分区域

代码区  特点: 可读可写可执行;
栈区域  放参数和局部变量;
堆区域 动态申请 可读可写;
全局:  可读可写;
常量区: 只读!

adrp寄存器

adrp   x0, 1
1.将1的值,左移12位 1 0000 0000 0000 == 0x1000
2.将PC寄存器的低12位清零 0x1002e6874  ==> 0x1002e6000
3.将将1 和 2 的结果相加  给 X0 寄存器!!

adrp 是计算指定的数据地址 到当前PC值的相对偏移
由于得到的结果是低12bit为0
10根地址总线 = 2^10 = 1024bit = 1KB
12根地址总线 = 2^10*2^2 = 4KB
数据就存储在这4KB的内存空间中。
屏幕快照 2018-04-24 下午10.20.15.png

状态寄存器

   CPU内部的寄存器中,有一种特殊的寄存器(对于不同的处理器,个数和结构都可能不同).这种寄存器在ARM中,被称为状态寄存器就是CPSR(current program status register)寄存器
CPSR和其他寄存器不一样,其他寄存器是用来存放数据的,都是整个寄存器具有一个含义.而CPSR寄存器是按位起作用的,也就是说,它的每一位都有专门的含义,记录特定的信息.

注:CPSR寄存器是32位的

  • CPSR的低8位(包括I、F、T和M[4:0])称为控制位,程序无法修改,除非CPU运行于特权模式下,程序才能修改控制位!
  • N、Z、C、V均为条件码标志位。它们的内容可被算术或逻辑运算的结果所改变,并且可以决定某条指令是否被执行!意义重大!

[图片上传失败...(image-6c5d83-1524580976804)]

N(Negative)标志

CPSR的第31位是 N,符号标志位。它记录相关指令执行后,其结果是否为负.如果为负 N = 1,如果是非负数 N = 0.

   注意,在ARM64的指令集中,有的指令的执行时影响状态寄存器的,比如add\sub\or等,他们大都是运算指令(进行逻辑或算数运算);

Z(Zero)标志

CPSR的第30位是Z,0标志位。它记录相关指令执行后,其结果是否为0.如果结果为0.那么Z = 1.如果结果不为0,那么Z = 0.

   对于Z的值,我们可以这样来看,Z标记相关指令的计算结果是否为0,如果为0,则N要记录下"是0"这样的肯定信息.在计算机中1表示逻辑真,表示肯定.所以当结果为0的时候Z = 1,表示"结果是0".如果结果不为0,则Z要记录下"不是0"这样的否定信息.在计算机中0表示逻辑假,表示否定,所以当结果不为0的时候Z = 0,表示"结果不为0"。

C(Carry)标志

CPSR的第29位是C,进位标志位。一般情况下,进行无符号数的运算。
加法运算:当运算结果产生了进位时(无符号数溢出),C=1,否则C=0。
减法运算(包括CMP):当运算时产生了借位时(无符号数溢出),C=0,否则C=1。

   对于位数为N的无符号数来说,其对应的二进制信息的最高位,即第N - 1位,就是它的最高有效位,而假想存在的第N位,就是相对于最高有效位的更高位。如下图所示:

[图片上传失败...(image-2f478b-1524580976804)]

进位

   我们知道,当两个数据相加的时候,有可能产生从最高有效位向更高位的进位。比如两个32位数据:0xaaaaaaaa + 0xaaaaaaaa,将产生进位。由于这个进位值在32位中无法保存,我们就只是简单的说这个进位值丢失了。其实CPU在运算的时候,并不丢弃这个进位制,而是记录在一个特殊的寄存器的某一位上。ARM下就用C位来记录这个进位值。比如,下面的指令

mov w0,#0xaaaaaaaa;0xa 的二进制是 1010
adds w0,w0,w0; 执行后 相当于 1010 << 1 进位1(无符号溢出) 所以C标记 为 1
adds w0,w0,w0; 执行后 相当于 0101 << 1 进位0(无符号没溢出) 所以C标记 为 0
adds w0,w0,w0; 重复上面操作
adds w0,w0,w0

借位

   当两个数据做减法的时候,有可能向更高位借位。再比如,两个32位数据:0x00000000 - 0x000000ff,将产生借位,借位后,相当于计算0x100000000 - 0x000000ff。得到0xffffff01 这个值。由于借了一位,所以C位 用来标记借位。C = 0.比如下面指令:

mov w0,#0x0
subs w0,w0,#0xff ;
subs w0,w0,#0xff
subs w0,w0,#0xff

V(Overflow)溢出标志

CPSR的第28位是V,溢出标志位。在进行有符号数运算的时候,如果超过了机器所能标识的范围,称为溢出。

  • 正数 + 正数 为负数 溢出
  • 负数 + 负数 为正数 溢出
  • 正数 + 负数 不可能溢出

还原高级代码

oc高级代码

#import 
#import "AppDelegate.h"

int globala = 12;

int func(int a, int b){
    printf("haha");
    return a + b + globala;
}

int main(int argc, char * argv[]) {
    func(1, 2);
}

对应的汇编

main方法

__text:00000001000068E0 ; =============== S U B R O U T I N E =======================================
__text:00000001000068E0
__text:00000001000068E0 ; Attributes: bp-based frame
__text:00000001000068E0
__text:00000001000068E0 ; int __cdecl main(int argc, const char **argv, const char **envp)
__text:00000001000068E0                 EXPORT _main
__text:00000001000068E0 _main
__text:00000001000068E0
__text:00000001000068E0 var_14          = -0x14
__text:00000001000068E0 var_10          = -0x10
__text:00000001000068E0 var_8           = -8
__text:00000001000068E0 var_4           = -4
__text:00000001000068E0 var_s0          =  0
__text:00000001000068E0
__text:00000001000068E0                 SUB             SP, SP, #0x30
__text:00000001000068E4                 STP             X29, X30, [SP,#0x20+var_s0]
__text:00000001000068E8                 ADD             X29, SP, #0x20
__text:00000001000068EC                 MOV             W8, #0xA
__text:00000001000068F0                 MOV             W9, #0x14
__text:00000001000068F4                 STUR            WZR, [X29,#var_4]
__text:00000001000068F8                 STUR            W0, [X29,#var_8]
__text:00000001000068FC                 STR             X1, [SP,#0x20+var_10]
__text:0000000100006900                 MOV             X0, X8
__text:0000000100006904                 MOV             X1, X9
__text:0000000100006908                 BL              _func
__text:000000010000690C                 MOV             W8, #0
__text:0000000100006910                 STR             W0, [SP,#0x20+var_14]
__text:0000000100006914                 MOV             X0, X8
__text:0000000100006918                 LDP             X29, X30, [SP,#0x20+var_s0]
__text:000000010000691C                 ADD             SP, SP, #0x30
__text:0000000100006920                 RET
__text:0000000100006920 ; End of function _main

func方法

__text:0000000100006890 ; =============== S U B R O U T I N E =======================================
__text:0000000100006890
__text:0000000100006890 ; Attributes: bp-based frame
__text:0000000100006890
__text:0000000100006890                 EXPORT _func
__text:0000000100006890 _func                                   ; CODE XREF: _main+28↓p
__text:0000000100006890
__text:0000000100006890 var_C           = -0xC
__text:0000000100006890 var_8           = -8
__text:0000000100006890 var_4           = -4
__text:0000000100006890 var_s0          =  0
__text:0000000100006890
__text:0000000100006890                 SUB             SP, SP, #0x20
__text:0000000100006894                 STP             X29, X30, [SP,#0x10+var_s0]
__text:0000000100006898                 ADD             X29, SP, #0x10
__text:000000010000689C                 STUR            W0, [X29,#var_4]
__text:00000001000068A0                 STR             W1, [SP,#0x10+var_8]
__text:00000001000068A4                 ADRP            X0, #aHaha@PAGE ; "haha"
__text:00000001000068A8                 ADD             X0, X0, #aHaha@PAGEOFF ; "haha"
__text:00000001000068AC                 BL              _printf
__text:00000001000068B0                 ADRP            X30, #_globala@PAGE
__text:00000001000068B4                 ADD             X30, X30, #_globala@PAGEOFF
__text:00000001000068B8                 LDUR            W1, [X29,#var_4]
__text:00000001000068BC                 LDR             W8, [SP,#0x10+var_8]
__text:00000001000068C0                 ADD             W8, W1, W8
__text:00000001000068C4                 LDR             W1, [X30]
__text:00000001000068C8                 ADD             W8, W8, W1
__text:00000001000068CC                 STR             W0, [SP,#0x10+var_C]
__text:00000001000068D0                 MOV             X0, X8
__text:00000001000068D4                 LDP             X29, X30, [SP,#0x10+var_s0]
__text:00000001000068D8                 ADD             SP, SP, #0x20
__text:00000001000068DC                 RET
__text:00000001000068DC ; End of function _func

你可能感兴趣的:(iOS逆向之还原高级代码&状态寄存器(四))