iOS-逆向03-函数本质(下)

《iOS底层原理文章汇总》

1.带8个参数以上的函数的汇编实现原理

test函数拥有9个参数,栈中如何存储第9个参数

int test(int a,int b,int c,int d,int e,int f,int g,int h,int i){
    return a+b+c+d+e+f+g+h+i;
}
image
iOS-逆向03-函数本质(下)_第1张图片
image
iOS-逆向03-函数本质(下)_第2张图片
image

将sp寄存器储存的栈内存地址赋值给x8
将参数9赋值给w10寄存器
将w10中存储的值9传给x8地址指向的内存位置

iOS-逆向03-函数本质(下)_第3张图片
image

进入test函数
从sp+#0x30的栈内存位置中取出w8的值放到w8中

图片.png

分别从sp+0x2c及往前4个字节的位置
取出参数1,2,3,4,5,6,7,8,9
相加存入w0中,并返回x0,回收栈空间

这些多余的指令操作,编译器会自动优化,test函数的存在与否对整个程序的运行结果没有任何影响
设置为release模式后,test函数直接没有了,因为对程序的结果没有任何影响

iOS-逆向03-函数本质(下)_第4张图片
image
iOS-逆向03-函数本质(下)_第5张图片
image

若函数被调用了呢

iOS-逆向03-函数本质(下)_第6张图片
image
iOS-逆向03-函数本质(下)_第7张图片
image

test函数没有了,直接返回45结果到w8寄存器当中,相当于printf("%d",45);

2.自己实现汇编函数

实现一个加法函数,并有嵌套调用,正常输出,记得设计嵌套调用要保存lr的值

iOS-逆向03-函数本质(下)_第8张图片
image
iOS-逆向03-函数本质(下)_第9张图片
图片.png

开辟栈内存空间,保存lr的值,汇编代码的简写形式

iOS-逆向03-函数本质(下)_第10张图片
image

3.直接使用b进行跳转

不会改变lr寄存器的值,直接跳转,经常用在破解的地方,跳过代码执行


iOS-逆向03-函数本质(下)_第11张图片
image

4.拉伸栈空间和传递的参数有关系,和要用到的内存空间有关系,当参数过多,寄存器放不下,会需要用到内存,就会将栈空间放大,不仅仅是参数个数,还有局部变量,局部变量和栈空间大小有关系,局部变量越多,栈空间越大

5.返回值:返回值大于8个字节,返回值也会用栈内存来存储返回

返回值小于等于8个字节用x0存储

返回一个结构体大小为24个字节的结构体

iOS-逆向03-函数本质(下)_第12张图片
image

ViewDidLoad中预留了0x20一共32个字节,给getStr中保存参数使用


iOS-逆向03-函数本质(下)_第13张图片
image

ViewDidLoad中的栈内存分配图如下,x8便于在getstr中获取栈内存地址空间存储参数值

iOS-逆向03-函数本质(下)_第14张图片
图片.png

str w9 [x8]此时的x8保存的是ViewDidLoad分配的栈内存sp+0x8的地址,w9中的值存储到ViewDidLoad内存中,x0寄存器没有用到


image

为什么w5后直接用w9呢,因为w0-w7专门用作参数,x8用作返回值参考,w0-w7默认用来存放参数,用w9作为临时变量来运算

6.函数的局部变量:局部变量和参数的计算通过寄存器来完成,参数的传递用寄存器,栈平衡后就拿不到局部变量和参数了,销毁了,等待被覆盖

I.系统如何处理局部变量

局部变量0x6存到w8中,再取出w8的值存到内存中


iOS-逆向03-函数本质(下)_第15张图片
image

II.函数嵌套调用的局部变量的处理

取出局部变量6存到w8中,再存到内存中,保护现场,,从内存中取出到寄存器中进行运算,运算结果存储w0的值到栈内存中,两次调用,两次存储运算结果值到不同的内存区域,sp+0x10,sp+0xc,平衡栈空间,返回值。

iOS-逆向03-函数本质(下)_第16张图片
image

只有4个字节操作的时候就用stur,其他用str

7.标记寄存器

1.状态寄存器

   CPU内部的寄存器中,有一种特殊的寄存器(对于不同的处理器,个数和结构都可能不同).这种寄存器在ARM中,被称为状态寄存器就是CPSR(current program status register)寄存器
CPSR和其他寄存器不一样,其他寄存器是用来存放数据的,都是整个寄存器具有一个含义.而CPSR寄存器是按位起作用的,也就是说,它的每一位都有专门的含义,记录特定的信息.

注:CPSR寄存器是32位的

  • CPSR的低8位(包括I、F、T和M[4:0])称为控制位,程序无法修改,除非CPU运行于特权模式下,程序才能修改控制位!
  • N、Z、C、V均为条件码标志位。它们的内容可被算术或逻辑运算的结果所改变,并且可以决定某条指令是否被执行!意义重大!
15201620642085

I.cmp比较指令

b.ne是有条件的跳转
函数的跳转是无条件的跳转

image

cpsr的值为0x80000000,最高位为1000,跳转前改变cpsr的值为
0x40000000,最高位为0100,此时的跳转会跳入a==b中

图片.png

相当于改变了代码逻辑,这就是调试中的暴力破解

iOS-逆向03-函数本质(下)_第17张图片
image

是否为正负数看NZ两位

N(Negative)标志

CPSR的第31位是 N,符号标志位。它记录相关指令执行后,其结果是否为负.如果为负 N = 1,如果是非负数 N = 0.

   注意,在ARM64的指令集中,有的指令的执行时影响状态寄存器的,比如add\sub\or等,他们大都是运算指令(进行逻辑或算数运算);只有加上s后才会影响最高位寄存器,若不加,是不会影响的

执行adds命令前,cpsr最高位为0110

iOS-逆向03-函数本质(下)_第18张图片
image

执行adds后,结果为负数,改变cpsr的最高位为1,即1000

iOS-逆向03-函数本质(下)_第19张图片
图片.png

将adds改为add则不会影响


iOS-逆向03-函数本质(下)_第20张图片
image

Z(Zero)标志

CPSR的第30位是Z,0标志位。它记录相关指令执行后,其结果是否为0.如果结果为0.那么Z = 1.如果结果不为0,那么Z = 0.

   对于Z的值,我们可以这样来看,Z标记相关指令的计算结果是否为0,如果为0,则Z要记录下"是0"这样的肯定信息.在计算机中1表示逻辑真,表示肯定.所以当结果为0的时候Z = 1,表示"结果是0".如果结果不为0,则Z要记录下"不是0"这样的否定信息.在计算机中0表示逻辑假,表示否定,所以当结果不为0的时候Z = 0,表示"结果不为0"。

执行adds之前,最高位4位为0110,
执行adds后,最高位4位为0100,结果为非负数N为0
结果为0,Z为1

image

C(Carry)标志

CPSR的第29位是C,进位标志位。一般情况下,进行无符号数的运算。
加法运算:当运算结果产生了进位时(无符号数溢出),C=1,否则C=0。无符号数11111111 + 1 = 1 0000 0000 溢出了,1溢出到C标志位
减法运算(包括CMP):当运算时产生了借位时(无符号数溢出),C=0,否则C=1。0000 0001 - 0000 0010,不够减,找C标志位借位

   对于位数为N的无符号数来说,其对应的二进制信息的最高位,即第N - 1位,就是它的最高有效位,而假想存在的第N位,就是相对于最高有效位的更高位。如下图所示:

iOS-逆向03-函数本质(下)_第21张图片
15468591547671

加法运算:前面帮忙留着空个位置0,方便进位
减法运算:前面帮忙留个1,方便借位

进位

   我们知道,当两个数据相加的时候,有可能产生从最高有效位想更高位的进位。比如两个32位数据:0xaaaaaaaa + 0xaaaaaaaa,将产生进位。由于这个进位值在32位中无法保存,我们就只是简单的说这个进位值丢失了。其实CPU在运算的时候,并不丢弃这个进位制,而是记录在一个特殊的寄存器的某一位上。ARM下就用C位来记录这个进位值。比如,下面的指令

mov w0,#0xaaaaaaaa;0xa 的二进制是 1010
adds w0,w0,w0; 执行后 相当于 1010 << 1 进位1(无符号溢出) 所以C标记 为 1
adds w0,w0,w0; 执行后 相当于 0101 << 1 进位0(无符号没溢出) 所以C标记 为 0
adds w0,w0,w0; 重复上面操作
adds w0,w0,w0
image
iOS-逆向03-函数本质(下)_第22张图片
图片.png

借位

   当两个数据做减法的时候,有可能向更高位借位。再比如,两个32位数据:0x00000000 - 0x000000ff,将产生借位,借位后,相当于计算0x100000000 - 0x000000ff。得到0xffffff01 这个值。由于借了一位,所以C位 用来标记借位。C = 0.比如下面指令:

mov w0,#0x0
subs w0,w0,#0xff ;
subs w0,w0,#0xff
subs w0,w0,#0xff

V(Overflow)溢出标志

CPSR的第28位是V,溢出标志位。在进行有符号数运算的时候,如果超过了机器所能标识的范围,称为溢出。

  • 正数 + 正数 为负数 溢出 0111 + 0111结果为负数
  • 负数 + 负数 为正数 溢出
  • 正数 + 负数 不可能溢出 a:正数 b:负数,a+b < a ,a+b > b,既然 a 和 b都没溢出,那么 b < a+b

V位只要有运算当做有符号数运算的结果,C位有运算当做是无符号数运算的结果

8.问题一:超过8个参数从ViewDidLoad中传入调用的getStr方法中时,比如getStr(0,1,2,3,4,5,6,7,8,9),此时进入getStr开辟栈空间,8,9存w8,w9,取w8,w9中的值,当getStr栈空间释放时,栈平衡,w8,w9没有释放

w8,29相当于是ViewDidLoad的局部变量,跟随ViewDidLoad一起释放,传递时属于ViewDidLoad栈区域,当ViewDidLoad调用完毕才会释放

A调用B,B执行完毕后,B的参数都释放了吗?

image

问题二:ViewDidLoad中调用getStr获取结构体,如果要使用这个结构体,直接访问栈地址吗?

ViewDidLoad中开辟栈空间存储str2,结构体存在栈区域
24个字节,若当前ViewDidLoad有返回值,则return &str2
外界不能使用返回的&str2,栈空间在函数结束时被释放了,一般返回结构体指针,在堆中开辟24个字节内存空间,变量用完后,要free堆空间

iOS-逆向03-函数本质(下)_第23张图片
图片.png
iOS-逆向03-函数本质(下)_第24张图片
图片.png

知识回顾

image

你可能感兴趣的:(iOS-逆向03-函数本质(下))