《iOS底层原理文章汇总》
1.带8个参数以上的函数的汇编实现原理
test函数拥有9个参数,栈中如何存储第9个参数
int test(int a,int b,int c,int d,int e,int f,int g,int h,int i){
return a+b+c+d+e+f+g+h+i;
}
将sp寄存器储存的栈内存地址赋值给x8
将参数9赋值给w10寄存器
将w10中存储的值9传给x8地址指向的内存位置
进入test函数
从sp+#0x30的栈内存位置中取出w8的值放到w8中
分别从sp+0x2c及往前4个字节的位置
取出参数1,2,3,4,5,6,7,8,9
相加存入w0中,并返回x0,回收栈空间
这些多余的指令操作,编译器会自动优化,test函数的存在与否对整个程序的运行结果没有任何影响
设置为release模式后,test函数直接没有了,因为对程序的结果没有任何影响
若函数被调用了呢
test函数没有了,直接返回45结果到w8寄存器当中,相当于printf("%d",45);
2.自己实现汇编函数
实现一个加法函数,并有嵌套调用,正常输出,记得设计嵌套调用要保存lr的值
开辟栈内存空间,保存lr的值,汇编代码的简写形式
3.直接使用b进行跳转
不会改变lr寄存器的值,直接跳转,经常用在破解的地方,跳过代码执行
4.拉伸栈空间和传递的参数有关系,和要用到的内存空间有关系,当参数过多,寄存器放不下,会需要用到内存,就会将栈空间放大,不仅仅是参数个数,还有局部变量,局部变量和栈空间大小有关系,局部变量越多,栈空间越大
5.返回值:返回值大于8个字节,返回值也会用栈内存来存储返回
返回值小于等于8个字节用x0存储
返回一个结构体大小为24个字节的结构体
ViewDidLoad中预留了0x20一共32个字节,给getStr中保存参数使用
ViewDidLoad中的栈内存分配图如下,x8便于在getstr中获取栈内存地址空间存储参数值
str w9 [x8]此时的x8保存的是ViewDidLoad分配的栈内存sp+0x8的地址,w9中的值存储到ViewDidLoad内存中,x0寄存器没有用到
为什么w5后直接用w9呢,因为w0-w7专门用作参数,x8用作返回值参考,w0-w7默认用来存放参数,用w9作为临时变量来运算
6.函数的局部变量:局部变量和参数的计算通过寄存器来完成,参数的传递用寄存器,栈平衡后就拿不到局部变量和参数了,销毁了,等待被覆盖
I.系统如何处理局部变量
局部变量0x6存到w8中,再取出w8的值存到内存中
II.函数嵌套调用的局部变量的处理
取出局部变量6存到w8中,再存到内存中,保护现场,,从内存中取出到寄存器中进行运算,运算结果存储w0的值到栈内存中,两次调用,两次存储运算结果值到不同的内存区域,sp+0x10,sp+0xc,平衡栈空间,返回值。
只有4个字节操作的时候就用stur,其他用str
7.标记寄存器
1.状态寄存器
CPU内部的寄存器中,有一种特殊的寄存器(对于不同的处理器,个数和结构都可能不同).这种寄存器在ARM中,被称为状态寄存器就是CPSR(current program status register)寄存器
CPSR和其他寄存器不一样,其他寄存器是用来存放数据的,都是整个寄存器具有一个含义.而CPSR寄存器是按位起作用的,也就是说,它的每一位都有专门的含义,记录特定的信息.
注:CPSR寄存器是32位的
- CPSR的低8位(包括I、F、T和M[4:0])称为控制位,程序无法修改,除非CPU运行于特权模式下,程序才能修改控制位!
- N、Z、C、V均为条件码标志位。它们的内容可被算术或逻辑运算的结果所改变,并且可以决定某条指令是否被执行!意义重大!
I.cmp比较指令
b.ne是有条件的跳转
函数的跳转是无条件的跳转
cpsr的值为0x80000000,最高位为1000,跳转前改变cpsr的值为
0x40000000,最高位为0100,此时的跳转会跳入a==b中
相当于改变了代码逻辑,这就是调试中的暴力破解
是否为正负数看NZ两位
N(Negative)标志
CPSR的第31位是 N,符号标志位。它记录相关指令执行后,其结果是否为负.如果为负 N = 1,如果是非负数 N = 0.
注意,在ARM64的指令集中,有的指令的执行时影响状态寄存器的,比如add\sub\or等,他们大都是运算指令(进行逻辑或算数运算);只有加上s后才会影响最高位寄存器,若不加,是不会影响的
执行adds命令前,cpsr最高位为0110
执行adds后,结果为负数,改变cpsr的最高位为1,即1000
将adds改为add则不会影响
Z(Zero)标志
CPSR的第30位是Z,0标志位。它记录相关指令执行后,其结果是否为0.如果结果为0.那么Z = 1.如果结果不为0,那么Z = 0.
对于Z的值,我们可以这样来看,Z标记相关指令的计算结果是否为0,如果为0,则Z要记录下"是0"这样的肯定信息.在计算机中1表示逻辑真,表示肯定.所以当结果为0的时候Z = 1,表示"结果是0".如果结果不为0,则Z要记录下"不是0"这样的否定信息.在计算机中0表示逻辑假,表示否定,所以当结果不为0的时候Z = 0,表示"结果不为0"。
执行adds之前,最高位4位为0110,
执行adds后,最高位4位为0100,结果为非负数N为0
结果为0,Z为1
C(Carry)标志
CPSR的第29位是C,进位标志位。一般情况下,进行无符号数的运算。
加法运算:当运算结果产生了进位时(无符号数溢出),C=1,否则C=0。无符号数11111111 + 1 = 1 0000 0000 溢出了,1溢出到C标志位
减法运算(包括CMP):当运算时产生了借位时(无符号数溢出),C=0,否则C=1。0000 0001 - 0000 0010,不够减,找C标志位借位
对于位数为N的无符号数来说,其对应的二进制信息的最高位,即第N - 1位,就是它的最高有效位,而假想存在的第N位,就是相对于最高有效位的更高位。如下图所示:
加法运算:前面帮忙留着空个位置0,方便进位
减法运算:前面帮忙留个1,方便借位
进位
我们知道,当两个数据相加的时候,有可能产生从最高有效位想更高位的进位。比如两个32位数据:0xaaaaaaaa + 0xaaaaaaaa,将产生进位。由于这个进位值在32位中无法保存,我们就只是简单的说这个进位值丢失了。其实CPU在运算的时候,并不丢弃这个进位制,而是记录在一个特殊的寄存器的某一位上。ARM下就用C位来记录这个进位值。比如,下面的指令
mov w0,#0xaaaaaaaa;0xa 的二进制是 1010
adds w0,w0,w0; 执行后 相当于 1010 << 1 进位1(无符号溢出) 所以C标记 为 1
adds w0,w0,w0; 执行后 相当于 0101 << 1 进位0(无符号没溢出) 所以C标记 为 0
adds w0,w0,w0; 重复上面操作
adds w0,w0,w0
借位
当两个数据做减法的时候,有可能向更高位借位。再比如,两个32位数据:0x00000000 - 0x000000ff,将产生借位,借位后,相当于计算0x100000000 - 0x000000ff。得到0xffffff01 这个值。由于借了一位,所以C位 用来标记借位。C = 0.比如下面指令:
mov w0,#0x0
subs w0,w0,#0xff ;
subs w0,w0,#0xff
subs w0,w0,#0xff
V(Overflow)溢出标志
CPSR的第28位是V,溢出标志位。在进行有符号数运算的时候,如果超过了机器所能标识的范围,称为溢出。
- 正数 + 正数 为负数 溢出 0111 + 0111结果为负数
- 负数 + 负数 为正数 溢出
- 正数 + 负数 不可能溢出 a:正数 b:负数,a+b < a ,a+b > b,既然 a 和 b都没溢出,那么 b < a+b
V位只要有运算当做有符号数运算的结果,C位有运算当做是无符号数运算的结果
8.问题一:超过8个参数从ViewDidLoad中传入调用的getStr方法中时,比如getStr(0,1,2,3,4,5,6,7,8,9),此时进入getStr开辟栈空间,8,9存w8,w9,取w8,w9中的值,当getStr栈空间释放时,栈平衡,w8,w9没有释放
w8,29相当于是ViewDidLoad的局部变量,跟随ViewDidLoad一起释放,传递时属于ViewDidLoad栈区域,当ViewDidLoad调用完毕才会释放
A调用B,B执行完毕后,B的参数都释放了吗?
问题二:ViewDidLoad中调用getStr获取结构体,如果要使用这个结构体,直接访问栈地址吗?
ViewDidLoad中开辟栈空间存储str2,结构体存在栈区域
24个字节,若当前ViewDidLoad有返回值,则return &str2
外界不能使用返回的&str2,栈空间在函数结束时被释放了,一般返回结构体指针,在堆中开辟24个字节内存空间,变量用完后,要free堆空间