iOS 逆向开发 文章汇总
目录
- 一、函数的参数和返回值
- 二、函数的局部变量
- 三、状态寄存器
一、函数的参数和返回值
ARM64下,函数的参数是存放在X0到X7(W0到W7)这8个寄存器里面的。如果超过8个参数,就会入栈,利用内存传递参数。
函数的返回值是放在X0(W0)寄存器里面的,如果返回值大于8个字节(指针大小=8字节),就会利用内存传递返回值。
- 因此C语言函数建议不超过8个参数,OC函数建议不超过6个参数(OC函数含两个默认参数:self、cmd)
查看系统含参函数汇编是如何实现的
@implementation ViewController
int sum(int a, int b) {
return a + b;
}
- (void)viewDidLoad {
[super viewDidLoad];
sum(10, 20);
}
@end
由于这是未经过LLDB优化的汇编,所以有冗余的汇编代码。由于sum是叶子函数(最后一个ret)因此不需要lr入栈保存
因此可自己实现相同功能的sum函数:
_sum:
add x0,x0,x1
ret
函数参数个数超过8个的情况:
@implementation ViewController
int test(int a,int b,int c,int d,int e,int f,int g,int h,int i) {
return a + b + c + d + e + f + g + h + I;
}
- (void)viewDidLoad {
[super viewDidLoad];
test(1, 2, 3, 4, 5, 6, 7, 8, 9);
}
@end
函数返回值大于8个字节的情况:
@implementation ViewController
struct str {
int a;
int b;
int c;
int d;
int f;
int g;
};
struct str getStr(int a,int b,int c,int d,int f,int g) {
// //24字节开辟堆空间!
// struct str * str1 = malloc(24);正常情况是返回结构体指针
struct str str1;
str1.a = a;
str1.b = b;
str1.c = c;
str1.d = d;
str1.f = f;
str1.g = g;
return str1;
}
- (void)viewDidLoad {
[super viewDidLoad];
//你的局部变量!!! 我的栈区域!! A --> B 在B调用完毕之后,B的参数释放了吗???
struct str str2 = getStr(1, 2, 3, 4, 5, 6);
}
stur作用和str一样,只是stur用来处理4个字节的数据
面试题:函数A调用函数B,在B调用完毕之后,B的参数都释放了吗???
不一定。如果参数超过8个,那么多余的参数是存在函数A的栈中。在B调用完毕之后,B的参数释放不完。
二、函数的局部变量
函数的局部变量放在栈里面!
@implementation ViewController
int funcB(int a,int b) {
int c = 6;
return a+b+c;
}
- (void)viewDidLoad {
[super viewDidLoad];
funcB(10, 20);
}
@end
函数有局部变量和嵌套调用的情况:
@implementation ViewController
int funcB(int a,int b) {
int c = 6;
int d = funcSum(a, b, c);
int e = funcSum(a, b, c);
return d + e;
}
int funcSum(int a,int b,int c) {
int d = a + b + c;
printf("%d",d);
return d;
}
- (void)viewDidLoad {
[super viewDidLoad];
funcB(10, 20);
}
@end
三、状态寄存器
CPU内部的寄存器中,有一种特殊的寄存器(对于不同的处理器,个数和结构都可能不同).这种寄存器在ARM中,被称为状态寄存器就是CPSR(current program status register)寄存器
CPSR和其他寄存器不一样,其他寄存器是用来存放数据的,都是整个寄存器具有一个含义.而CPSR寄存器是按位起作用的,也就是说,它的每一位都有专门的含义,记录特定的信息.
注:CPSR寄存器是32位的
- CPSR的低8位(包括I、F、T和M[4:0])称为控制位,程序无法修改,除非CPU运行于特权模式下,程序才能修改控制位!
- N、Z、C、V均为条件码标志位。它们的内容可被算术或逻辑运算的结果所改变,并且可以决定某条指令是否被执行!意义重大!
N(Negative)标志
CPSR的第31位是 N,符号标志位。它记录相关指令执行后,其结果是否为负.如果为
负 N = 1
,如果是非负数 N = 0
.
注意,在ARM64的指令集中,有的指令的执行时影响状态寄存器的,比如add\sub\or等,他们大都是运算指令(进行逻辑或算数运算);
Z(Zero)标志
CPSR的第30位是Z,0标志位。它记录相关指令执行后,其结果是否为0.如果
结果为0:Z = 1
.如果结果不为0:Z = 0
.
对于Z的值,我们可以这样来看,Z标记相关指令的计算结果是否为0,如果为0,则Z要记录下"是0"这样的肯定信息.在计算机中1表示逻辑真,表示肯定.所以当结果为0的时候Z = 1,表示"结果是0".如果结果不为0,则Z要记录下"不是0"这样的否定信息.在计算机中0表示逻辑假,表示否定,所以当结果不为0的时候Z = 0,表示"结果不为0"。
C(Carry)标志
CPSR的第29位是C,进位标志位。一般情况下进行
无符号数的运算
。
加法运算:当运算结果产生了进位时(无符号数溢出),C=1,否则C=0。
减法运算(包括CMP):当运算时产生了借位时(无符号数溢出),C=0,否则C=1。
对于位数为N的无符号数来说,其对应的二进制信息的最高位,即第N - 1位,就是它的最高有效位,而假想存在的第N位,就是相对于最高有效位的更高位。如下图所示:
进位
我们知道,当两个数据相加的时候,有可能产生从最高有效位想更高位的进位。比如两个32位数据:0xaaaaaaaa + 0xaaaaaaaa,将产生进位。由于这个进位值在32位中无法保存,我们就只是简单的说这个进位值丢失了。其实CPU在运算的时候,并不丢弃这个进位制,而是记录在一个特殊的寄存器的某一位上。ARM下就用C位来记录这个进位值。比如,下面的指令
mov w0,#0xaaaaaaaa;0xa 的二进制是 1010
adds w0,w0,w0; 执行后 相当于 1010 << 1 进位1(无符号溢出) 所以C标记 为 1
adds w0,w0,w0; 执行后 相当于 0101 << 1 进位0(无符号没溢出) 所以C标记 为 0
adds w0,w0,w0; 重复上面操作
adds w0,w0,w0
借位
当两个数据做减法的时候,有可能向更高位借位。再比如,两个32位数据:0x00000000 - 0x000000ff,将产生借位,借位后,相当于计算0x100000000 - 0x000000ff。得到0xffffff01 这个值。由于借了一位,所以C位 用来标记借位。C = 0.比如下面指令:
mov w0,#0x0
subs w0,w0,#0xff ;
subs w0,w0,#0xff
subs w0,w0,#0xff
adds、subs会改变标志位, add、sub不会改变标志位。都会改变操作的寄存器的值
V(Overflow)溢出标志
CPSR的第28位是V,溢出标志位。在进行
有符号数运算
的时候,如果超过了机器所能标识的范围,称为溢出。
- 正数 + 正数 为负数 溢出
- 负数 + 负数 为正数 溢出
- 正数 + 负数 不可能溢出(同样宽度的数据)
CPU在进行计算时并不知道参与计算的数是有符号数还是无符号数,C标志位会将参与计算的数据当做无符号数进行相应标记,V标志位会将参与计算的数据当做有符号数进行相应标记。在上层代码读取计算结果时通过自己是有无符号数读取C或V标记判断计算结果是否溢出。
条件代码:
@implementation ViewController
void func() {
int a = 1;
int b = 2;
if (a == b) {
printf("a == b\n");
} else {
printf("error\n");
}
}
- (void)viewDidLoad {
[super viewDidLoad];
func();
}
@end
将状态寄存器(cpsr)的值由0x80000000改为0x40000000就能将cpsr的
Z标志改为1
,这样就能让条件跳转指令认为a-b=0从而a == b。(判断指令==底层就是减法sub指令)
.m文件中编写汇编代码:
@implementation ViewController
void func() {
// int a = 1;
// int b = 2;
//
// if (a == b) {
// printf("a == b\n");
// } else {
// printf("error\n");
// }
asm(
"mov w0,#0xaaaaaaaa\n"
"adds w0,w0,w0\n"
"adds w0,w0,w0\n"
"adds w0,w0,w0\n"
"adds w0,w0,w0\n"
);
}
@end