arm 函数栈回溯

arm 函数栈回溯_第1张图片

 大概意思就是arm每个函数开始都会将PC、LR、SP以及FP四个寄存器入栈。

 下面我们看一下这四个寄存器里面保存的是什么内存

arm-linux-gnueabi-gcc unwind.c -mapcs -w -g -o unwind(需要加上-mapcs才会严格按照上面说的入栈)

#include 
#include 

struct stackframe {
	unsigned long fp;//低地址
	unsigned long sp;
	unsigned long lr;
	unsigned long pc;//高地址
};
void backtrace() {
	struct stackframe *frame = NULL;
	unsigned long *sp = NULL;
	asm volatile ("mov %0, ip" : "=g"(sp));//ip里面保存的是还未压栈的sp
    printf("sp poniter 0x%lx\n", sp);

    frame = (char*)sp - sizeof(struct stackframe);
	printf("fp 0x%lx, pc 0x%lx, sp 0x%lx\n", frame->fp,frame->pc, frame->sp);//通过打印栈帧里面的sp确实和ip里面的一样的
	/* 不知道怎么结束循环.... */
	for (; frame->fp < 0xdeadbeef; frame = frame->fp - sizeof(struct stackframe) + sizeof(unsigned long)) {
		printf("Function enter at [<%08x>] from [<%08x>]\n", frame->pc, frame->lr);
	}
}

void f3(int c) {
	printf("%d\n", c);
	backtrace();
}
void f2(int b) {
	f3(b);
}
void f1(int a) {
	char arr[5] = {0};
	f2(a);
}

int main(int argc, char *argv[]) {
	printf("programe %s\n", argv[0]);
	f1(1);
	return 0;
}

arm-linux-gnueabi-objdump -S unwind > objdump 

void backtrace() {
    8500:	e1a0c00d 	mov	ip, sp
    8504:	e92dd810 	push	{r4, fp, ip, lr, pc}
    8508:	e24cb004 	sub	fp, ip, #4
    850c:	e24dd00c 	sub	sp, sp, #12
......................................

000085c0 :

void f3(int c) {
    85c0:	e1a0c00d 	mov	ip, sp
    85c4:	e92dd800 	push	{fp, ip, lr, pc}
    85c8:	e24cb004 	sub	fp, ip, #4
    85cc:	e24dd008 	sub	sp, sp, #8
........................................
    85dc:	ebffff6b 	bl	8390 <_init+0x20>
	backtrace();
    85e0:	ebffffc6 	bl	8500 
}
    85e4:	e24bd00c 	sub	sp, fp, #12
    85e8:	e89da800 	ldm	sp, {fp, sp, pc}
    85ec:	0000878c 	.word	0x0000878c

000085f0 :
void f2(int b) {
    85f0:	e1a0c00d 	mov	ip, sp
    85f4:	e92dd800 	push	{fp, ip, lr, pc}
    85f8:	e24cb004 	sub	fp, ip, #4
    85fc:	e24dd008 	sub	sp, sp, #8
    8600:	e50b0010 	str	r0, [fp, #-16]
	f3(b);
    8604:	e51b0010 	ldr	r0, [fp, #-16]
    8608:	ebffffec 	bl	85c0 
}
    860c:	e24bd00c 	sub	sp, fp, #12
    8610:	e89da800 	ldm	sp, {fp, sp, pc}

00008614 :
void f1(int a) {
    8614:	e1a0c00d 	mov	ip, sp
    8618:	e92dd800 	push	{fp, ip, lr, pc}
    861c:	e24cb004 	sub	fp, ip, #4
    8620:	e24dd018 	sub	sp, sp, #24
..........................................
	f2(a);
    8644:	e51b0020 	ldr	r0, [fp, #-32]
    8648:	ebffffe8 	bl	85f0 
}
    864c:	e59f3018 	ldr	r3, [pc, #24]	; 866c 

00008670 
: int main(int argc, char *argv[]) { 8670: e1a0c00d mov ip, sp 8674: e92dd800 push {fp, ip, lr, pc} 8678: e24cb004 sub fp, ip, #4 867c: e24dd008 sub sp, sp, #8 8680: e50b0010 str r0, [fp, #-16] 8684: e50b1014 str r1, [fp, #-20] printf("programe %s\n", argv[0]); 8688: e51b3014 ldr r3, [fp, #-20] 868c: e5933000 ldr r3, [r3] 8690: e59f001c ldr r0, [pc, #28] ; 86b4 8694: e1a01003 mov r1, r3 8698: ebffff3c bl 8390 <_init+0x20> f1(1); 869c: e3a00001 mov r0, #1 86a0: ebffffdb bl 8614 return 0; 86a4: e3a03000 mov r3, #0 }

 上面是样例代码对应的汇编代码截取。在函数的最开头都存在如下代码

    8500:	e1a0c00d 	mov	ip, sp
    8504:	e92dd810 	push	{r4, fp, ip, lr, pc}
    8508:	e24cb004 	sub	fp, ip, #4

 就是文章最开始说的函数一开始都会将fp、sp、lr以及pc压栈。那这几个寄存器里面的内容是什么呢?

sp即栈顶指针,sp里面记录的是当前函数的栈顶位置;并且从汇编代码里面能看到先是将sp给ip,然后将ip入栈。因此栈中记录的sp位置是压栈之前的

arm 函数栈回溯_第2张图片

lr用于保存函数的返回地址(若f2调用f3,那在样例代码中对应的位置就是这一行8558:    e89da800     ldm    sp, {fp, sp, pc}

pc指针,程序计数器,用于记录当前执行到哪条指令。但是由于ARM采用流水线机制。当正确读取PC时,该值为当前指令(正在执行的指令)地址+8个字节。即PC执行当前指令的下两条地址。所以这就解释了样例代码的打印是0000850c

void backtrace() {
    8500:    e1a0c00d     mov    ip, sp
    8504:    e92dd810     push    {r4, fp, ip, lr, pc}//执行到这里时,pc里面记录的是下面两条指令
    8508:    e24cb004     sub    fp, ip, #4
    850c:    e24dd00c     sub    sp, sp, #12
......................................

具体可以查看这篇文章

ARM体系结构相关杂记_这个我好像学过的博客-CSDN博客

fp:frame pointer:同样也是这段代码。sub    fp, ip, #4// fp = ip - 4。那fp其实保存的就是上一个函数的函数栈起始位置-4。这也是for循环里面下一个函数栈需要写为

for (;; frame = frame->fp - sizeof(struct stackframe) + sizeof(unsigned long))

即下一个函数栈是fp + 4 - 12

为什么是上一个函数栈呢?

我们看下面的代码f1调用f2。函数f2最开始压入的fp,这个fp寄存器里面记录的是什么值呢。它里面其实就是上一个函数里面的sub    fp, ip, #4得到的啊。ip里面又是上一个函数f1的函数栈开始位置。

000085f0 :
void f2(int b) {
    85f0:	e1a0c00d 	mov	ip, sp
    85f4:	e92dd800 	push	{fp, ip, lr, pc}
    85f8:	e24cb004 	sub	fp, ip, #4
    85fc:	e24dd008 	sub	sp, sp, #8
    8600:	e50b0010 	str	r0, [fp, #-16]
	f3(b);
    8604:	e51b0010 	ldr	r0, [fp, #-16]
    8608:	ebffffec 	bl	85c0 
}
    860c:	e24bd00c 	sub	sp, fp, #12
    8610:	e89da800 	ldm	sp, {fp, sp, pc}

00008614 :
void f1(int a) {
    8614:	e1a0c00d 	mov	ip, sp
    8618:	e92dd800 	push	{fp, ip, lr, pc}
    861c:	e24cb004 	sub	fp, ip, #4
    8620:	e24dd018 	sub	sp, sp, #24
..........................................
	f2(a);
    8644:	e51b0020 	ldr	r0, [fp, #-32]
    8648:	ebffffe8 	bl	85f0 
}
    864c:	e59f3018 	ldr	r3, [pc, #24]	; 866c 

因此最终的函数栈构成了下图所示。那我怎么感觉文章开始的那张图片是错的呢。。。。

arm 函数栈回溯_第3张图片

 最后样例代码运行结果如下图。由于不知道怎么算回溯结束,所以程序报错了

arm 函数栈回溯_第4张图片

另外程序打印出来的地址也会汇编代码吻合.具体可以看汇编信息

 arm 函数栈回溯_第5张图片

 另外用arm-linux-gnueabi-addr2line解析出来的行号也是准确的

你可能感兴趣的:(arm开发)