转载自 http://www.kgdb.info/gdb/using_gdb_to_inside_function_call_stack/
“参数从右到左入栈”,“局部变量在栈上分配空间”,听的耳朵都起茧子了。
最近做项目涉及C和汇编互相调用,写代码的时候才发现没真正弄明白。
自己写了个最简单的函数,用gdb跟踪了调用过程,才多少懂了一点。
参考资料:(感谢liigo和eno_rez两位作者)
http://blog.csdn.net/liigo/archive/2006/12/23/1456938.aspx
http://blog.csdn.net/eno_rez/archive/2008/03/08/2158682.aspx
编译:(Fedora6, gcc 4.1.2)
[test]$ gcc -g -Wall -o stack stack.c
反汇编:
这里的汇编的格式是AT&T汇编,它的格式和我们熟悉的汇编格式不太一样,尤其要注意源操作数和目的操作数的顺序是反过来的
[test]$ objdump -d stack > stack.dump
[test]$ cat stack.dump
……
08048354 <add>:
8048354: 55 push %ebp ;保存调用者的帧指针
8048355: 89 e5 mov %esp,%ebp ;把当前的栈指针作为本函数的帧指针
8048357: 83 ec 10 sub $0×10,%esp ;调整栈指针,为局部变量保留空间
804835a: c7 45 fc 00 00 00 00 movl $0×0,0xfffffffc(%ebp) ;把a置0。ebp-4的位置是第一个局部变量
8048361: 8b 45 08 mov 0×8(%ebp),%eax ;把参数x保存到eax。ebp+8的位置是最后一个入栈的参数,也就是第一个参数
8048364: 89 45 fc mov %eax,0xfffffffc(%ebp) ;把eax赋值给变量a
8048367: 8b 45 0c mov 0xc(%ebp),%eax ;把参数y保存到eax。ebp+C的位置是倒数第二个入栈的参数,也就是第二个参数
804836a: 01 45 fc add %eax,0xfffffffc(%ebp) ;a+=y
804836d: 8b 45 fc mov 0xfffffffc(%ebp),%eax ;把a的值作为返回值,保存到eax
8048370: c9 leave
8048371: c3 ret
08048372 <main>:
8048372: 8d 4c 24 04 lea 0×4(%esp),%ecx ;????
8048376: 83 e4 f0 and $0xfffffff0,%esp ;把栈指针16字节对齐
8048379: ff 71 fc pushl 0xfffffffc(%ecx) ;????
804837c: 55 push %ebp ;保存调用者的帧指针
804837d: 89 e5 mov %esp,%ebp ;把当前的栈指针作为本函数的帧指针
804837f: 51 push %ecx ;????
8048380: 83 ec 18 sub $0×18,%esp ;调整栈指针,为局部变量保留空间
8048383: c7 45 f0 12 00 00 00 movl $0×12,0xfffffff0(%ebp) ;x=0×12。ebp-16是局部变量x
804838a: c7 45 f4 34 00 00 00 movl $0×34,0xfffffff4(%ebp) ;y=0×34。ebp-12是局部变量y
8048391: 8b 45 f4 mov 0xfffffff4(%ebp),%eax ;y保存到eax
8048394: 89 44 24 04 mov %eax,0×4(%esp) ;y作为最右边的参数首先入栈
8048398: 8b 45 f0 mov 0xfffffff0(%ebp),%eax ;x保存到eax
804839b: 89 04 24 mov %eax,(%esp) ;x第二个入栈
804839e: e8 b1 ff ff ff call 8048354 <add> ;调用add
80483a3: 89 45 f8 mov %eax,0xfffffff8(%ebp) ;把保存在eax的add的返回值,赋值给位于ebp-8的第三个局部变量result。注意这条指令的地址,就是add的返回地址
80483a6: b8 00 00 00 00 mov $0×0,%eax ;0作为main的返回值,保存到eax
80483ab: 83 c4 18 add $0×18,%esp ;恢复栈指针,也就是讨论stdcall和cdecl的时候总要提到的“调用者清栈”
80483ae: 59 pop %ecx ;
80483af: 5d pop %ebp ;
80483b0: 8d 61 fc lea 0xfffffffc(%ecx),%esp ;
80483b3: c3 ret
80483b4: 90 nop
……
有一点值得注意的是main在调用add之前把参数压栈的过程。
它用的不是push指令,而是另一种方法。
在main入口调整栈指针的时候,也就是位于8048380的这条指令 sub $0×18,%esp
不但象通常函数都要做的那样给局部变量预留了空间,还顺便把调用add的两个参数的空间也预留出来了。
然后把参数压栈的时候,用的是mov指令。
我不太明白这种方法有什么好处。
另外一个不明白的就是main入口的四条指令8048372、8048376、8048379、804837f,还有与之对应的main返回之前的指令。
貌似main对esp要求16字节对齐,所以先把原来的esp压栈,然后强行把esp的低4位清0。等到返回之前再从栈里恢复原来的esp
准备工作都做好了,现在开始gdb
对gdb不太熟悉的同学要注意一点,stepi命令执行之后显示出来的源代码行或者指令地址,都是即将执行的指令,而不是刚刚执行完的指令。
我在每个stepi后面都加了注释,就是刚执行过的指令。
[test]$ gdb -q stack
(gdb) break main
Breakpoint 1 at 0×8048383: file stack.c, line 11.
gdb并没有把断点设置在main的第一条指令,而是设置在了调整栈指针为局部变量保留空间之后
(gdb) run
Starting program: /home/brookmill/test/stack
Breakpoint 1, main () at stack.c:11
11 x = 0×12;
(gdb) stepi // 注释: movl $0×12,0xfffffff0(%ebp)
12 y = 0×34;
(gdb) stepi // 注释: movl $0×34,0xfffffff4(%ebp)
13 result = add(x, y);
(gdb) info registers esp
esp 0xbf8df8ac 0xbf8df8ac
(gdb) info registers ebp
ebp 0xbf8df8c8 0xbf8df8c8
(gdb) x/12 0xbf8df8a0
0xbf8df8a0: 0×002daff4 0×002d9220 0xbf8df8d8 0×080483e9
0xbf8df8b0: 0×001ca8d5 0xbf8df96c 0×00000012 0×00000034
0xbf8df8c0: 0×001903d0 0xbf8df8e0 0xbf8df938 0×001b4dec
这就是传说中的栈。在main准备调用add之前,先看看这里有些什么东东
0xbf8df8c8(ebp)保存的是上一层函数的帧指针:0xbf8df938,距离这里有112字节
0xbf8df8cc(ebp+4)保存的是main的返回地址0×001b4dec
0xbf8df8b8(ebp-16)是局部变量x,已经赋值0×12;
0xbf8df8bc(ebp-12)是局部变量y,已经赋值0×34;
0xbf8df8c0(ebp-8)是局部变量result。值得注意的是,因为我们没有给result赋值,这里是一个不确定的值。局部变量如果不显式的初始化,初始值不一定是0。
现在开始调用add
(gdb) stepi // 注释: mov 0xfffffff4(%ebp),%eax
0×08048394 13 result = add(x, y);
(gdb) stepi // 注释: mov %eax,0×4(%esp)
0×08048398 13 result = add(x, y);
(gdb) x/12 0xbf8df8a0
0xbf8df8a0: 0×002daff4 0×002d9220 0xbf8df8d8 0×080483e9
0xbf8df8b0: 0×00000034 0xbf8df96c 0×00000012 0×00000034
0xbf8df8c0: 0×001903d0 0xbf8df8e0 0xbf8df938 0×001b4dec
y首先被压栈,在0xbf8df8b0
(gdb) stepi // 注释: mov 0xfffffff0(%ebp),%eax
0×0804839b 13 result = add(x, y);
(gdb) stepi // 注释: mov %eax,(%esp)
0×0804839e 13 result = add(x, y);
(gdb) x/12 0xbf8df8a0
0xbf8df8a0: 0×002daff4 0×002d9220 0xbf8df8d8 0×00000012
0xbf8df8b0: 0×00000034 0xbf8df96c 0×00000012 0×00000034
0xbf8df8c0: 0×001903d0 0xbf8df8e0 0xbf8df938 0×001b4dec
x第二个进栈,在0xbf8df8ac
(gdb) stepi // 注释: call 8048354 <add>
add (x=18, y=52) at stack.c:2
2 {
刚刚执行了call指令,现在我们进入了add函数
(gdb) info registers esp
esp 0xbf8df8a8 0xbf8df8a8
(gdb) info registers ebp
ebp 0xbf8df8c8 0xbf8df8c8
(gdb) x/12 0xbf8df8a0
0xbf8df8a0: 0×002daff4 0×002d9220 0×080483a3 0×00000012
0xbf8df8b0: 0×00000034 0xbf8df96c 0×00000012 0×00000034
0xbf8df8c0: 0×001903d0 0xbf8df8e0 0xbf8df938 0×001b4dec
现在esp指向0xbf8df8a8,这里保存的是add函数的返回地址,它是由call指令压栈的。
(gdb) stepi // 注释: push %ebp
0×08048355 2 {
(gdb) stepi // 注释: mov %esp,%ebp
0×08048357 2 {
(gdb) stepi // 注释: sub $0×10,%esp
3 int a = 0;
(gdb) info registers esp
esp 0xbf8df894 0xbf8df894
(gdb) info registers ebp
ebp 0xbf8df8a4 0xbf8df8a4
(gdb) x/16 0xbf8df890
0xbf8df890: 0×00000000 0×08049574 0xbf8df8a8 0×08048245
0xbf8df8a0: 0×002daff4 0xbf8df8c8 0×080483a3 0×00000012
0xbf8df8b0: 0×00000034 0xbf8df96c 0×00000012 0×00000034
0xbf8df8c0: 0×001903d0 0xbf8df8e0 0xbf8df938 0×001b4dec
刚刚执行完的3条指令是函数入口的定式。
现在我们可以看到,main的栈还是原样,向下增长之后就是add的栈。
0xbf8df8a4(ebp)保存的是上层函数main的帧指针
0xbf8df8a8(ebp+4)保存的是返回地址
0xbf8df8ac(ebp+8)保存的是最后一个入栈的参数x
0xbf8df8b0(ebp+C)保存的是倒数第二个入栈的参数y
0xbf8df8a0(ebp-4)保存的是局部变量a,现在是一个不确定值
接下来add函数就真正开始干活了
(gdb) stepi // 注释: movl $0×0,0xfffffffc(%ebp)
4 a = x;
(gdb) x/16 0xbf8df890
0xbf8df890: 0×00000000 0×08049574 0xbf8df8a8 0×08048245
0xbf8df8a0: 0×00000000 0xbf8df8c8 0×080483a3 0×00000012
0xbf8df8b0: 0×00000034 0xbf8df96c 0×00000012 0×00000034
0xbf8df8c0: 0×001903d0 0xbf8df8e0 0xbf8df938 0×001b4dec
可以看到a被置0了
(gdb) stepi // 注释: mov 0×8(%ebp),%eax
0×08048364 4 a = x;
(gdb) stepi // 注释: mov %eax,0xfffffffc(%ebp)
5 a += y;
(gdb) x/16 0xbf8df890
0xbf8df890: 0×00000000 0×08049574 0xbf8df8a8 0×08048245
0xbf8df8a0: 0×00000012 0xbf8df8c8 0×080483a3 0×00000012
0xbf8df8b0: 0×00000034 0xbf8df96c 0×00000012 0×00000034
0xbf8df8c0: 0×001903d0 0xbf8df8e0 0xbf8df938 0×001b4dec
参数x(ebp+8)的值通过eax赋值给了局部变量a(ebp-4)
(gdb) stepi // 注释: mov 0xc(%ebp),%eax
0×0804836a 5 a += y;
(gdb) stepi // 注释: add %eax,0xfffffffc(%ebp)
6 return a;
(gdb) x/16 0xbf8df890
0xbf8df890: 0×00000000 0×08049574 0xbf8df8a8 0×08048245
0xbf8df8a0: 0×00000046 0xbf8df8c8 0×080483a3 0×00000012
0xbf8df8b0: 0×00000034 0xbf8df96c 0×00000012 0×00000034
0xbf8df8c0: 0×001903d0 0xbf8df8e0 0xbf8df938 0×001b4dec
参数y(ebp+C)的值通过eax加到了局部变量a(ebp-4)
现在要从add返回了。返回之前把局部变量a(ebp-4)保存到eax用作返回值
(gdb) stepi // 注释: mov 0xfffffffc(%ebp),%eax
7 }
(gdb) stepi // 注释: leave
0×08048371 in add (x=1686688, y=134513616) at stack.c:7
7 }
(gdb) stepi // 注释: ret
0×080483a3 in main () at stack.c:13
13 result = add(x, y);
现在我们回到了main,栈现在是这样的
(gdb) info registers esp
esp 0xbf8df8ac 0xbf8df8ac
(gdb) info registers ebp
ebp 0xbf8df8c8 0xbf8df8c8
(gdb) x/16 0xbf8df890
0xbf8df890: 0×00000000 0×08049574 0xbf8df8a8 0×08048245
0xbf8df8a0: 0×00000046 0xbf8df8c8 0×080483a3 0×00000012
0xbf8df8b0: 0×00000034 0xbf8df96c 0×00000012 0×00000034
0xbf8df8c0: 0×001903d0 0xbf8df8e0 0xbf8df938 0×001b4dec
可以看到,esp和ebp都已经恢复到了调用add之前的值。
但是,调用add的两个参数还在栈里(0xbf8df8ac、0xbf8df8b0,都在esp以上)。
也就是说,被调用的函数add没有把它们从栈上清出去,需要调用方main来清理。这就是著名的“调用者清栈”,cdecl调用方式的特点之一。
(gdb) stepi // 注释: mov %eax,0xfffffff8(%ebp)
14 return 0;
(gdb) x/16 0xbf8df890
0xbf8df890: 0×00000000 0×08049574 0xbf8df8a8 0×08048245
0xbf8df8a0: 0×00000046 0xbf8df8c8 0×080483a3 0×00000012
0xbf8df8b0: 0×00000034 0xbf8df96c 0×00000012 0×00000034
0xbf8df8c0: 0×00000046 0xbf8df8e0 0xbf8df938 0×001b4dec
从eax得到函数add的返回值,赋值给了局部变量result(ebp-8)