从汇编代码理解函数调用过程

如何理解函数调用过程?本文把一个简单的C语言程序汇编成目标代码,然后用objdump目标文件反编译成的汇编代码,从而一窥函数调用过程,希望对你有所启发。
C语言源码:

#include 

int static add(int a, int b)
{
        return a+b;
}

int main()
{
        int x = 5;
        int y = 10;
        int u = add(x, y);

        return 1;
}
~

经过编译:gcc -g -c add.c,生成目标代码add.o
查看目标文件(生成汇编代码): objdump -d -S add.o

add.o:  file format Mach-O 64-bit x86-64

Disassembly of section __TEXT,__text:
_main:
; {                         //这是注释(ps)
       0:   55  pushq   %rbp
       1:   48 89 e5    movq    %rsp, %rbp
       4:   48 83 ec 10     subq    $16, %rsp
       8:   c7 45 fc 00 00 00 00    movl    $0, -4(%rbp)
; int x = 5;
       f:   c7 45 f8 05 00 00 00    movl    $5, -8(%rbp)
; int y = 10;
      16:   c7 45 f4 0a 00 00 00    movl    $10, -12(%rbp)
; int u = add(x, y);
      1d:   8b 7d f8    movl    -8(%rbp), %edi
      20:   8b 75 f4    movl    -12(%rbp), %esi
      23:   e8 00 00 00 00  callq   0 <_main+0x28>
      28:   be 01 00 00 00  movl    $1, %esi
      2d:   89 45 f0    movl    %eax, -16(%rbp)
; return 1;
      30:   89 f0   movl    %esi, %eax
      32:   48 83 c4 10     addq    $16, %rsp
      36:   5d  popq    %rbp
      37:   c3  retq
      38:   0f 1f 84 00 00 00 00 00     nopl    (%rax,%rax)

_add:
; {
      40:   55  pushq   %rbp
      41:   48 89 e5    movq    %rsp, %rbp         ;当前函数的栈指针
      44:   89 7d fc    movl    %edi, -4(%rbp)      ;把寄存器的参数移动到栈上
      47:   89 75 f8    movl    %esi, -8(%rbp)      ;把寄存器的参数移动到栈上
; return a+b;
      4a:   8b 75 fc    movl    -4(%rbp), %esi
      4d:   03 75 f8    addl    -8(%rbp), %esi
      50:   89 f0   movl    %esi, %eax
      52:   5d  popq    %rbp
      53:   c3  retq

从上面可以看出:
1、目标文件(.o)的地址是从0开始的 (还没有在虚拟地址空间中分配地址,ld的时候才分配)
2、函数开始地址是4字节对齐的。
3、X86架构指令长度是变长的(ARM指令是定长的4字节)。
4、名字修饰,符号名称是通过下划线+函数名得到。

程序调用过程

调用方:
  1. 先把参数保存在寄存器edi和esi中(通过寄存器传参数)
  2. 调用callq
  3. 处理返回值eax

其中,callq做了两件事情:
1) 保存下一条指令的地址,用于函数返回继续执行
2) 跳转到子函数的地址

被调用方:
  1. 上一个函数的帧指针rbp入栈
  2. 栈指针rsp保存到帧指针
  3. 从寄存器(edi和esi)取出参数到栈中
  4. 运算
  5. 把计算结果保存在eax
  6. 弹出帧指针(还原前一个函数的rbp)
  7. 函数返回,取下一跳指令继续执行

特别说明
上面函数传参和返回参数传递是通过寄存器传递的,还可以通过栈和内存区域传递,具体可以参考C语言调用惯例。

一个函数的帧结构中包含哪些数据?

1、上一个栈帧寄存器保存在栈中的值
2、本函数用的临时变量
3、调用子函数传的参数
4、调用子函数后返回时继续执行的(返回地址)

栈帧结构

栈帧示意

你可能感兴趣的:(从汇编代码理解函数调用过程)