函数战争(栈帧)之创建与销毁(c语言)(vs2022)


 首先,什么是函数栈帧?

        C语言中,每个栈帧对应着一个未运行完的函数。栈帧中保存了该函数的返回地址和局部变量。栈帧也叫过程活动记录,是编译器用来实现过程函数调用的一种数据结构。

以问答的方式解释编译器与解释器-CSDN博客icon-default.png?t=N7T8https://blog.csdn.net/forccct/article/details/135349101?spm=1001.2014.3001.5501

函数栈帧的作用

        函数栈帧是编译器用来实现函数调用的一种数据结构。在执行函数时,每个函数都会分配一个独立的栈帧,用于存储该函数的参数、局部变量、返回地址等信息。

        栈帧的作用在于保存函数的运行环境,使得函数执行时可以随时访问其所需的参数和局部变量。当函数被调用时,其栈帧被推入栈中,成为当前活动的栈帧。当函数执行完毕后,其栈帧从栈中弹出,并释放相关的内存空间。

         在C语言中,每个栈帧对应着一个未运行完的函数。栈帧中保存了该函数的返回地址和局部变量。通过寄存器ebp和esp来维护当前的栈帧。

     函数栈帧是编译器用来实现函数执行环境的一种数据结构,它保存了函数的参数、局部变量和返回地址等信息,使得函数可以正确地执行并保持其运行环境。

学习函数栈帧的目的

       学习函数栈帧的目的在于深入理解程序的执行机制和编译器的工作原理。通过了解函数栈帧,程序员可以更好地理解函数调用时的内存布局、参数传递、局部变量管理以及异常处理等方面的知识。

        此外,理解函数栈帧也有助于提高程序的性能和可维护性。例如,通过合理使用栈帧,可以避免不必要的内存分配和释放操作,提高程序的执行效率。同时,了解栈帧也有助于在调试和优化程序时更好地分析程序的运行状态和性能瓶颈。

        学习函数栈帧可以帮助程序员更好地理解程序执行过程和编译器的工作原理,提高程序的性能和可维护性,并为解决复杂问题提供更有效的解决方案。

函数栈帧可以说是编程者的”内功“,修炼内功能更好的去理解和学习语


基础知识(相关的)

寄存器 

需要用到的寄存器的名字和功能
eax EAX 是"累加器"(accumulator), 它是很多加法乘法指令的缺省寄存器
ebx EBX 是"基地址"(base)寄存器, 在内存寻址时存放基地址
ecx 是计数器(counter), 是重复(rep)前缀指令和LOOP指令的内定计数器
edx 则总是被用来放整数除法产生的余数
ebp 寄存器存放当前线程的栈底指针
esp

寄存器存放当前线程的栈顶指针

  1. EAX (Accumulator Register):
    • 通常用于算术和逻辑运算。
    • 在函数调用中,它经常用来返回结果。
    • 在一些系统调用和指令中,eax 也用来传递参数。
  2. EBX (Base Register):
    • 通常用作指向数据的基址指针。
    • 在某些系统调用和指令中,ebx 也用来传递参数。
    • 在某些情况下,它也可以用作通用寄存器。
  3. ECX (Count Register):
    • 通常用作计数器,特别是在循环和字符串操作中。
    • 在某些系统调用和指令中,ecx 也用来传递参数。
  4. EDX (Data Register):
    • 通常与eax一起用于32位乘法和除法运算。
    • 在某些系统调用和指令中,edx 也用来传递参数或返回额外的结果信息。
  5. EBP (Base Pointer):
    • 在函数调用中,它通常用来指向当前函数的栈帧基址。
    • 通过ebp,函数可以方便地访问其参数和局部变量,即使栈顶指针(esp)在函数执行过程中发生变化。
  6. ESP (Stack Pointer):
    • 指向栈顶的指针。
    • 当数据被压入栈时,esp减小;当数据从栈中弹出时,esp增加(在x86体系结构中,栈是向下增长的)。
    • 通过修改esp,函数可以分配和释放栈空间。

     详细见:寄存器的相关知识-CSDN博客”icon-default.png?t=N7T8https://blog.csdn.net/forccct/article/details/135316297?spm=1001.2014.3001.5501

汇编命令

汇编语言是一种低级语言,它直接与计算机的硬件和操作系统交互。汇编命令(或指令)是汇编语言中的基本单位,用于控制计算机执行特定的操作。以下是一些常见的汇编命令:

  1. 数据传送指令
    • MOV:将数据从一个位置移动到另一个位置。
    • PUSH:将数据压入栈中,同时更新栈顶指针。
    • POP:从栈顶弹出数据,同时更新栈顶指针。
  2. 算术运算指令
    • ADD:将两个数相加。
    • SUB:从第一个数中减去第二个数。
    • MUL 和 IMUL:无符号乘法和有符号乘法。
    • DIV 和 IDIV:无符号除法和有符号除法。
  3. 逻辑运算指令
    • AND:按位与操作。
    • OR:按位或操作。
    • XOR:按位异或操作。
    • NOT:按位非操作。
  4. 控制流指令
    • JMP:无条件跳转到一个指定的地址。
    • Jcc(如 JZJNZJEJNE 等):基于某个条件(如零标志位、符号标志位等)进行跳转。
    • CALL:调用一个子程序,保存返回地址。
    • RET:从子程序返回,恢复返回地址。
  5. 比较指令
    • CMP:比较两个操作数,设置相应的标志位。
  6. 堆栈操作指令(除了 PUSH 和 POP):
    • PUSHF 和 POPF:将标志寄存器压入栈中或从栈中弹出。
    • ENTER 和 LEAVE:用于高级语言过程/函数的栈帧设置和清除。
  7. 输入输出指令(与硬件或操作系统交互):
    • IN 和 OUT:从端口读取数据或向端口写入数据。
  8. 其他指令
    • NOP:无操作,通常用于填充或微调代码时序。
    • HLT:停止执行并等待外部中断。
    • CLI 和 STI:清除或设置中断标志。
    • 等等。

需要注意的是,具体的指令集依赖于特定的处理器架构(如 x86, ARM, MIPS 等),不同的架构有不同的指令集和寻址模式。上述指令主要基于 x86 架构,其他架构的指令可能会有所不同。

我们主要用到了

mov     push     pop     sub     add      call       jump      ret

栈和栈帧

            堆栈(stack)又称为堆叠,是计算机科学里最重要且最基础的数据结构之一,它按照FILO(First In Last Out,后进先出)的原则存储数据。(引用)

            但是我们为了简单理解函数栈帧,我们不需要很深入的了解,就只需要明白栈帧在内存中的存在形式...

             函数战争(栈帧)之创建与销毁(c语言)(vs2022)_第1张图片

       理解这个图.

       下面是高地址,上面是高地址,可以理解函数栈帧中,汇编命令从高地址向低地址访问改变和操控.

        这个栈,或者说这些值和其地址以这种形式存在于内存中,你访问就是内存.

推荐可以看一眼

汇编语言(不是很有必要学习,提供一个大佬的文章)

汇编语言入门教程 - 阮一峰的网络日志 (ruanyifeng.com)icon-default.png?t=N7T8https://www.ruanyifeng.com/blog/2018/01/assembly-language-primer.html


正式内容 

我们以vs2022为例子

 使用代码部分

int add(int x, int y)
{
    int n = 0;
    n = x + y;
    return n;
}

int main()
{
    int a = 1;
    int b = 2;
    int c = 5;
    c = add(a, b);
    printf("%d", c);
    return 0;
}

然后是打开反汇编

函数战争(栈帧)之创建与销毁(c语言)(vs2022)_第2张图片

寄存器部分

首先是

00007FF79D985BB0  push        rbp  
00007FF79D985BB2  push        rdi  

这两个命令是 rbp 和 rdi 入栈

函数战争(栈帧)之创建与销毁(c语言)(vs2022)_第3张图片

 00007FF79D985BB3  sub         rsp,148h  

申请148h字节内存

 00007FF79D985BBA  lea         rbp,[rsp+20h] 

00007FF79D985BBF  lea         rcx,[__0C5A5099_121@c (07FF79D992008h)] 

把rsp+20h的值塞入lea中,也就是为add申请20h字节的内存

 

    int a = 1;
00007FF79D985BCB  mov         dword ptr [rbp+4],1  
    int b = 2;
00007FF79D985BD2  mov         dword ptr [rbp+24h],2  
    int c = 5;
00007FF79D985BD9  mov         dword ptr [rbp+44h],5  

 分别为每个内存申请一个空间和带入数字

此时

函数战争(栈帧)之创建与销毁(c语言)(vs2022)_第4张图片

00007FF79D985BE0  mov         edx,dword ptr [rbp+24h]  
00007FF79D985BE3  mov         ecx,dword ptr [rbp+4]  
00007FF79D985BE6  call        00007FF79D9813E3  
00007FF79D985BEB  mov         dword ptr [rbp+44h],eax 

 rbp+4 是a的地址 rbp+24h是b的地址 rbp+44h是c的地址 他们并不是连续存在的

上面的寄存器edx ecx 分别记录了a的值 c的值 并且记录在上面

函数战争(栈帧)之创建与销毁(c语言)(vs2022)_第5张图片

现在是这个情况

然后是

 函数战争(栈帧)之创建与销毁(c语言)(vs2022)_第6张图片

 00007FF79D981DE0  mov         qword ptr [rsp+8],rcx  
00007FF79D981DE5  sub         rsp,38h  

 录入rcx 向上推rsp 现在理解 edx就是x的值  ecx就是y的值 这里的供add使用

这里是把rcx的值放到rsp上面+8地址内 rsp再向上移动38h个字节函数战争(栈帧)之创建与销毁(c语言)(vs2022)_第7张图片

 

 00007FF79D981DE9  mov         rax,qword ptr [rsp+40h]  
00007FF79D981DEE  mov         qword ptr [rsp+20h],rax

把rax移动到rsp+40h 把 rsp+20h移动到rax 

00007FF79D981DE0  mov         qword ptr [rsp+8],rcx  
00007FF79D981DE5  sub         rsp,38h  
    unsigned char *__DebuggerLocalJMCFlag = JMC_flag;
00007FF79D981DE9  mov         rax,qword ptr [rsp+40h]  
00007FF79D981DEE  mov         qword ptr [rsp+20h],rax  

    if (*JMC_flag && __DebuggerCurrentSteppingThreadId != 0 && __DebuggerCurrentSteppingThreadId == GetCurrentThreadId()) {
00007FF79D981DF3  mov         rax,qword ptr [rsp+40h]  
00007FF79D981DF8  movzx       eax,byte ptr [rax]  
00007FF79D981DFB  test        eax,eax  
00007FF79D981DFD  je          00007FF79D981E17  
00007FF79D981DFF  cmp         dword ptr [00007FF79D98D94Ch],0  
00007FF79D981E06  je          00007FF79D981E17  
00007FF79D981E08  call        qword ptr [00007FF79D991088h]  
00007FF79D981E0E  cmp         dword ptr [00007FF79D98D94Ch],eax  
00007FF79D981E14  jne         00007FF79D981E17  
NopLabel:
        __nop();
00007FF79D981E16  nop  
    }
}
00007FF79D981E17  add         rsp,38h 

经过上列过程开辟新函数的内容

00007FF79D985BE0  mov         edx,dword ptr [rbp+24h]  
00007FF79D985BE3  mov         ecx,dword ptr [rbp+4

00007FF79D985BE6  call        00007FF79D9813E3  
00007FF79D985BEB  mov         dword ptr [rbp+44h],eax 

其中

00007FF79D985BE6  call        00007FF79D9813E3  

 利用call调用add函数,把rbp+24h(edx) 和 rbp+4(ecx)的值在add中调用的返回值放入到eax中

然后把eax的值放入 rbp+44h(也就是c的地址) 完成了c的赋值


00007FF79D985BFD  xor         eax,eax  
}
00007FF79D985BFF  lea         rsp,[rbp+0000000000000128h]  
00007FF79D985C06  pop         rdi  
00007FF79D985C07  pop         rbp 

00007FF79D985C08  ret

这里是return 0;后面的

大致计算销毁占用的内存 然后返回系统

 然后结束

你可能感兴趣的:(#,C语言进阶,开发语言,c语言,编辑器,其他)