目录
1、寄存器的分类与作用
2、测试代码与所需要的知识点
2.1、测试代码
2.2 、关于main函数的调用
2.3、关于栈、压栈、出栈简介
3、main函数栈帧的创建与分析
3 .1、push edp
3.2、mov ebp,esp
3.3、sub esp,0E4h
3.4、push ebx,esi,edi
3.5、lea edi,[ebp- 0E4hh] / mov ecx,9 / mov eax, 0CCCCCCCCh】
3.6、rep stos dword ptr es:[edi]
3.7、mov dword ptr [ebp - 8] ,0Ah/mov dword ptr [ebp - 14h] ,14h/mov dword ptr [ebp - 20h] ,0
3.8、mov eax,dword ptr [ebp - 14h] / push eax
3.9、call 00C210E1
4、Add函数栈帧的创建
4.1、mov dword ptr [ebp-8],0
4.2、mov eax, dword ptr [ebp+8]
4.3、add eax, dword ptr [ebp+0Ch]
4.4、mov dword ptr [ebp-8], eax
4.5、mov eax, dword ptr [ebp-8]
5、Add函数栈帧的销毁
5.1、pop edi / esi / ebx
5.2、mov esp, ebp
5.3、 pop ebp
5.4、ret
5.5、 mov dword ptr [ebp-20h],eax
6、main函数栈帧的销毁
在学习函数栈帧的创建和销毁前我们得知道学它们得作用:
知道了函数栈帧的创建和销毁,并且都会了,其实也就是修炼了自己的内功,内功越强大练武功就会事半功倍;
好了,接下来我们进入正题,博主今天所使用的环境是vs2013,这里注意:不要使用太高级的编译器,越高级的编译器,越不容易学习和观察。同时在不同的编译器下,函数调用过程中栈帧的创建是略有差异的,具体细节取决于编译器的实现
在C语言中我们可以把寄存器当成指针来看待,他可以指向一块空间,也可以用来存储数据。现在向大家介绍以下几种基本寄存器
int Add(int x,int y)
{
int z = 0;
z = x + y;
return z;
}
int main()
{
int a = 10;
int b = 20;
int c = Add(a,b);
printf("%d\n",c);
return 0;
}
main函数其实也是被其他函数调用的,函数调用关系如下:
mainCRTStartup → __tmainCRTStartup → main
我们知道,函数的调用都需要在栈区上开辟空间,那么我们先来解答几个问题:
1.什么是栈?
【答】栈是一种数据结构,它按照后进先出的原则存储数据,先进入的数据被压入栈底,最后的数据在栈顶,需要读数据的时候从栈顶开始弹出数据。栈区内存空间的使用是从高地址向低地址处使用的。
2.什么是压栈?什么是出栈?
【答】一个形象的比喻就是机枪弹夹。压栈的过程就是压入一个元素,相当于向机枪弹夹压入子弹;出栈的过程就是弹出一个元素,相当于子弹弹出来的过程。这正好对应了栈的结构特点——先进入的数据被压在栈底,后进入的数据在栈顶
关于后续可能使用的大小端,可以去看看博主关于数据存储方面的讲解;
每一个函数的调用都要在栈区分配空间,同时注意,栈区上内存的使用是从高地址向低地址处使用的
这块开辟的空间由我们前面所讲的esp和edp进行维护
我们前面所讲的main函数其实也是被其他函数调用的,其实这儿也有调用空间
接下来我们调试代码后,进入反汇编模式,这里我们与要注意,我们需要将显示符号名去掉2,以方便后续的观察
我们之前提到,main函数是由__tmianCRTStartup函数调用的,所以在创建main函数栈帧前,ebp和esp寄存器维护--tmainCRTStartup的栈区,分别存放指向栈帧的栈顶和栈底
push指令的作用:它首先减小esp的值,再将源操作数复制到栈地址,每次esp地址减去四字节。最终效果就是在栈顶压入一个元素,元素的值为ebp的地址。(4个字节)
ebp里存放的是__tmianCRTStartup函数栈底的地址,由于esp指向栈顶,所以esp向上移动一位
mov指令作用:将一个数据从源地址传送到目标地址,源操作地址的内容不变。最终效果是将esp的地址赋值给ebp。寄存器指向的空间发生改变。
此时就变为
sub指令的作用:减操作指令,地址减去相应的数值。最终效果就是esp的地址减去0E4h
此时呢我们esp和ebp就为main函数预开辟了空间
前面我们提到过push的过程就压入元素的过程。那压入这三个元素有什么用呢?等会就明白。
Load Effective Address,即装入有效地址的意思,它的操作数就是地址。在这里的效果就是将ebp+FFFFFF1Ch的值赋给edi。勾选“显示符号名后可以发现: ebp - 0E4h不正是当初esp - 0E4h时的地址
rep指令的作用是:重复后面的指令。stos指令的作用是将eax中的值拷贝到es:edi指向的地址。ecx表示重复操作的次数。dword表示4个字节。所以整句指令的作用是:从edi开始,向高地址方向,将ecx个4字节内存全部修改为eax的值。
可以看到,执行操作后edi上相应数量的四字节内存被赋值为cc cc cc cc。这也解释了为什么我们不初始化,变量默认的初始值为cc cc cc cc
main函数开辟就此完成,接下来我们要实现有效的代码了
将ebp - 8地址处的四字节内容修改为0Ah(10进制中的10),也就是完成了给a赋值为10的动作。下一条语句同理。
每个变量之间相差两个整型,8个字节
至此main函数的栈帧创建的准备阶段完成。我们准备进入Add函数
将ebp - 14h地址处的数值储存到eax处;压栈,将一个数值与eax相等的元素压入栈中。ebp - 14h这个地址好像似曾相识,没错,这正是b的地址,所以这条语句的作用实际上即使将b的值传到eax中。同理,a的值被存储到ecx中去。
(实际上,上述过程解释了函数究竟是如何传参的。传参的顺序和变量创建的顺序恰好相反,先传b再传a。同时注意函数传参并不是在add函数栈帧内完成的,而是在main函数的栈帧内完成,通过寄存器eax和ecx实现变量的传递)
压栈后如下
call指令的作用是:将下一条的指令的ip压入栈中,并转移到即将被调用的子程序。相当于push ip + jmp near ptr 标号。我们现在来观察栈顶的变化。
我们惊奇的发现栈顶自动压入了一个元素,元素的值为——call指令的下一条指令的地址 。那压入这个元素有什么用呢?试想,当call指令调用add函数后,我们跳转到add函数内部,那函数结束后如何保证我们从add函数后面的语句继续执行呢?靠的就是栈顶压入的地址,根据这个地址我们可以回到call指令的下一条语句
再次按下F11后我们就跳转到add函数内部。
我们发现蓝色部分的操作和main函数内完全一致,都是为栈帧的创建做准备
当我们Add函数的栈帧创建后,我们现在研究接下来的指令
将ebp - 8 的地址赋值为0。也就代表着将Z初始化为0
将 ebp + 8 处的值赋值给eax。此时eax储存着形参a的值
将eax加上 ebp + 12(0ch的十进制表现) 处的值。此时eax表示这a+b的值
将eax储存的a+b的值传送到ebp - 8的地址处,也就是赋值给变量Z
从上面我们也可以加深这样的认识:形参只是实参的一个临时拷贝,所以修改形参当然不会影响实参。
将ebp-8的值放在eax里面,防止被销毁
我们知道函数内创建的临时变量出函数后被销毁,那返回值是如何被带回主函数的呢?靠的就是寄存器eax。这一步的操作就是 return返回 值的过程。
pop的作用是将栈顶的数据弹出,弹出数据储存到相应寄存器中。每次pop过程中esp的地址自动加4字节
把edp赋给esp,一句话就回收了为add函数开辟的内存
弹出栈顶的元素,并将弹出的数据储存到ebp寄存器中。由于此时的栈顶元素事先存入main函数中ebp的地址,所以pop ebp时,将main函数中的ebp元素的地址存入ebp寄存器中
ret指令的作用实际相当于 pop IP。在这里实际就是弹出了栈顶事先存储的call指令下一条指令的地址,并跳转到该地址处。
这里其实当实行pop指令后,两个形参也就已于销毁了
将eax的值放入edp-20h里面,也就是我们返回值放入c里面
main函数和add函数栈帧的销毁基本是一致的,因为我们前面提到,main函数也是被其他函数调用的。以此类推。后面我就不多讲了,有问题的可以在评论区或者私信博主。