在正式开始介绍各种调用约定之前,有必要说明一下:这些调用约定是和编译器相关的,所以这些关键字前都有两个下划线,不同的编译器有不同的实现。比如VC和C++ Builder对于__fastcall的定义很不一样,以至于C++ Builder引入了__msfastcall关键字来和VC的__fastcall兼容。本文将要介绍的是VC的各种调用约定,文中所有的代码在Windows 2003, Visual Studio2005中测试通过,反编译工具使用的是VS2005和WinDbg。(代码被编译成debug版本。因为在release版本中,编译器会作代码优化)
几乎我们写的每一个WINDOWS API函数都是__stdcall类型的,首先,需要了解两者之间的区别:WINDOWS的函数调用时需要用到栈(STACK,一种先入后出的存储结构)。当函数调用完成后,栈需要清除,这里就是问题的关键,如何清除?如果我们的函数使用了_cdecl,那么栈的清除工作是由调用者,用COM的术语来讲就是客户来完成的。这样带来了一个棘手的问题,不同的编译器产生栈的方式不尽相同,那么调用者能否正常的完成清除工作呢?答案是不能。如果使用__stdcall,上面的问题就解决了,函数自己解决清除工作。所以,在跨(开发)平台的调用中,我们都使用__stdcall(虽然有时是以WINAPI的样子出现)。那么为什么还需要_cdecl呢?当我们遇到这样的函数如fprintf()它的参数是可变的,不定长的,被调用者事先无法知道参数的长度,事后的清除工作也无法正常的进行,因此,这种情况我们只能使用_cdecl。到这里我们有一个结论,如果你的程序中没有涉及可变参数,最好使用__stdcall关键字。
// 调用函数f1 f1( 1 , 2 , 3 , 4 ); // 函数f1的实现 int __cdecl f1( int a, int b, int c, int d) { return a + b + c + d; }
如果上面的反汇编有困难的话,可以记住这么一句话:__cdecl是由调用者来清除栈上的参数。
2. __stdcall
这个调用约定的使用也十分广泛,这也就是为什么它的名字是stdcall(standard call,标准调用)。WINAPI, CALLBACK实际上都是定义成__stdcall。Windows的大多数API函数都是采用这种调用约定。
;调用函数f2,4个参数分别是1,2,3和4
push 4 ;和f1一样
push 3 ;和f1一样
push 2 ;和f1一样
push 1 ;和f1一样
call f2 (40100Ah)
;函数f2的实现
push ebp ;和f1一样
mov ebp,esp ;和f1一样
mov eax,dword ptr [ebp+8] ;和f1一样
add eax,dword ptr [ebp+0Ch] ;和f1一样
add eax,dword ptr [ebp+10h] ;和f1一样
add eax,dword ptr [ebp+14h] ;和f1一样
pop ebp ;和f1一样
ret 10h ;函数返回,返回值是eax,并清除栈上的参数
通过比较,我们可以立刻发现__stdcall和__cdecl的反汇编有两个不同点:
a. __stdcall函数返回的时候使用了“ret 10h”,而__cdecl使用的是“ret”,这表明__stdcall函数在返回的时候就清除了4个参数(大小为10h),这个是函数实现部分来做的,而不是由调用者来做
b. 正因为函数本身已经清除了栈上的参数,调用者不需要在"call f2"之后再使用“add esp,10h”了。
可以看到__stdcall把函数返回和清除栈上函数合二为一,用一句“ret xxx”搞定,比__cdecl方便很多,那为什么不全部使用__stdcall呢?
这是因为 __stdcall有一个不足之处:它不能使用于那些可变参数个数的函数,比如printf, sprintf没有办法使用__stdcall。因为函数本身不知道每次调用时到底有几个参数,所以它无法确定ret后面的数字,这项工作只能让调用者自己去做。因此类似于printf, sprintf的函数都是使用__cdecl。注意:在VS2005中,如果给可变参数个数的函数用了__stdcall关键字,编译器不会报错,但是它实际上还是按照__cdecl调用约定进行编译,通过查看反汇编,然后和前面列出的反汇编进行比较,就会发现它用的是__cdecl。
3. __fastcall
在VC中这种调用约定和前两种比较起来,使用的比较少。(Borland C++的默认调用约定就是这个,但是和VC的实现有点不同。)还是让我们先看看编译器的工作。
// 调用函数f3 f3( 1 , 2 , 3 , 4 ); // 函数f3的实现 int __fastcall f3( int a, int b, int c, int d) { return a + b + c + d; }
;调用函数f3,4个参数分别是1,2,3和4,前两个参数放在ecx和edx寄存器中,后两个压栈
push 4 ;参数从右到左开始压栈,先压第4个参数
push 3 ;第3个参数压栈
mov edx,2 ;第2个参数放在edx寄存器中
mov ecx,1 ;第1个参数放在ecx寄存器中
call f3 (401014h) ;调用函数
;函数f3的实现
push ebp ;和f1,f2一样
mov ebp,esp ;和f1,f2一样
sub esp,8 ;在栈上空出8个byte的空间,用来存放两个int的临时变量
mov dword ptr [ebp-8],edx ;把第2个参数(edx)放到第2个变量
mov dword ptr [ebp-4],ecx ;把第1个参数(ecx)放到第1个变量
mov eax,dword ptr [ebp-4] ;eax = 第1个变量(第1个参数)
add eax,dword ptr [ebp-8] ;eax = eax + 第2个变量(第2个参数)
add eax,dword ptr [ebp+8] ;eax = eax + 参数c
add eax,dword ptr [ebp+0Ch] ;eax = eax + 参数d
mov esp,ebp ;清除临时变量
pop ebp ;和f1,f2一样
ret 8 ;函数返回,返回值是eax,并清除栈上的参数
从上面最后一行反汇编"ret 8"可以看到,__fastcall和__stdcall一样,也是函数本身来清除栈上的参数,这也就意味着__fastcall也有__stdcall的缺点:不支持可变参数个数的函数。
和__stdcall不同的是,__fastcall把第一,第二个参数放到了寄存器中,而不是压栈,因为寄存器的读写速度比栈快很多,这也就是为什么它叫快速调用(fast call。注意:在VC中的某些情况下,__fastcall比__stdcall和__cdecl慢)。
再介绍其他调用约定之前,让我们先回顾一下__cdecl,__stdcall和__fastcall。并且补充一些它们之前的区别(这些区别不太重要,所以上面没有讨论,只在这里列出)
|
__cdecl
|
__stdcall
|
__fastcall
|
压栈顺序
|
从右到左
|
从右到左
|
从右到左,前两个参数放在ecx, edx
|
谁清除栈上参数
|
调用者(caller)
|
函数(被调用者callee)
|
函数(被调用者callee)
|
默认调用约定的编译器参数
|
/Gd
|
/Gz
|
/Gr
|
可变参数个数的函数
|
支持
|
不支持
|
不支持
|
C的函数名修饰规范Name-decoration convention
|
加下划线前缀,如:_func
|
下划线开头,函数名,然后@符号,最后是参数的总byte数。如:int f(int a, double b ),名字为_f@12
|
以@开头,其他和__stdcall一样。如:@f@12
|
4. 一些过时的调用约定
__pascal, __fortran 和__syscall是三种已经过时的调用约定,MSDN的建议是使用WINAPI宏,也就是__stdcall来代替原来的PASCAL和 __far __pascal。
5. thiscall
在VS2005之前,这种调用约定仅仅应用于C++的成员函数:把this指针存放于CX寄存器,参数从右到左压栈,函数运行后,由函数来负责清除参数。我们前面已经讨论过由函数本身来清除参数的缺点:不支持可变参数个数的函数。所以对于那些可变参数个数的成员函数,C++使用的还是__cdecl调用约定。如下面这个class
f()成员函数使用的是thiscall调用约定,而v()成员函数使用的是__cdecl调用约定。还有一点需要注意,在VS2005之前,thiscall不能在程序中指定,因为它不是C++关键词。
在VS2005里,包括以后的VS版本中,__thiscall可以在托管VC程序中指定,它表明函数可以被原生代码调用。
6. __clrcall
看名字CLR call就知道这个调用约定和.NET Framework有关系,的确,使用__clrcall调用约定表明函数只能被托管代码(managed code)调用。如果您有一些VC++.NET的经验,可能会想:函数不是既可以被托管代码调用也可以被非托管代码(unmanaged code)调用吗?为什么要指定它只能被托管代码调用呢?
为了解释这个问题,必须介绍Double Thunking问题。先看下面一段代码,然后想想运行后会打印出什么结果。
#include < stdio.h > struct T { T(){}; T( const T & ) { printf( " copy constructor\n " ); } ~ T() { printf( " destructor\n " ); } }; struct S { virtual void f(T t) {}; } s; int main() { S * pS = & s; T t; printf( " BEGIN\n " ); pS -> f(t); printf( " END\n " ); }
看到运行结果了吗?
BEGIN copy constructor destructor END destructor
请注意BEGIN和END之间的输出:一个"copy constructor"和一个"destructor",现在让我们改变一下刚才那个编译选项,改成"Common Language Runtime Support(/clr)"[1],然后再编译,运行,看到运行结果了吗?
BEGIN copy constructor copy constructor destructor destructor END destructor