调用约定(pascal,fastcall,stdcall,thiscall,cdecl)区别等

 http://hi.csdn.net/maotoula  总结

tag:汇编,pascal,fastcall,stdcall,thiscall,cdecl,调用约定,函数调用约定,返回值传递方式

摘要:文章讲述了几种主要程序语言中的函数调用约定;详细说明时主要以VC6中的函数调用约定为主,阐释方式主要是以C++程序编译后得到的汇编代码来进行说明;

文章来源于abp论坛中的一篇帖子:http://bbs.allaboutprogram.com/viewtopic.php?t=1245

 我所使用的编译器和平台:WindowsXP + 赛扬1G + VC6(主要工具)/Delphi6/C++Builder6;


一:函数调用约定; 
    函数调用约定是函数调用者和被调用的函数体之间关于参数传递、返回值传递、堆栈清除、寄存器使用的一种约定; 
    它是需要二进制级别兼容的强约定,函数调用者和函数体如果使用不同的调用约定,将可能造成程序执行错误,必须把它看作是函数声明的一部分;

二:常见的函数调用约定;

VC6中的函数调用约定;


        调用约定        堆栈清除    参数传递 
        __cdecl         调用者      从右到左,通过堆栈传递 
        __stdcall       函数体      从右到左,通过堆栈传递 
        __fastcall      函数体      从右到左,优先使用寄存器(ECX,EDX),然后使用堆栈 
        thiscall        函数体      this指针默认通过ECX传递,其它参数从右到左入栈


__cdecl是C/C++的默认调用约定; VC的调用约定中并没有thiscall这个关键字,它是类成员函数默认调用约定; 
C/C++中的main(或wmain)函数的调用约定必须是__cdecl,不允许更改; 
默认调用约定一般能够通过编译器设置进行更改,如果你的代码依赖于调用约定,请明确指出需要使用的调用约定;


Delphi6中的函数调用约定;


        调用约定        堆栈清除    参数传递 
        register        函数体      从左到右,优先使用寄存器(EAX,EDX,ECX),然后使用堆栈 
        pascal          函数体      从左到右,通过堆栈传递 
        cdecl           调用者      从右到左,通过堆栈传递(与C/C++默认调用约定兼容) 
        stdcall         函数体      从右到左,通过堆栈传递(与VC中的__stdcall兼容) 
        safecall        函数体      从右到左,通过堆栈传递(同stdcall)

Delphi中的默认调用约定是register,它也是我认为最有效率的一种调用方式,而cdecl是我认为综合效率最差的一种调用方式; 
VC中的__fastcall调用约定一般比register效率稍差一些;

C++Builder6中的函数调用约定;


        调用约定        堆栈清除    参数传递 
        __fastcall      函数体      从左到右,优先使用寄存器(EAX,EDX,ECX),然后使用堆栈 (兼容Delphi的register) 
        (register与__fastcall等同) 
        __pascal        函数体      从左到右,通过堆栈传递 
        __cdecl         调用者      从右到左,通过堆栈传递(与C/C++默认调用约定兼容) 
        __stdcall       函数体      从右到左,通过堆栈传递(与VC中的__stdcall兼容) 
        __msfastcall    函数体      从右到左,优先使用寄存器(ECX,EDX),然后使用堆栈(兼容VC的__fastcall)

 

常见的函数调用约定中,只有cdecl约定需要调用者来清除堆栈; 
C/C++中的函数支持参数数目不定的参数列表,比如printf函数;由于函数体不知道调用者在堆栈中压入了多少参数, 
所以函数体不能方便的知道应该怎样清除堆栈,那么最好的办法就是把清除堆栈的责任交给调用者; 
这应该就是cdecl调用约定存在的原因吧;

VB一般使用的是stdcall调用约定;(ps:有更强的保证吗) 
Windows的API中,一般使用的是stdcall约定;(ps: 有更强的保证吗) 
建议在不同语言间的调用中(如DLL)最好采用stdcall调用约定,因为它在语言间兼容性支持最好;

三:函数返回值传递方式
   其实,返回值的传递从处理上也可以想象为函数调用的一个out形参数; 函数返回值传递方式也是函数调用约定的一部分;
   有返回值的函数返回时:一般int、指针等32bit数据值(包括32bit结构)通过eax传递,(bool,char通过al传递,short通过ax传递),特别的__int64等64bit结构(struct) 通过edx,eax两个寄存器来传递(同理:32bit整形在16bit环境中通过dx,ax传递); 其他大小的结构(struct)返回时把其地址通过eax返回;(所以返回值类型不是1,2,4,8byte时,效率可能比较差) 
   参数和返回值传递中,引用方式的类型可以看作与传递指针方式相同; 
   float/double(包括Delphi中的extended)都是通过浮点寄存器st(0)返回;


四:通过VC中的C++例子和产生出的汇编清单来对函数调用约定进行说明;

(ps:后面虽然列出了很多汇编,但是我做了很详细的注释,我希望那些对汇编感到“恐惧”的人 
也能顺利的阅读; 并为那些想在VC中使用汇编的人提供一些帮助

A: 
测试代码:


int x; 
int __cdecl add(int a,int b) { return a+b; }//使用__cdecl调用约定 
int main(int argc, char* argv[]) 

    x=add(1,2); 
    return 0; 
}

 

; Debug模式编译后得到的汇编代码


PUBLIC      ?x@@3HA                    ; x 
_BSS        SEGMENT 
?x@@3HA     DD        01H DUP (?)      ; x变量 
_BSS        ENDS 
PUBLIC      
?add@@YAHHH@Z              ; add 
PUBLIC      _main 
EXTRN       __chkesp:NEAR 
;           COMDAT       _main 
_TEXT       SEGMENT

_main       PROC NEAR                  ; COMDAT        //main函数体

  push    ebp         ; //保存ebp的值到堆栈,退出函数前用pop ebp恢复 
  mov     ebp, esp    ; //ebp指向当前堆栈; 函数中可以通过ebp来进行堆栈访问 
  sub     esp, 64     ; //在堆栈中开辟64byte局部空间

                      ; //说明:这三条汇编指令是很多函数体开始的惯用法; 
                      ; //用ebp指向堆栈(不会改变);并通过ebp来访问参数和局部变量;

  push    ebx         ; //一般按照函数间调用的约定,函数中可以自由使用eax,ecx,edx; 
  push    esi         ; //其它寄存器如果需要使用则需要保存,用完时恢复;也就是寄存器的使用约定; 这也使函数调用约定的一部分;
  push    edi         ; //即:在函数中调用了别的函数后,eax,ecx,edx很可能已经改变, 
                      ; //而其它寄存器(ebx,esi,edi,ebp)的值可以放心继续使用(esp除外)

  lea    edi, DWORD PTR [ebp-64] 
  mov    ecx, 16                 ; 00000010H 
  mov    eax, -858993460         ; ccccccccH 
  rep stosd                      ; //前面开辟的(16*4)byte局部空间全部填充0xCC 
                                 ; //注意: 0xCC是调试中断(__asm int 3)的指令码,所以可以想象,当 
                                 ; //程序错误的跳转到这个区域进行执行时将产生调试中断

  push   2                       ; //代码: x=add(1,2);  
  push   1                       ; //从右到左入栈  (__cdecl调用约定!!!) 
  call   
?add@@YAHHH@Z           ; 调用add函数;call指令将把下一条指令的地址(返回地址)压入堆栈 
  add    esp, 8                  ; add函数调用完以后,调用者负责清理堆栈 (__cdecl调用约定!!!) 
                                 ; 两个int型参数共使用了8byte空间的堆栈 
  mov    DWORD PTR 
?x@@3HA, eax  ; 将add函数的返回值存入x变量中,可以看出add函数的返回值放在eax中

  xor    eax, eax      ; //原代码:return 0;   执行eax清零,main函数的返回值0放在eax中

  pop    edi 
  pop    esi 
  pop    ebx           ; //恢复edi,esi,ebx寄存器 
  add    esp, 64       ; //恢复64byte局部空间 
  cmp    ebp, esp                
  call    __chkesp     ; //到这里时应该ebp==esp, Debug版进行确认,如果不等,抛出异常等 
  mov    esp, ebp 
  pop    ebp           ; //恢复ebp寄存器 
  ret    0 
_main     ENDP 
_TEXT     ENDS

;//下面是add函数的代码,就不用解释的像上面那么详细了


;        COMDAT  ?add@@YAHHH@Z 
_TEXT            SEGMENT 
_a$ = 8                                ;//参数a相对于堆栈偏移8 
_b$ = 12                               ;//参数b相对于堆栈偏移12

?add@@YAHHH@Z PROC NEAR                ; add, COMDAT        //add函数体

  push        ebp 
  mov         ebp, esp 
  sub         esp, 64                  ; 00000040H 
  push        ebx 
  push        esi 
  push        edi 
  lea         edi, DWORD PTR [ebp-64] 
  mov         ecx, 16                  ; 00000010H 
  mov         eax, -858993460          ; ccccccccH 
  rep stosd

  mov         eax, DWORD PTR _a$[ebp]  ;将参数a的值移动到eax 
  add         eax, DWORD PTR _b$[ebp]  ;将参数b的值累加到eax; 可以看出返回值通过eax返回

  pop         edi 
  pop         esi 
  pop         ebx 
  mov         esp, ebp 
  pop         ebp 
  ret         0                     ; 函数体不管堆栈的参数清理 (__cdecl调用约定!!!) 
                                    ; ret指令将取出call指令压入的返回地址,并跳转过去继续执行

?add@@YAHHH@Z ENDP                  ; add 
_TEXT        ENDS 
END

; 再来看一下Release模式编译后得到的汇编代码 
; 可以看出,这比Debug模式少了很多的汇编指令,速度当然可能更快了;不再做详细说明了,请对照上面的解释


PUBLIC        ?x@@3HA                   ; x 
_BSS          SEGMENT 
?x@@3HA       DD        01H DUP (?)     ; x 
_BSS          ENDS 
PUBLIC        
?add@@YAHHH@Z             ; add 
PUBLIC        _main 
;             COMDAT            _main 
_TEXT         SEGMENT

_main         PROC NEAR                 ; COMDAT        //main函数体

  push    2 
  push    1                       ; //从右到左入栈  (__cdecl调用约定!!!) 
  call    
?add@@YAHHH@Z           ; //调用add函数; 
  mov     DWORD PTR 
?x@@3HA, eax  ; x 
  add     esp, 8                  ; //调用者负责清理堆栈 (__cdecl调用约定!!!)

  xor     eax, eax 
  ret     0 
_main        ENDP 
_TEXT        ENDS

;            COMDAT   ?add@@YAHHH@Z 
_TEXT        SEGMENT 
_a$ = 8 
_b$ = 12

?add@@YAHHH@Z PROC NEAR            ; add, COMDAT        //add函数体

  mov   eax, DWORD PTR _b$[esp-4]  ;将参数b的值移动到eax 
  mov   ecx, DWORD PTR _a$[esp-4]  ;将参数a的值移动到ecx 
  add   eax, ecx                   ;将ecx的值累加到eax; 返回值通过eax传递 
  ret   0                          ;函数体不管堆栈的参数清理 (__cdecl调用约定!!!) 
?add@@YAHHH@Z ENDP                 ; add 
_TEXT         ENDS 
END

 

下面的分析中将只给出Release模式编译后的汇编代码

B: 
声明add函数为__stdcall调用约定

int x; 
int __stdcall add(int a,int b) { return a+b; } 
int main(int argc, char* argv[]) 

    x=add(1,2); 
    return 0; 
}


;来看产生的汇编代码:

 

; //main函数体 
  push    2 
  push    1                        ; //从右到左入栈 
  call    
?add@@YGHHH@Z            ; add 
  mov     DWORD PTR 
?x@@3HA, eax   ; x 
  xor     eax, eax 
  ret     0

; //add函数体 
  mov     eax, DWORD PTR _b$[esp-4] 
  mov     ecx, DWORD PTR _a$[esp-4] 
  add     eax, ecx 
  ret     8                        ; //函数体负责清栈 ;两个int型参数共使用了8byte空间的堆栈


C: 
声明add函数为__fastcall调用约定

int x; 
int __fastcall add(int a,int b) { return a+b; } 
int main(int argc, char* argv[]) 

    x=add(1,2); 
    return 0; 
}

;来看产生的汇编代码:


; //main函数体 
  mov    edx, 2                    ; b通过寄存器edx传递 
  mov    ecx, 1                    ; a通过寄存器ecx传递 
  call   
?add@@YIHHH@Z             ; add 
  mov    DWORD PTR 
?x@@3HA, eax    ; x 
  xor    eax, eax 
  ret    0

; //add函数体 
  lea    eax, DWORD PTR [ecx+edx]  ; //a,b参数值已经在ecx,edx中,该句将这两个值的和放到eax作为返回值; 
  ret    0                         ; //这里应该函数体负责清栈 ;但因为两个参数已经通过寄存器传递 
                                   ; //了,没有使用堆栈,所以ret 0;


D: 
来看一下类的成员函数的调用:


struct T 

        int start0; 
        T():start0(1){} 
        int  add(int a,int b); //类成员函数;只要不明确声明调用约定则默认使用thiscall调用约定;
}; 
int  T::add(int a,int b) { return (*this).start0+a+b; }

int x; 
int main(int argc, char* argv[]) 

        T t; 
        x=t.add(1,2); 
        return 0; 
}


来看产生的汇编代码:


; //main函数体 
  push    ecx                         ; //保存ecx 
  push    2 
  push    1                           ; //参数从右到左入栈 
  lea     ecx, DWORD PTR _t$[esp+12]  ; //t的地址保存到ecx 
  mov     DWORD PTR _t$[esp+12], 1    ; //执行t::start0=1; 
  call    
?add@T@@QAEHHH@Z            ; //调用T::add函数,这时ecx中存放了t的的地址(this指针); 
  mov     DWORD PTR 
?x@@3HA, eax      ; x 
  xor     eax, eax 
  pop     ecx 
  ret     0

; //T::add函数体 
  mov     eax, DWORD PTR [ecx]        ; //通过this指针(保存在ecx)将start0的值移动到eax 
  mov     ecx, DWORD PTR _a$[esp-4]   ; //把a的值移动到ecx; this的值将丢失,但函数体中已经不需要了 
  add     eax, ecx                    ; //将a的值累加到eax 
  mov     ecx, DWORD PTR _b$[esp-4]   ; //把b的值移动到ecx; 
  add     eax, ecx                    ; //将b的值累加到eax 
  ret     8                           ; //函数体负责清栈 ;


五: 其他

1.在VC中实现一个函数体时可以使用__declspec(naked)声明,它告诉编译器,不要为函数体自动产生开始和结束码; 
2.在VC6中,想得到汇编代码清单,设置方法为:

引用:[Project]->[Setting...]->[C++]->[Category:]->[Listing Files]->[Listing file type:]->[Assembily ,...]

3.VC6中嵌入汇编代码的方式为:

            __asm { <汇编语句s> } 
         或 __asm <一条汇编语句>

4.VC6中重新设定函数使用的默认调用约定的方法是: 
引用:
在[Project]->[Setting...]->[C++]->[Project Options:]中增加编译设置 
比如:/Gd 代表__cdecl; /Gr 代表__fastcall; /Gz 代表__stdcall

转自:http://blog.csdn.net/housisong/article/details/504970



当高级语言函数被编译成机器码时,有一个问题就必须解决:因为CPU没有办法知道一个函数调用需要多少个、什么样的参数。即计算机不知道怎么给这个函数传递参数,传递参数的工作必须由函数调用者和函数本身来协调。为此,计算机提供了一种被称为栈的数据结构来支持参数传递。

   函数调用时,调用者依次把参数压栈,然后调用函数,函数被调用以后,在堆栈中取得数据,并进行计算。函数计算结束以后,或者调用者、或者函数本身修改堆栈,使堆栈恢复原装。在参数传递中,有两个很重要的问题必须得到明确说明:

												   1) 当参数个数多于一个时,按照什么顺序把参数压入堆栈;

  2) 函数调用后,由谁来把堆栈恢复原装。

  3)函数的返回值放在什么地方
														

在高级语言中,通过函数调用规范(Calling Conventions)来说明这两个问题。常见的调用规范有:

																stdcall
																cdecl

																fastcall

																thiscall

																naked call
														

stdcall调用规范

stdcall很多时候被称为pascal调用规范,因为pascal是早期很常见的一种教学用计算机程序设计语言,其语法严谨,使用的函数调用约定是stdcall。在Microsoft C++系列的C/C++编译器中,常常用PASCAL宏来声明这个调用约定,类似的宏还有WINAPI和CALLBACK。

stdcall调用规范声明的语法为:

																
																		int __stdcall function(int a,int b)
														
stdcall的调用约定意味着:
																  1)参数从右向左压入堆栈;

  2)函数自身修改堆栈;

  3) 函数名自动加前导的下划线,后面紧跟一个@符号,其后紧跟着参数的尺寸。
														
以上述这个函数为例,参数b首先被压栈,然后是参数a,函数调用function(1,2)调用处翻译成汇编语言将变成:
														 push 2          第二个参数入栈

 push 1          第一个参数入栈

 call function   调用参数,注意此时自动把cs:eip入栈
														
而对于函数自身,则可以翻译为:
														  push  ebp               保存ebp寄存器,该寄存器将用来保存堆栈的栈顶指针,可以在函数退出时恢复

  mov   ebp,esp           保存堆栈指针

  mov   eax,[ebp + 8H]    堆栈中ebp指向位置之前依次保存有ebp,cs:eip,a,b,ebp +8指向a

  add   eax,[ebp + 0CH]   堆栈中ebp + 12处保存了b

  mov   esp,ebp           恢复esp

  pop   ebp

  ret   8
														

而在编译时,这个函数的名字被翻译成_function@8

注意不同编译器会插入自己的汇编代码以提供编译的通用性,但是大体代码如此。其中在函数开始处保留esp到ebp中,在函数结束恢复是编译器常用的方法。

从函数调用看,2和1依次被push进堆栈,而在函数中又通过相对于ebp(即刚进函数时的堆栈指针)的偏移量存取参数。函数结束后,ret 8表示清理8个字节的堆栈,函数自己恢复了堆栈。

 

cdecl调用规范

cdecl调用约定又称为C调用约定,是C语言缺省的调用约定,它的定义语法是:

													          int function (int a ,int b)           // 不加修饰就是C调用约定

  int __cdecl function(int a,int b)     // 明确指出C调用约定
														

  cdecl调用约定的参数压栈顺序是和stdcall是一样的,参数首先由有向左压入堆栈。所不同的是,函数本身不清理堆栈,调用者负责清理堆栈。由于这种变化,C调用约定允许函数的参数的个数是不固定的,这也是C语言的一大特色。对于前面的function函数,使用cdecl后的汇编码变成:

														调用处

  push   1

  push   2

  call   function

  add    esp,8              注意:这里调用者在恢复堆栈

  被调用函数_function处

  push   ebp                保存ebp寄存器,该寄存器将用来保存堆栈的栈顶指针,可以在函数退出时恢复

  mov    ebp,esp            保存堆栈指针

  mov    eax,[ebp + 8H]     堆栈中ebp指向位置之前依次保存有ebp,cs:eip,a,b,ebp +8指向a

  add    eax,[ebp + 0CH]    堆栈中ebp + 12处保存了b

  mov    esp,ebp            恢复esp

  pop    ebp

  ret                       注意,这里没有修改堆栈
														

MSDN中说,该修饰自动在函数名前加前导的下划线,因此函数名在符号表中被记录为_function。 

由于参数按照从右向左顺序压栈,因此最开始的参数在最接近栈顶的位置,因此当采用不定个数参数时,第一个参数在栈中的位置肯定能知道,只要不定的参数个数能够根据第一个后者后续的明确的参数确定下来,就可以使用不定参数,例如对于sprintf函数,定义为:

 

																
														int sprintf(char* buffer,constchar* format,...)
														
由于所有的不定参数都可以通过format确定,因此使用不定个数的参数是没有问题的。

 

fastcall调用规范

fastcall调用约定和stdcall类似,它意味着:
												   1) 函数的第一个和第二个DWORD参数(或者尺寸更小的)通过ecx和edx传递,其他参数通过从右向左的顺序压栈;

  2) 被调用函数清理堆栈;

  3) 函数名修改规则同stdcall。
														
其声明语法为:int __fastcall function(int a,int b)

 

thiscall调用规范

thiscall是唯一一个不能明确指明的函数修饰,因为thiscall不是关键字。它是C++类成员函数缺省的调用约定。由于成员函数调用还有一个this指针,因此必须特殊处理,thiscall意味着:

												   1) 参数从右向左入栈;

  2) 如果参数个数确定,this指针通过ecx传递给被调用者;如果参数个数不确定,this指针在所有参数压栈后被压入堆栈;

  3) 对参数个数不定的,调用者清理堆栈,否则函数自己清理堆栈。
														
为了说明这个调用约定,定义如下类和使用代码:
																
														class A

{

public:

        int function1(int a,int b);

        int function2(int a,...);

};

int A::function1 (int a,int b)

{

        return a+b;

}

int A::function2(int a,...)

{

        va_list ap;

        va_start(ap,a);

        int i;

        int result = 0;

        for(i = 0 ; i < a ; i ++)

        {

                result += va_arg(ap,int);

        }

        return result;

}

void callee()

{

        A a;

        a.function1(1,2);

        a.function2(3,1,2,3);

}
														
callee函数被翻译成汇编后就变成:
																  // 函数function1调用

  0401C1D    push        2

  00401C1F   push        1

  00401C21   lea         ecx,[ebp-8]

  00401C24   call   function1             注意,这里this没有被入栈

  // 函数function2调用

  00401C29   push        3

  00401C2B   push        2

  00401C2D   push        1

  00401C2F   push        3

  00401C31   lea         eax,[ebp-8]      这里引入this指针

  00401C34   push        eax

  00401C35   call   function2

  00401C3A   add         esp,14h


														
可见,对于参数个数固定情况下,它类似于stdcall,不定时则类似cdecl

 

naked call调用规范

这是一个很少见的调用约定,一般程序设计者建议不要使用。编译器不会给这种函数增加初始化和清理代码,更特殊的是,不能用return返回返回值,只能用插入汇编返回结果。这一般用于实模式驱动程序设计,假设定义一个求和的加法程序,可以定义为:
														__declspec(naked) int  add(int a,int b)

   {

       __asm mov eax,a

       __asm add eax,b

       __asm ret

   }
														
注意,这个函数没有显式的return返回值,返回通过修改eax寄存器实现,而且连退出函数的ret指令都必须显式插入。上面代码被翻译成汇编以后变成:
   mov    eax,[ebp+8]

   add    eax,[ebp+12]

   ret    8
注意这个修饰是和__stdcall及cdecl结合使用的,前面是它和cdecl结合使用的代码,对于和stdcall结合的代码,则变成:
														 __declspec(naked) int __stdcall function(int a,int b)

   {

       __asm mov eax,a

       __asm add eax,b

       __asm ret 8//注意后面的8

   }
														
至于这种函数被调用,则和普通的cdecl及stdcall调用函数一致。

 

函数调用约定导致的常见问题

如果定义的约定和使用的约定不一致,则将导致堆栈被破坏,导致严重问题,下面是两种常见的问题:
												 1) 函数原型声明和函数体定义不一致

2) DLL导入函数时声明了不同的函数约定
转自: http://www.cppblog.com/oosky/archive/2007/01/08/17422.html

你可能感兴趣的:(调用约定(pascal,fastcall,stdcall,thiscall,cdecl)区别等)