深度理解extern "C"
1. 引言
C++语言的创建初衷是“a better C”,但是这并不意味着C++中类似C语言的全局变量和函数所采用的编译和连接方式与C语言完全相同。作为一种欲与C兼容的语言,C++保留部分面向过程的语言的特点(被世人称为“不彻底地面向对象”)。但是,C++毕竟是一种面向对象的程序设计语言,为了支持函数的重载,C++对全局函数和变量的处理方式与C有明显的不同。
2. 从标准头文件说起
某企业曾经给出如下一道面试题:为什么标准头文件中都有类似以下的结构?
#ifndef __INC_XXX_H__
#define __INC_XXX_H__
#ifdef __cplusplus
extern "C" {
#endif /* __cplusplus */
/*...*/
#ifdef __cplusplus
}
#endif /* __cplusplus */
#endif /* __INC_XXX_H__*/
显然,该文件中的条件编译宏“#ifndef __INC_XXX_H__、#define __INC_XXX_H__、#endif”的作用是防止该头文件被重复包含,否则编译时会发生相关宏被重复定义的编译错误。那么以下语句的作用又是什么呢?
#ifdef __cplusplus
extern "C" {
#endif
/*...*/
#ifdef __cplusplus
}
#endif
3. 背景介绍
(1)在.cpp文件中调用在.c文件中实现的函数的时候,需要用extern "C"声明该函数,否则.cpp会按名字改编后的函数名去找该函数而发生连接错误。现在假设.c文件中有一函数:
void Transfer(int a; char b);
那么,.cpp文件中必须用extern "C"声明该函数后才可以实现调用:
extern "C" void Transfer(int a; char b);
(2)在.cpp文件中实现的函数,.c文件若要调用,就必须在.cpp文件中用extern "C"来声明该函数,否则.cpp在编译时就会对其进行名字改编,.c文件就找不到该函数的原型。假设.cpp文件中有一函数:
void Transfer(int a; char b);
但必须用extern "C"来声明如下:
extern "C" void Transfer(int a; char b);
.c文件才可以调用void Transfer(int a; char b)函数。
总结:extern "C"目的就是:实现C++与C的混合编程。大体上,你可以把extern和include的区别当做是“零售”与“批发”的区别。extern则是零售,而include是批发。
4. extern "C"深度理解
其实,对于extern "C"的理解,我们可以“望文生义”地从字面出发,从而得到两层含义:首先,被它修饰的目标是“extern”的;其次,被它修饰的目标是"C"的。让我们来详细解读这两重含义。
(1)被extern "C"修饰的函数或变量是extern类型的:
extern是C/C++语言中表明函数和全局变量作用范围(可见性)的关键字,该关键字告诉编译器,其声明的函数和变量可以在本模块或其它模块中使用。记住,下列语句:
extern int a;
仅仅是一个变量的声明,并不是在定义变量a,并未为a分配内存空间。变量a在所有模块中作为一种全局变量只能被定义一次,否则会出现连接错误。
通常,在模块(一个模块包含两个文件:一个.c/.cpp文件和与其对应的一个.h文件)的头文件中对本模块所要提供给其它模块引用的函数和全局变量以关键字extern声明。例如,如果模块B欲引用模块A中定义的全局变量和函数时只需包含模块A的头文件即可。这样,模块B中调用模块A中的函数时,在编译阶段,模块B虽然找不到该函数,但是并不会报错,会在连接阶段从模块A的目标代码中找到此函数。与extern相对的关键字是static,被static修饰的全局变量和函数只能在本模块中使用。因此,一个函数或变量只可能被本模块使用时,不可被extern或者extern "C"修饰,并且,最好加上static修饰以实现该对象的隐藏。
(2)被extern "C"修饰的变量和函数是按照C语言方式编译和连接的:
首先看看C++中对函数是怎样编译的。作为一种面向对象的语言,C++支持函数重载,而过程式语言C则不支持。函数被C++编译器编译后在符号库中的名字与C语言的不同。例如,假设某个函数的原型为:
void foo(int x, int y);
该函数被C编译器编译后在符号库中的名字为_foo,而C++编译器则会产生像_foo_int_int之类的名字(不同的编译器可能生成的名字不同,但是都采用了相同的机制:生成的新名字包含了函数名、参数数量和参数类型等信息)。C++就是以这种机制来实现函数重载的。例如,在C++中,函数void foo(int x, int y)与void foo(int x, float y)编译生成的符号是不相同的,后者为_foo_int_float。
★未加extern "C"声明时的连接方式:
假设在C++中,模块A的头文件如下:
//模块A头文件:moduleA.h
#ifndef MODULE_A_H
#define MODULE_A_H
int foo(int x, int y);
#endif
在模块B中引用该函数:
//模块B源文件:moduleB.cpp
#include "moduleA.h"
foo(2,3);
实际上,在连接阶段,连接器会从模块A生成的目标文件moduleA.obj中寻找_foo_int_int这样的符号
★加extern "C"声明后的连接方式:
加extern "C"声明后,模块A的头文件变为:
//模块A头文件:moduleA.h
#ifndef MODULE_A_H
#define MODULE_A_H
extern "C" int foo( int x, int y );
#endif
在模块B的源文件中仍然调用foo(2,3),其结果是:模块A编译生成foo()的目标代码时,没有对其名字进行特殊处理,采用了C语言的方式,foo()函数的生成符号名为_foo;连接器在为模块B的目标代码寻找foo(2,3)调用时,寻找的也正是符号名_foo。因此,我们可以知道,extern "C"并不等价于extern,比如如果在模块A中函数声明了foo为extern "C"类型,而模块B中包含的是extern int foo(int x, int y),则模块B将找不到模块A中的函数;反之亦然。
所以,可以用一句话概括extern "C"这个声明的真实目的(任何语言中的任何语法特性的诞生都不是随意而为的,来源于真实世界的需求驱动。我们在思考问题时,不能只停留在这个语言是怎么做的,还要问一问它为什么要这么做,动机是什么,这样我们可以更深入地理解许多问题):实现C++与C的混合编程。
与此类似,还有extern "FORTRAN",等等。简言之,extern "XXX" YYY或extern "XXX" { YYY }的作用就是告诉编译器:YYY的实现部分按照XXX语言的编译规则进行编译。
5. extern "C"的习惯用法
明白了C++中extern "C"的设立动机,我们下面来具体分析extern "C"通常的使用技巧。
(1)在C++中引用C语言中的函数和变量时,在包含C语言头文件(假设为cExample.h)时,需进行下列处理:
extern "C" {
#include "cExample.h"
}
注意:C语言不支持extern "C"声明,在.c文件中包含了extern "C"时会出现编译语法错误。
笔者编写的C++引用C函数例子工程中包含的三个文件的源代码如下:
//C头文件:cExample.h
#ifndef C_EXAMPLE_H
#define C_EXAMPLE_H
extern int add(int x,int y);
#endif
//C源文件:cExample.c
#include "cExample.h"
int add(int x, int y) {
return x + y;
}
//C++源文件,调用add:cppFile.cpp
extern "C" {
#include "cExample.h"
}
int main(int argc, char* argv[])
{
add(2,3);
return 0;
}
如果C++调用一个C语言编写的.DLL时,当包括.DLL的头文件或声明接口函数时,应该加extern "C" { }。另外,本例其实也可以这样实现:
//C头文件:cExample.h
#ifndef C_EXAMPLE_H
#define C_EXAMPLE_H
#ifdef __cplusplus
extern "C" {
#endif /* __cplusplus */
int add(int x,int y);
#ifdef __cplusplus
}
#endif /* __cplusplus */
#endif /* C_EXAMPLE_H */
//C源文件:cExample.c
#include "cExample.h"
int add(int x, int y) {
return x + y;
}
//C++源文件,调用add:cppFile.cpp
#include "cExample.h"
int main(int argc, char* argv[])
{
add(2,3);
return 0;
}
此段代码与上面的功能完全一样,但是却比上面的代码更好,移植性更高。因为这里的cExample.h文件既可以被.c文件也可以被.cpp文件调用。而上一段代码中的cExample.h不具有此性质,或者说调用者需要做更多工作。
另外,MSDN中关于__cplusplus的描述是“__cplusplus:Defined for C++ programs only”,当编译器识别出当前编译文件为.cpp文件时会默认定义了宏__cplusplus。
(2)在C中引用C++语言中的函数和变量时,C++的头文件需添加extern "C",但是在C语言中不能直接引用声明了extern "C"的该头文件,应该在.c文件中将C++中定义的extern "C"函数声明为extern类型。
笔者编写的C引用C++函数例子工程中包含的三个文件的源代码如下:
//C++头文件:cppExample.h
#ifndef CPP_EXAMPLE_H
#define CPP_EXAMPLE_H
extern "C" int add(int x, int y);
#endif
//C++源文件:cppExample.cpp
#include "cppExample.h"
int add(int x, int y) {
return x + y;
}
//C源文件:cFile.c(这样会编译出错)
#include "cExample.h"
int main( int argc, char* argv[] )
{
add(2,3);
return 0;
}
//C源文件:cFile.c(这样会编译正确)
extern int add(int x, int y);
int main( int argc, char* argv[] )
{
add(2,3);
return 0;
}
如果深入理解了第4节中所阐述的extern "C"在编译和连接阶段发挥的作用,就能真正理解本节所阐述的从C++引用C函数和从C引用C++函数的惯用法。