extern c详解(上)

文章修改自:http://wenku.baidu.com/view/8872c444b307e87101f69650.html
引言
在用C++的项目源码中,经常会不可避免的会看到下面的代码:
#ifdef __cplusplus 
extern "C" { 
#endif 
/*...*/
#ifdef __cplusplus 
#endif
它到底有什么用呢,你知道吗?而且这样的问题经常会出现在面试or笔试中。下面我就从以下几个方面来介绍它:
一、#ifdef _cplusplus/#endif _cplusplus及发散
在介绍extern "C"之前,我们来看下 #ifdef _cplusplus/#endif _cplusplus 的作用。很明显 #ifdef/#endif、#ifndef/#endif 用于条件编译, #ifdef _cplusplus/#endif _cplusplus ——表示如果定义了宏_cplusplus,就执行#ifdef/#endif之间的语句,否则就不执行。
在这里为什么需要#ifdef _cplusplus/#endif _cplusplus呢?因为C语言中不支持extern "C"声明,如果你明白extern "C"的作用就知道在C中也没有必要这样做,这就是条件编译的作用!在.c文件中包含了extern "C"时会出现编译时错误。
既然说到了条件编译,我就介绍它的一个重要应用——避免重复包含头文件。下面是一个开源web服务器——Mongoose的头文件mongoose.h中的一段代码:
#ifndef MONGOOSE_HEADER_INCLUDED 
#define    MONGOOSE_HEADER_INCLUDED    
       #ifdef __cplusplus 
extern "C"  { 
#endif /* __cplusplus */ 
  
/*................................. 
 * do something here 
 *................................. 
 */
  
#ifdef __cplusplus 
#endif /* __cplusplus */   
#endif /* MONGOOSE_HEADER_INCLUDED */
这个头文件mongoose.h可能在项目中被多个源文件包含(#include "mongoose.h"),而对于一个大型项目来说,这些冗余可能导致错误,因为一个头文件包含类定义或inline函数,在一个源文件中mongoose.h可能会被#include两次(如,a.h头文件包含了mongoose.h,而在b.c文件中#include a.h和mongoose.h)——这就会出错(在同一个源文件中一个结构体、类等被定义了两次)。 从逻辑观点和减少编译时间上,都要求去除这些冗余。然而让程序员去分析和去掉这些冗余,不仅枯燥且不太实际,最重要的是有时候又需要这种冗余来保证各个模块的独立。 
为了解决这个问题,上面代码中的
#ifndef MONGOOSE_HEADER_INCLUDED 
#define    MONGOOSE_HEADER_INCLUDED 
/*……………………………*/ 
#endif /* MONGOOSE_HEADER_INCLUDED */
就起作用了。如果定义了MONGOOSE_HEADER_INCLUDED,#ifndef/#endif之间的内容就被忽略掉。因此,编译时第一次看到mongoose.h头文件,它的内容会被读取且给定MONGOOSE_HEADER_INCLUDED一个值。之后再次看到mongoose.h头文件时,MONGOOSE_HEADER_INCLUDED就已经定义了,mongoose.h的内容就不会再次被读取了。
二、extern "C"
首先从字面上分析extern "C",它由两部分组成——extern关键字、"C"。下面我就从这两个方面来解读extern "C"的含义。
2.1、extern关键字
在一个项目中必须保证函数、变量、枚举等在所有的源文件中保持一致,除非你指定定义为局部的。首先来一个例子:
file1.c文件 
    int x=1; 
    int f(){do something here} 
file2.c文件 
    extern int x; 
    int f(); 
    void g(){x=f();}
在file2.c中g()使用的x和f()是定义在file1.c中的。extern关键字表明file2.c中x,仅仅是一个变量的声明,其并不是在定义变量x,并未为x分配内存空间。变量x在所有模块中作为一种全局变量只能被定义一次,否则会出现连接错误。但是可以声明多次,且声明必须保证类型一致,如
file1.c文件 
     int x=1; 
    int b=1; 
    extern c; 
file2.c文件
    int x;// x equals to default of int type 0 
    int f(); 
    extern double b; 
    extern int c;
在这段代码中存在着这样的三个错误
x被定义了两次 
b两次被声明为不同的类型 
c被声明了两次,但却没有定义 
在C/C++语言中, extern关键字 告诉编译器 在所有的模块中(不仅仅是本地模块)查找该函数和全局变量的定义。 通常, 在模块的头文件中,对于本模块提供给其它模块引用的函数和全局变量应以关键字extern声明 。例如,如果模块B欲引用该模块A中定义的全局变量和函数时只需包含模块A的头文件即可。这样,模块B中调用模块A中的函数时,在编译阶段,模块B虽然找不到该函数,但是并不会报错;在连接阶段,连接器会在所有模块找查找该函数的定义,这里它将在模块A中找到了该函数的定义。
与extern对应的关键字是 static,被它修饰的全局变量和函数只能在本模块中使用。因此,一个函数或变量只可能被本模块使用时,其不可能被extern “C”修饰。
2.2、"C"
一个C++程序包含其它语言编写的部分代码,同理,C++编写的代码片段可能被使用在其它语言编写的代码中。不同语言编写的代码互相调用是困难的,即使是同一种编写的代码但不同的编译器编译的代码。例如,不同语言和同种语言的不同实现可能会在注册变量保持参数和参数在栈上的布局,这个方面不一样。
为了使它们遵守统一规则,可以使用extern指定一个编译和连接规约。例如,声明C和C++标准库函数strcyp(),并指定它应该根据C的编译和连接规约来链接:
extern "C"  char* strcpy(char*,const char*);
注意它与下面的声明的不同之处:
extern  char* strcpy(char*,const char*);
下面的这个声明仅表示在连接的时候调用strcpy()。
extern "C"指令中的C,表示的一种编译和连接规约,而不是一种语言。C表示符合C语言的编译和连接规约的任何语言,如Fortran、assembler等。extern "C"指令仅指定编译和连接规约,但不影响语义例如在函数声明中,指定了extern "C",仍然要遵守C++的类型检测、参数转换规则。
再看下面的一个例子,为了声明一个变量而不是定义一个变量,你必须在声明时指定extern关键字,但是当你又加上了"C",它不会改变语义,但是会改变它的编译和连接方式。
如果你有很多语言要加上extern "C",你可以将它们放到extern "C"{ }中。
2.3、小结extern "C"
通过上面两节的分析,我们知道extern "C"的真实目的是实现类C和C++的混合编程。在C++源文件中的语句前面加上extern "C",表明它按照类C的编译和连接规约来编译和连接,而不是C++的编译的连接规约。这样在 类C 的代码中就可以调用C++的函数or变量等。( 我在这里所说的类C,代表的是跟C语言的编译和连接方式一致的所有语言

你可能感兴趣的:(extern c详解(上))