程序环境和预处理---C语言

目录

  • 1.程序环境
    • 1.1程序的翻译环境
      • 1.1.2 编译阶段
        • 1.1.2.1 预编译(或预处理)
        • 1.1.2.2 编译
        • 1.1.2.3 汇编
        • 1.1.2.4 链接
    • 1.2程序的执行环境
  • 2.预处理详解
    • 2.1预定义符号
    • 2.2 #define
      • 2.2.1 #define定义标识符
      • 2.2.2 #define定义宏
        • 2.2.2.1 offsetof宏的实现
      • 2.2.3 #define替换规则
      • 2.2.4 #和##
        • 2.2.4.1#的应用
        • 2.2.4.2##的应用
      • 2.2.5 宏参数的副作用
      • 2.2.6 宏和函数
        • 2.2.6 .1宏和函数对比
      • 2.2.7命名约定
    • 2.3 #undef
    • 2.4 命令行定义
    • 2.5 条件编译
    • 2.6文件包含
      • 2.6.1头文件被包含的方式
      • 2.6.2嵌套文件包含

程序环境和预处理---C语言_第1张图片

1.程序环境

在ANSI C的任何一种实现中,存在两个不同的环境。

1.1程序的翻译环境

第1种是翻译环境,在这个环境中源代码被转换为可执行的机器指令
程序环境和预处理---C语言_第2张图片
源文件:各种 .c文件;编译器:cl.exe文件;目标文件:.obj文件;链接器:link.exe;链接库:各种库函数 和自定义函数;最后生成可执行程序.exe文件。

  • 组成一个程序的每个源文件通过编译过程分别转换成目标代码(object code)。
  • 每个目标文件由链接器(linker)捆绑在一起,形成一个单一而完整的可执行程序。
  • 链接器同时也会引入标准C函数库中任何被该程序所用到的函数,而且它可以搜索程序员个人的程序库,将其需要的函数也链接到程序中。

1.1.2 编译阶段

1.1.2.1 预编译(或预处理)

预处理(-E)
预处理就是对源程序中的伪指令(以#开头的指令)和特殊符号进行处理的过程。
伪指令包含宏定义指令,条件编译指令和头文件包含指令。gcc对C源文件进行预处理后会输出.i文件。
主要处理规则如下:
(1)将所有#define删除,并且展开所有的宏定义;
(2)处理所有条件编译指令。如#if、#ifdef等;
(3)处理#include预编译指令,将被包含的文件插入该预编译指令的位置;
(4)删除所有的注释;
(5))添加行号和文件标识,以便于编译时编译器产生调试用的行号信息及编译时产生编译错误或警告时能够显示行号信息;
(6)保留所有的#pragma编译器指令,因为编译器需要使用它们。

1.1.2.2 编译

编译(-S)
编译就是把预处理完的文件进行一系列词法分析、语法分析、语义分析及优化后生成相应的汇编代码。使用gcc进行编译时,默认情况下,不输出该文件,生成的汇编文件是.s文件
包括:词法分析、语法分析、语义分析和符号汇总。

1.1.2.3 汇编

汇编(-c)
汇编就是将汇编代码转变为机器可以执行的二进制代码,每一个汇编语句几乎都对应一条机器指令。汇编相对于编译过程比较简单,根据汇编指令和机器指令的对照表——翻译即可。

1.1.2.4 链接

在成功汇编之后,就进入链接阶段。链接主要是为了解决多个文件之间符号引用的问题。编译时编译器只对单个文件进行处理,如果该文件里面需要引用到其他文件中的符号,那么这时在这个文件中该符号的地址是没法确定的,只能等链接器把所有的目标文件链接到一起,才能确定最终的地址,最终生成可执行文件

1.2程序的执行环境

第2种是执行环境,它用于实际执行代码
程序执行的过程:

  1. 程序必须载入内存中。在有操作系统的环境中:一般这个由操作系统完成。在独立的环境中,程序的载入必须由手工安排,也可能是通过可执行代码置入只读内存来完成。
  2. 程序的执行便开始。接着便调用main函数。
  3. 开始执行程序代码。这个时候程序将使用一个运行时堆栈(stack),存储函数的局部变量和返回地址。程序同时也可以使用静态(static)内存,存储于静态内存中的变量在程序的整个执行过程一直保留他们的值。
  4. 终止程序。正常终止main函数;也有可能是意外终止。

2.预处理详解

2.1预定义符号

__FILE__      //进行编译的源文件
__LINE__     //文件当前的行号
__DATE__    //文件被编译的日期
__TIME__    //文件被编译的时间
__STDC__    //如果编译器遵循ANSI C,其值为1,否则未定义

上述预定义符号都是语言内置的。
可以用于记录日志:

#include
#include
int main()
{
	FILE* pf = fopen("test.txt", "w");
	if (pf == NULL)
	{
		perror("fopen");
		return EXIT_FAILURE;//失败返回
	}

	fprintf(pf, "file:%s line:%d date:%s time:%s\n", __FILE__, __LINE__, __DATE__, __TIME__);
	//将文件、位置(行数)、日期、时间记录到文件
	
	fclose(pf);
	pf = NULL;
	return 0;
}

程序环境和预处理---C语言_第3张图片

2.2 #define

2.2.1 #define定义标识符

语法:
#define name stuff
注意:末尾无分号

#define MAX 1000
#define STR "Hello world!"
#define print printf("HaHaHa!\n")
int main()
{
	printf("%d\n", MAX);
	printf("%s\n", STR);
	print;

	printf("file:%s line:%d date:%s time:%s\n",\
		__FILE__, \
		__LINE__, \
		__DATE__, \
		__TIME__);
		//‘\’续行符,用于长语句的分段(除了最后一行外,每行的后面都加一个反斜杠)
	return 0;
}

程序环境和预处理---C语言_第4张图片

2.2.2 #define定义宏

#define 机制包括了一个规定,允许把参数替换到文本中,这种实现通常称为宏(macro)或定义宏(define macro)。
宏的申明方式:

#define name( parament-list ) stuff
其中的 parament-list 是一个由逗号隔开的符号表,它们可能出现在stuff中。

注意:

参数列表的左括号必须与name紧邻
如果两者之间有任何空白存在,参数列表就会被解释为stuff的一部分。

#define SQUARE(x) ((x)*(x))
//注意要加上括号,以防出现次序问题
//例如:对于SQUARE(5+1),他是将5+1不进行计算直接替换,即((5+1)*(5+1)),如果无括号,就会出现5+1*5+1=11

提示
所以用于对数值表达式进行求值的宏定义都应该用这种方式加上括号,避免在使用宏时由于参数中的操作符或邻近操作符之间不可预料的相互作用。

2.2.2.1 offsetof宏的实现
#define OFFSETOF(type,mem) (size_t)&(((type*)0)->mem)
//可用于求偏移量

2.2.3 #define替换规则

在程序中扩展#define定义符号和宏时,需要涉及几个步骤。

  1. 在调用宏时,首先对参数进行检查,看看是否包含任何由#define定义的符号。如果是,它们首先被替换
  2. 替换文本随后被插入到程序中原来文本的位置。对于宏,参数名被他们的值所替换。
  3. 最后,再次对结果文件进行扫描,看看它是否包含任何由#define定义的符号。如果是,就重复上述处理过程。

注意:
4. 宏参数和#define 定义中可以出现其他#define定义的符号。但是对于宏,不能出现递归
5. 当预处理器搜索#define定义的符号的时候,字符串常量的内容并不被搜索(即对于字符串中所包含的#define定义的符号,不进行替换)。

2.2.4 #和##

2.2.4.1#的应用

如何把参数插入到字符串中?

//将N参数插入到字符串中
#define PRINT1(N) printf("the value of "#N" is %d.\n", N)
#define PRINT2(N,FORMAT) printf("the value of "#N" is "#FORMAT"\n", N)
//PRINT2各种类型皆可以使用
int main()
{
	int a = 10;
	printf("the value of a is %d.\n", a);
	float b = 99;
	printf("the value of b is %lf.\n", b);

	//对于上述如果想借用宏可以是实现简化
	printf("*********************\n");
	PRINT1(a);
	PRINT2(b,"%lf");

	return 0;
}

程序环境和预处理---C语言_第5张图片

2.2.4.2##的应用

##可以把位于它两边的符号合成一个符号。
它允许宏定义从分离的文本片段创建标识符。

#define PRINT(STU,NUM) STU##NUM
 
int main()
{
	int Class106 = 100;
	printf("%d\n", PRINT(Class,106));
	
	return 0;
}

程序环境和预处理---C语言_第6张图片

2.2.5 宏参数的副作用

当宏参数在宏的定义中出现超过一次的时候,如果参数带有副作用,那么你在使用这个宏的时候就可能
出现危险,导致不可预测的后果。副作用就是表达式求值的时候出现的永久性效果。

//如下例
#define MAX(a, b) ( (a) > (b) ? (a) : (b) ) 
int main()
{
	int a = 5;//6 7
	int b = 4;//5
	int max = MAX(a++, b++);
	
	printf("max=%d a=%d b=%d\n", max,a,b);
	
	return 0;
}

程序环境和预处理---C语言_第7张图片

#define 定义的MAX进行替换,即max=( (a++) > (b++) ? (a++) : (b++) );
首先(a++) > (b++) :后++,先使用后加加,即5>4(a=6,b=5);之后执行(a++):max=a=6(a=7)。
故最后max=6,a=7,b=5。

2.2.6 宏和函数

上述求最大值也可以用函数实现,为什么使用宏呢?
宏的优点:

  1. 用于调用函数和从函数返回的代码可能比实际执行这个小型计算工作所需要的时间更多。
    所以宏比函数在程序的规模和速度方面更胜一筹
  2. 更为重要的是函数的参数必须声明为特定的类型。
    所以函数只能在类型合适的表达式上使用。反之这个宏怎可以适用于整形、长整型、浮点型等可以用于>来比较的类型。
    宏是类型无关的
    例如,宏可以实现动态内存开辟malloc函数的是实现:
#define MALLOC(type,num) (type*)malloc(sizeof(type)*(num))

当然宏也有其不足之处:

  1. 每次使用宏的时候,一份宏定义的代码将插入到程序中。除非宏比较短,否则可能大幅度增加程序的长度
  2. 宏是没法调试的
  3. 宏由于类型无关,也就不够严谨。
  4. 宏可能会带来运算符优先级的问题,导致程容易出现错。
2.2.6 .1宏和函数对比
属性 #define定义宏 函数
代码长度 每次使用时,宏代码都会被插入到程序中。除了非常小的宏之外,程序的长度会大幅度增长 函数代码只出现于一个地方;每次使用这个函数时,都调用那个地方的同一份代码
执行速度 更快 存在函数的调用和返回的额外开销,所以相对慢一些
操作符优先级 宏参数的求值是在所有周围表达式的上下文环境里,除非加上括号,否则邻近操作符的优先级可能会产生不可预料的后果,所以建议宏在书写的时候多些括号。 函数参数只在函数调用的时候求值一次,它的结果值传递给函数。表达式的求值结果更容易预测。
带有副作用的参数 参数可能被替换到宏体中的多个位置,所以带有副作用的参数求值可能会产生不可预料的结果。 函数参数只在传参的时候求值一次,结果更容易控制。
参数类型 宏的参数与类型无关,只要对参数的操作是合法的,它就可以使用于任何参数类型。 函数的参数是与类型有关的,如果参数的类型不同,就需要不同的函数,即使他们执行的任务是相同的。
调试 宏是不方便调试的 函数是可以逐语句调试的
递归 宏是不能递归的 函数是可以递归的

2.2.7命名约定

一般来讲函数的宏的使用语法很相似。
所以语言本身没法帮我们区分二者。
那我们平时的一个习惯是:

宏名全部大写
函数名不要全部大写

2.3 #undef

这条指令用于移除一个宏定义

#undef NAME
如果现存的一个名字需要被重新定义,那么它的旧名字首先要被移除。

2.4 命令行定义

许多C 的编译器提供了一种能力,允许在命令行中定义符号。用于启动编译过程。
例如:当我们根据同一个源文件要编译出一个程序的不同版本的时候,这个特性有点用处。
(假定某个程序中声明了一个某个长度的数组,如果机器内存有限,我们需要一个很小的数组,但是另外一个机器内存大些,我们需要一个数组能够大些。)即数组长度可变。

int main()
{
    int array [ARRAY_SIZE];
    int i = 0;
    for(i = 0; i< ARRAY_SIZE; i ++)
   {
        array[i] = i;
   }
    for(i = 0; i< ARRAY_SIZE; i ++)
   {
        printf("%d " ,array[i]);
   }
    printf("\n" );
    return 0;
}
//再linux环境下可以
//gcc -D ARRATY_SIZE=10 programe.c

2.5 条件编译

在编译一个程序的时候我们如果要将一条语句(一组语句)编译或者放弃是很方便的。因为我们有条件编译指令。
常见的条件编译指令:

#if 常量表达式
//…
#endif

//常量表达式由预处理器求值(为真执行,否则不执行)。
如:
#define DEBUG 1
#if DEBUG
//…
#endif

2.多个分支的条件编译
#if 常量表达式
//…
#elif 常量表达式
//…
#else
//…
#endif

3.判断是否被定义
定义则执行:

  • #if defined(symbol)
  • #ifdef symbol
    未定义则执行:
  • #if !defined(symbol)
  • #ifndef symbol

4.嵌套指令

  • #if defined(OS_UNIX)
    #ifdef OPTION1
    unix_version_option1();
    #endif
    #ifdef OPTION2
    unix_version_option2();
    #endif
  • #elif defined(OS_MSDOS)
    #ifdef OPTION2
    msdos_version_option2();
    #endif
  • #endif
#define __DEBUG__
int main()
{
	int i = 0;
	int arr[10] = { 0 };
	for (i = 0; i < 10; i++)
	{
		arr[i] = i;
	#ifdef __DEBUG__
	//如果定义__DEBUG__,则执行打印,否则不执行
		printf("%d\n", arr[i]);//为了观察数组是否赋值成功。 
	#endif //__DEBUG__
		}
	return 0;
}

2.6文件包含

我们已经知道, #include 指令可以使另外一个文件被编译。就像它实际出现于 #include 指令的地方一样。

这种替换的方式很简单:
预处理器先删除这条指令,并用包含文件的内容替换。
这样一个源文件被包含10次,那就实际被编译10次。

2.6.1头文件被包含的方式

  • 本地文件包含

#include “filename”

查找策略:先在源文件所在目录下查找,如果该头文件未找到,编译器就像查找库函数头文件一样在标准位置查找头文件。
如果找不到就提示编译错误。

  • 库文件包含

#include

查找头文件直接去标准路径下去查找,如果找不到就提示编译错误。

这样是不是可以说,对于库文件也可以使用 “” 的形式包含?
可以,但是这样做查找的效率就低些,当然这样也不容易区分是库文件还是本地文件了。

2.6.2嵌套文件包含

在实际工程中,都是每个人负责一个文件,最后汇总 .那么就会出现一个文件里对某一个文件多次引用,造成文件重复,预处理将文件多次包含,减慢程序运行.
可用条件编译解决这个问题:

法一:第一次引用后,之后不会再引用
#ifndef TEST_H
#define TEST_H
//头文件的内容
#endif //TEST_H
法二:只引用一次
#pragma once

你可能感兴趣的:(C语言,c语言,visual,studio,windows)