C程序环境及预处理

C程序环境及预处理_第1张图片 ​​​​​文章目录

一、程序的翻译环境和执行环境

1.程序编译过程

2.编译内部原理

3.执行环境

 二、程序运行前的预处理

1.预定义符号归纳

2.define定义标识符

3.define定义宏

4.define替换规则

5.宏和函数的对比

三、头文件被包含的方式 

四、练习:写一个宏,可以将一个整数二进制位的奇偶位交换


  大家好,我是纪宁。

  在ANSI C的任何一种实现中,都存在两个不同的环境。第1种是翻译环境,在这个环境中源代码被转换为可执行的机器指令。第2种是执行环境,它用于实际执行代码。翻译环境中也有很多的内部原理,一起来学习吧。

一、程序的翻译环境和执行环境

1.程序编译过程

  C程序环境及预处理_第2张图片

  其中,源文件是文件名后缀为 .c 的文件,目标文件是文件后缀名为 .obj 的文件。

  组成一个程序的每个源文件通过编译过程分别转换成目标代码(object code)。每个目标文件由链接器(linker)捆绑在一起,形成一个单一而完整的可执行程序。链接器同时也会引入标准C函数库中任何被该程序所用到的函数,而且它可以搜索程序员个人的程序库,将其需要的函数也链接到程序中

2.编译内部原理

C程序环境及预处理_第3张图片

  在预处理阶段,系统会自动处理掉所有的预编译指令。 包括删去注释,将头文件包含,#define 定义符号和宏的替换等等

  而在编译阶段,系统会将C语言代码翻译成汇编指令,还有语法分析、词义分析、语义分析、符号汇总等

  在汇编阶段。系统将汇编指令翻译成二进制指令,并生成.o目标文件,形成符号表。

  最后在链接阶段合并段表,重定位和合成符号表(在链接阶段可发现函数是否正常定义

3.执行环境

  首先,程序必须载入内存中。在有操作系统的环境中:一般这个由操作系统完成。在独立的环境中,程序的载入必须由手工安排,也可能是通过可执行代码置入只读内存来完成。

  接下来就是程序的执行开始,调用main函数开始执行程序代码。这个时候程序将使用一个运行时堆栈(stack),存储函数的局部变量和返回地址。程序同时也可以使用静态(static)内存,存储于静态内存中的变量在程序的整个执行过程一直保留他们的值。

  最后就是终止程序。正常终止main函数,也有可能是意外终止。

C程序环境及预处理_第4张图片

 二、程序运行前的预处理

1.预定义符号归纳

  下面的这些符号都是C语言内置符号

__FILE__  进行编译的源文件
__LINE__  文件当前的行号
__DATE__  文件被编译的日期
__TIME__ 文件被编译的时间

程序中使用对应的符号在预处理阶段自动转化为对应的含义,测试代码如下

#include
int main() {
    printf("%d\n", __LINE__);
    printf("%s\n", __TIME__);
    printf("%s\n", __DATE__);
    printf("%s\n", __FILE__);
    return 0;
}

运行结果

C程序环境及预处理_第5张图片

  由于_LINE_在第四行,所以转化结果为4;时间和日期就是我测试代码的时间、日期;_FILE_则对应我源文件的路径。

2.define定义标识符

语法如下:

#define name stuff

  在预处理阶段,编译器会自动将代码中的 name 全部替换为 stuff 。但需注意在写#define定义标识符的时候,后面不能加 ;,预处理阶段编译器会将 ; 也当成要替换的内容。

3.define定义宏

  #define 机制包括了一个规定,允许把参数替换到文本中,这种实现通常称为宏(macro)或定义
宏(define macro)。下面是宏的申明方式:

#define name( parament-list ) stuff

  其中的 parament-list 是一个由逗号隔开的符号表,它们可能出现在stuff中。它的使用方法与函数类似,只不过将函数传参改成了直接替换。因为改成了直接替换,所以宏的参数尽量加括号修饰。其次,参数列表的左括号必须与name紧邻,因为如果两者之间有任何空白存在,参数列表就会被解释为stuff的一部分。

  宏的参数一般会被多次替换,所以不能使用那些带 ‘副作用’ 的参数,副作用即表达式求值中出现的永久性效果,如自加自减这些运算。

  例如,求一下如下代码的运算结果:

​#define MAX(a, b) ( (a) > (b) ? (a) : (b) )
...
x = 5;
y = 8;
z = MAX(x++, y++);
printf("x=%d y=%d z=%d\n", x, y, z);

  大部分人可能会理所当然的以为传过去的是x++和y++表达式的值,那么结构就应该是z的结果剧应该是8,x的结果应该是6,y的结果应该是9 ?可实际上并非如此:

C程序环境及预处理_第6张图片

  这就是参数带有副作用的影响 

4.define替换规则

在程序中扩展#define定义符号和宏时,需要涉及几个步骤。

1. 在调用宏时,首先对参数进行检查,看看是否包含任何由#define定义的符号。如果是,它们首先被替换。

2. 替换文本随后被插入到程序中原来文本的位置。对于宏,参数名被他们的值所替换。

3. 最后,再次对结果文件进行扫描,看看它是否包含任何由#define定义的符号。如果是,就重复上述处理过程。

还有几点需要注意

1. 宏参数和#define 定义中可以出现其他#define定义的符号。但是对于宏,不能出现递归

2. 当预处理器搜索#define定义的符号的时候,字符串常量的内容并不被搜索

5.宏和函数的对比

  在某些方面来讲,宏是非常有优势的。比如求两个数的最大值这样一个简单的工作,如果用函数来完成的话,可能会非常耗费时间,因为每次调用函数都要进行函数栈帧创建和销毁,而宏却不需要;函数传参必须是特定的类型,而宏的参数却可以在算数运算范围内传多种类型的参数。总结就是:在小型工程中,宏比函数在程序的规模和速度方面更胜一筹宏是类型无关的,且可以将类型当参数传过过去,这点是函数做不到的

  但宏也有以下缺点:

1. 每次使用宏的时候,一份宏定义的代码将插入到程序中。除非宏比较短,否则可能大幅度增加程序的长度。

2. 宏是没法调试的。

3. 宏由于类型无关,也就不够严谨。

4. 宏可能会带来运算符优先级的问题,导致程容易出现错。 

三、头文件被包含的方式 

  在C语言中,包含头文件有两种方法:" "包含和< >包含。

  "  "包含是编译器包含本地文件的方法,查找策略是先在源文件所在目录下查找,如果该头文件未找到,编译器就像查找库函数头文件一样在标准位置查找头文件,如果找不到就提示编译错误

  而< >包含的查找头文件是直接去标准路径下去查找,如果找不到就提示编译错误。 

  看了这种情况,有人可能会问:那以后能不能包含所有文件都用 " " 来包含,答案是可以的,但是如果考虑到程序的效率问题,就另当别论了,因为 " "去查标准路径的头文件是需要查找两次的,而<>查找标准路径的头文件只需要查找一次,效率明显高很多

  为了防止头文件被重复引用,头文件中都会有条件编译的内容来防止文件内容的重复

在每个头文件的开头写这几条语句

#ifndef __TEST_H__
#define __TEST_H__
//头文件的内容
#endif  //__TEST_H_

或者:

#pragma once

就可以避免头文件的重复引用。

这是一些常用的条件编译指令

#if
#elif
#endif

四、练习:写一个宏,可以将一个整数二进制位的奇偶位交换

  思路:将这个数的二进制位的奇数位取出,向左移动一位;将这个数的二进制位的偶数位取出,向右移动一位,最后相加即可。

C程序环境及预处理_第7张图片

  以8位二进制为例:&0x55可以得到它的奇数位,&0xaa可以得到它的偶数位,如果上升到32位二进制,那么&0x55555555可以得到它的奇数位,然后左移,&0xaaaaaaaa可以得到它的偶数位,然后右移,最后再相加即可将这个数的二进制位的奇偶位交换。

  如果看懂图解的话,写代码用宏实现就很简单了。

#include
#define SWAP(n)  (n=((n&0xaaaaaaaa)>>1)+((n&0x55555555)<<1))
int main()
{
	int n = -120;
	SWAP(n);//交换奇偶位
	printf("%d\n", n);
	SWAP(n);//再交换回来
	printf("%d\n", n);
	return 0;
}

用 -120 验证奇偶位交换是否成功

C程序环境及预处理_第8张图片运行结果:

C程序环境及预处理_第9张图片

  时间过得很快,眨眼间C语言的博客已经接近完结了,后续有时间还会发布C语言的一些经典面试题解,大家尽请期待。 

  下一篇博客就开始学习并更新数据结构与算法的内容,感谢各位对纪宁的支持。

你可能感兴趣的:(C语言学习专题,c语言,开发语言,预处理)