初识C语言·编译与链接

1 翻译环境和运行环境

C语言标准ANSI C 实现C语言代码的时候 一般需要经过两种环境,一是翻译环境,二是运行环境,计算机能识别的是二进制的指令,人写完代码后通过翻译环境,使代码变成计算机能读懂的可执行的机器指令,运行环境就是用来执行实际的代码操作的环境。

1)翻译环境

那么翻译环境如何让源代码变成可执行的机器指令的呢?

翻译环境包含的是编译链接两大过程,其中编译包含预处理(也可以叫做预编译),编译,汇编

编译的时候,机器通过编译器使.c文件生成.obj文件,.obj文件是目标文件(在windows是.obj为后缀,Linux环境下是.o为后缀),多个目标文件在经过链接库的处理,最后生成 .exe文件

VS2022用到的编译器是cl.exe:
初识C语言·编译与链接_第1张图片

用到的链接器是link.exe:

编译的整个过程如下:(Linux下的gcc编译器为例)
.c文件 .h文件 源文件 经过预处理 生成.i为后缀的文件  ->  经过编译生成.s为后缀的文件 -> 经过汇编生成.o为后缀的文件 -> 经过链接器和链接库生成最后的可执行文件.exe

预处理:

在gcc环境下,我们使用指令:

gcc -E test.c -o test.i

使机器生成.i为后缀的文件的时候,我们就会发现代码出现了一下改变,这里因为在预处理阶段,存在以下规则:
1 删除所有的#define,所有宏定义被展开

2 处理所有的条件编译指令,如#endif #if #else

3 处理#include预编译指令,将头文件里面包含的内容插入到头文件所在的位置,这个过程是递归进行的,不排除头文件里面包含其他头文件的可能性

4 所有的注释都会被删除

5 或保留#pragma指令,编译器后续会使用,为了防止头文件重复包含

6 添加行号和文件名标识,方便编译器后续生成调试信息

当我们不知道宏定义是否包含正确的时候就可以经预处理之后的.i文件进行确认。

编译:

在gcc环境下,我们使用指令:

gcc -S test.i -o test.s

使机器生成了.s为后缀的文件,在这个阶段,编译器会进行三个操作,词法分析语法分析语义分析及优化

array[index] = (index+4)*(2+6);

假定以上代码

词法分析:

词法分析就是把代码中的字符分隔开,分割成一系列的记号,如关键字,标识符,特殊字符,字面常量,如下:

初识C语言·编译与链接_第2张图片

语法分析

通过词法分析产生的记号,语法分析器通过记号生成语法树,以表达式为结点的树,如下:

初识C语言·编译与链接_第3张图片

语义分析
语义分析器会从表达式的层面分析,能做的分析使语义的静态分析,静态语义分析包括通常包括声明和类型的匹配,类型的转化等,这个阶段会显示错误的语法信息。

汇编:

汇编的指令如下:

gcc -c test.s -o test.o

汇编器将汇编代码变成机器可以执行的指令,每一个汇编语句几乎都对应一个机器指令,而汇编语言较难的一个原因就是不同的机器的汇编语言是不一样的,不具有跨平台性。

链接:

链接是一个复杂的过程,需要将一堆文件链接在一起才能生成可执行程序。

链接包括分配地址,分配空间,符号决议,重定位,等步骤。

链接解决的是一个项目中多文件多模块互相调用的问题,比如一个C语言的项目中有两个.c文件(test.c add.c)

extern int Add(int, int);//声明外部函数
extern int g_val;//声明外部全局变量
int main()
{
	int a = 10, b = 20;
	int sum = Add(a, b);
	printf("%d ", sum);
	printf("g_val = %d ", g_val);
	return 0;
}
int g_val  = 2024;
int Add(int x,int y)
{
    return x + y;
}

test.c 经过编译器处理生成了test.o文件,Add.c经过编译器处理生成了Add.o文件,通过关键字extern我们在test.c文件里面使用了函数Add 和 全局变量g_val,但是每一次使用这两个外部符号的时候必须确切的知道Add g_val的地址,因为编译器是单独编译的,所以编译器编译test.c文件的时候并不知道函数Add g_val的存在,所以暂时调用Add的指令的目标地址和g_val的地址搁置,等最后链接的时候根据引用的符号Add在其他模块寻找Add函数的地址,最后修正test.c文件里面引用到的Add的地方,使目标地址成为真正的函数Add的地址,对于全局变量亦是如此,这个修正的过程叫做重定义

2)运行环境:

运行环境就没什么好介绍的了:
程序运行的时候必须载入到内存里面,在有操作系统的环境下,一般都是由操作系统完成,独立的环境下,程序的载入必须通过手工安排。因为程序运行的时候操作系统会为程序开辟函数栈帧,调用堆栈,所以载入内存是必须的。

最后就是终止程序了,可能是main函数顺利读取到了最后一行,也可能是意外终止,比如按下F11的时候调试到一般关闭程序,这时候程序就会显示返回值是-1,也就是意外终止了。


感谢阅读!

你可能感兴趣的:(c语言,开发语言)