在ANSI C的任何⼀种实现中,存在两个不同的环境。
那么源代码是如何一步步转换为机器指令的呢?其实分为两个大的部分:编译和链接,而编译又分为三个小的部分:预处理、编译、汇编。
预处理阶段主要处理那些源文件中#开始的预编译指令,处理的规则如下:
#if
、#ifdef
、#elif
、#else
、#endif
编译过程就是将预处理后的文件进行一系列的:词法分析、语法分析、语义分析及优化,生成相应的汇编代码文件。
以下列代码为例,讲解每个过程的分析
array[index] = (index+4)*(2+6);
将源代码程序被输入扫描器,扫描器的任务就是简单的进行词法分析,把代码中的字符分割成⼀系列的记号(关键字、标识符、字面量、特殊字符等)
记号 | 类型 |
---|---|
array | 标识符 |
[ | 左方括号 |
index | 标识符 |
] | 右方括号 |
= | 赋值 |
( | 左圆括号 |
index | 标识符 |
+ | 加号 |
4 | 数字 |
) | 右圆括号 |
* | 乘号 |
… | … |
接下来语法分析器,将对扫描产生的记号进行语法分析,从而产生语法树。这些语法树是以表达式为节点的树。
由语义分析器来完成语义分析,即对表达式的语法层面分析。编译器所能做的分析是语义的静态分析。静态语义分析通常包括声明和类型的匹配,类型的转换等。
这个阶段会报告错误的语法信息。
同时,在编译阶段进行符号汇总。就是把所有文件中的符号(函数名,变量名等)都记录下来。
汇编器是将汇编代码转转变成机器可执行的指令,每一个汇编语句几乎都对应一条机器指令。就是根据汇编指令和机器指令的对照表进行翻译,也不做指令优化。
同时,在汇编阶段形成符号表。就是把汇总的符号与其地址相对应,记录在一个表格中。
链接是⼀个复杂的过程,链接的时候需要把一堆文件链接在一起才生成可执行程序。 链接过程主要包括:地址和空间分配,符号决议和重定位等这些步骤。
假设现在有两个文件:
add.c
int g_val = 2022;
int Add(int x, int y)
{
return x+y;
}
test.c
#include
//声明外部函数
extern int Add(int x, int y);
//声明外部的全局变量
extern int g_val;
int main()
{
int a = 10;
int b = 20;
int sum = Add(a, b);
printf("%d\n", sum);
return 0;
}
那么,在链接的过程中,查找符号表发现add.c和test.c都有Add函数和g_val变量,这时候就会符号决议和重定位,将两份地址合成一份真正的实际地址(也就是add.c中实际定义的地址)。
这样,所有引用Add和g_val的地方都可以通过重定位的地址找到真正定义的地址。
看到这里了还不给博主扣个: ⛳️ 点赞☀️收藏 ⭐️ 关注! ❤️
拜托拜托这个真的很重要! 你们的点赞就是博主更新最大的动力! 有问题可以评论或者私信呢秒回哦。