编译和链接(你真的了解符号决议和重定位吗?)



快乐的流畅:个人主页


个人专栏:《C语言》《数据结构世界》《进击的C++》

远方有一堆篝火,在为久候之人燃烧!

文章目录

  • 引言
  • 一、翻译环境
    • 1.1 预处理
    • 1.2 编译
      • 1.2.1 词法分析
      • 1.2.2 语法分析
      • 1.2.3 语义分析
    • 1.3 汇编
    • 1.4 链接
  • 二、运行环境

引言

在ANSI C的任何⼀种实现中,存在两个不同的环境。

  • 第1种是翻译环境,用于源代码被转换为可执行的机器指令
  • 第2种是执行环境,用于实际执行代码。

编译和链接(你真的了解符号决议和重定位吗?)_第1张图片

一、翻译环境

那么源代码是如何一步步转换为机器指令的呢?其实分为两个大的部分:编译和链接,而编译又分为三个小的部分:预处理、编译、汇编

编译和链接(你真的了解符号决议和重定位吗?)_第2张图片

1.1 预处理

预处理阶段主要处理那些源文件中#开始的预编译指令,处理的规则如下:

  • 将所有的 #define 删除,并展开所有的宏定义
  • 处理所有的条件编译指令,如:#if#ifdef#elif#else#endif
  • 处理#include预编译指令,将包含的头文件的内容插入到该预编译指令的位置。这个过程是递归进行的,也就是说被包含的头文件也可能包含其他文件。
  • 删除所有的注释
  • 添加行号和文件名标识,方便后续编译器生成调试信息等。
  • 保留#pragma的编译指令,编译器后续会使用。

1.2 编译

编译过程就是将预处理后的文件进行一系列的:词法分析、语法分析、语义分析及优化,生成相应的汇编代码文件。

以下列代码为例,讲解每个过程的分析

array[index] = (index+4)*(2+6);

1.2.1 词法分析

将源代码程序被输入扫描器,扫描器的任务就是简单的进行词法分析,把代码中的字符分割成⼀系列的记号(关键字、标识符、字面量、特殊字符等)

记号 类型
array 标识符
[ 左方括号
index 标识符
] 右方括号
= 赋值
左圆括号
index 标识符
+ 加号
4 数字
右圆括号
* 乘号

1.2.2 语法分析

接下来语法分析器,将对扫描产生的记号进行语法分析,从而产生语法树。这些语法树是以表达式为节点的树

编译和链接(你真的了解符号决议和重定位吗?)_第3张图片

1.2.3 语义分析

由语义分析器来完成语义分析,即对表达式的语法层面分析。编译器所能做的分析是语义的静态分析。静态语义分析通常包括声明和类型的匹配,类型的转换等。

编译和链接(你真的了解符号决议和重定位吗?)_第4张图片

这个阶段会报告错误的语法信息

同时,在编译阶段进行符号汇总。就是把所有文件中的符号(函数名,变量名等)都记录下来。

1.3 汇编

汇编器是将汇编代码转转变成机器可执行的指令,每一个汇编语句几乎都对应一条机器指令。就是根据汇编指令和机器指令的对照表进行翻译,也不做指令优化。

同时,在汇编阶段形成符号表。就是把汇总的符号与其地址相对应,记录在一个表格中。

预处理
编译
汇编
源代码
源代码
汇编代码
二进制指令

1.4 链接

链接是⼀个复杂的过程,链接的时候需要把一堆文件链接在一起才生成可执行程序。 链接过程主要包括:地址和空间分配,符号决议和重定位等这些步骤。

假设现在有两个文件:
add.c

int g_val = 2022;
int Add(int x, int y)
{
	return x+y;
}

test.c

#include 
//声明外部函数
extern int Add(int x, int y);
//声明外部的全局变量
extern int g_val;
int main()
{
	int a = 10;
	int b = 20;
	int sum = Add(a, b);
	printf("%d\n", sum);
	return 0;
}

那么,在链接的过程中,查找符号表发现add.c和test.c都有Add函数和g_val变量,这时候就会符号决议和重定位,将两份地址合成一份真正的实际地址(也就是add.c中实际定义的地址)。

这样,所有引用Add和g_val的地方都可以通过重定位的地址找到真正定义的地址

二、运行环境

  1. 程序必须载入内存中。在有操作系统的环境中:一般这个由操作系统完成。在独立的环境中,程序的载入必须由手工安排,也可能是通过可执行代码置入只读内存来完成。
  2. 程序的执行开始便调用main函数
  3. 开始执行程序代码。这个时候程序将使用一个运行时堆栈(stack),存储函数的局部变量和返回地址。程序同时也可以使用静态(static)内存,存储于静态内存中的变量在程序的整个执行过程一直保留他们的值。
  4. 终止程序。正常终止main函数;也有可能是意外终止。

看到这里了还不给博主扣个: ⛳️ 点赞☀️收藏 ⭐️ 关注! ❤️
拜托拜托这个真的很重要! 你们的点赞就是博主更新最大的动力! 有问题可以评论或者私信呢秒回哦。

你可能感兴趣的:(零基础学C语言,汇编,机器翻译,自然语言处理)