链接器详解

重定位是将EFL文件中的未定义符号关联到有效值的处理过程。在main.o中，这意味着对printf和puts的未定义的引用必须替换为该进程的虚拟地址空间中适当的机器代码所在的地址。在目标中用到的相关符号之处，都必须替换。

对用户空间程序符号的替换，内核并不涉及其中，因为所有的替换操作都是由外部工具完成的。对内核模块来说，情况有所不同，因为内核所收到的模块裸数据，与其存储在二级制文件中的形式完全相同，内核本身需要负责重定位操作。

在每个目标文件中，都有一个专门的表，包含了重定位项，标识了需要进行重定位之处。每个表项都包含下列信息：

2）对符号的引用（符号表的索引），提供了需要插入到重定位位置的数据

重定位步骤

链接器将所有相同类型的节合并为同一类型的新的聚合节。例如来自输入模块的.data节全部合并成一个节，这个节成为输出可执行目标文件的.data节。然后链接器将运行时存储器地址赋给新的聚合节，赋给输入模块定义的每个节，以及赋给输入模块定义的每个符号。当这一步完成时，程序中的每个指令和全局变量都有唯一的运行时存储器地址了。

在这一步中，链接器修改代码节和数据节中对每个符号的引用，使得他们指向正确的运行时地址。为了执行这一步，链接器依赖于称之为重定位条目的可重定位目标模块中的数据结构。

重定向条目

当汇编器生成一个目标模块时，它并不知道数据和代码最终将存放在存储器中的什么位置。它也不知道这个模块引用的任何外部定义的函数和全局变量。所以，无论何时汇编器遇到对最终位置未指定目标引用，它就会生成一个重定位条目，告诉链接器在将目标文件合并可执行文件时如何修改这个引用。代码重定位条目放在.rel.text中。已经初始化数据的重定位条目放在.rel.data中。

数据结构

由于技术原因，有两种类型的重定位信息，由两种稍有不同的数据结构表示。第一种类型称之为普通重定位。SHT_REL类型的节中的重定位项由以下数据结构定义：

Elf32_Word r_info; /* Relocation type andsymbol index */提供了符号表中的一个位置，同时还包括重定位类型的有个信息。这是通过将值划分为两部分来达到的。

另一种类型，称之为需要添加常数的重定位项，只出现在SHT_RELA类型的节中。数据结构如下：

Elf32_Sword r_addend; /* Addend */加数，计算重定位是，将根据重定位类型，对该值进行不同的处理。

截图例子

为说明如何使用重定位信息，我们看一下此前的main.c测试程序。首先readelf显示文件中所有的重定位项，如下所示：

在程序运行时或者链接main.o产生可执行文件时，如果某些机器代码引用了虚拟地址空间中位置尚不明确的函数或者符号，则将使用Offset列的信息。main的汇编语言代码调用了若干函数，分别位于偏移量0x26的puts和位于0x40的printf。这些可以使用objdump工具看到：

在puts和printf函数的地址已经确定后，必须将其插入到指定的偏移量处，以便生成能够正确运行的可执行代码。

重定位类型

ELF定义了很多重定位类型，对每种支持的体系结构，都有一个独立的集合。这些类型大部分用于生成动态或与装载位置无关的代码。在一些平台上，特别是IA32平台，还必须弥补许多设计错误和历史包袱。幸运的是，Linux内核只对模块的重定位感兴趣，因此用以下两种重定位类型就可以了：

相对重定位生成的重定位表项指向相对于程序计数器（pc，亦即指令指针）指定的内存地址。这些主要用于子例程调用。另一种重定位生成绝对地址，从名字就能看出。通常，这种重定位项指向内存中在编译时就已知的数据，例如字符串常数。

在IA32系统上，和两种重定位类型由常数R_386_PC_32(相对重定位)和R_386_32(绝对重定位)表示。重定位结果计算如下：

A代表加数值，在IA32体系结构上，由重定位位置处的内存内容隐士提供(一般为操作码后面的数值)。S是符号表中保存的符号的值，而P代表重定位的位置偏移量，换言之，即算出的数据写入到二进制文件中的位置偏移量(修改处的运行时地址或者偏移，对于目标文件P为修订处段内的偏移，对可执行文件P为运行时的地址)。如果加数值为0，那么绝对重定位只是将符号表中的符号的值插入在重定位位置。但在相对重定位中，需要计算符号位置和重定位位置之间的差值。换言之，需要通过计算确定符号与重定位位置相距多少字节。

在这两种情况下，都会加上加数值，因而使得结果产生一个线性位移。

举例说明