链接器到底干了什么?

前言

我们在前文「了解 Mach-O文件」中,有提到过编译器会将文件编译,然后生成Mach—O文件,而程序是不会执行这么多的Mach—O文件,所以链接器会把这些Mach—O文件合并成一个。

链接器干了什么?

iOS系统的可执行文件不就是 Mach-O文件吗,为什么还需要合并Mach- O文件呢?可能有同学会有疑惑吧,是这样的,在我们的项目文件中定义了很多函数和变量,而这些函数和变量和其他文件有可能是相互依赖的,如果没有将这些函数和变量绑定关联起来的话,那么单个 Mach-O文件是无法正常运行的,因为,如果运行时碰到调用在其他文件中实现的函数的情况时,就会找不到这个调用函数的地址,从而无法继续执行。

链接器在链接目标文件的过程中,会创建一个符号表(Symbol Table),用来把我们定义的符号(链接中,我们将函数和变量统称为符号)和未定义的符号记录在其中。

比如过我们编译过程中,常常会遇到的错误提示:如果链接出现相同符号的时,就会提示错误ld: dumplicate symbols
如果目标文件里没有找到符号时,就会提示错误Undefined symbols

在iOS开发中,链接的共用库可以分为静态库和动态库:静态库是编译时链接的库,需要链接到Mach-O文件里,这种我们叫静态链接;而动态库是运行时链接的库,使用 dyld 就可以实现动态加载,这种我们叫动态链接。

静态链接

编译时期链接器会干以下几件事:

  • 查找所有目标文件,找出未定义的变量将所有的符号定义和引用地址放到全局符号表中,获得所有输入目标文件的段长度,并且将它们合并,计算出输出文件中各个段合并后的长度与位置,并建立映射关系
  • 最后会对项目中不同文件的变量进行地址重定位

动态链接

我们知道Mach-O文件是编译器后产生的,动态库在运行时才会被链接,也就是说Mach-O文件中是不包含动态库相关的符号定义的,所以这些符号就是前面说的 Undefined symbols,不过它们的符号名和对应的库的路径会被记录下来,在运行时,通过 dlopendlsym函数导入动态库时,先根据记录的库的路径找到对应的库,再通过记录的符号名找到绑定的地址。

我们先来看看这两个函数

dlopen()加载一个动态库,并将其载入到进程的地址空间。

/* 
filename 是被加载的路径;
flag表示函数符号的解析方式; 
RTLD_LAZY:表示使用延迟绑定,函数第一次被用到时才进行绑定,即PLT机制; 
RTLD_NOW:表示当模块被加载时即完成所有的函数绑定工作,如果有任何未定义的符号音乐绑定工作没法完成,那么dlopen()就返回错误; 
RTLD_GLOBAL:可以跟上面两者任意一个一起使用(通过常量的“或”操作),它表示将被加载的模块的全局符号合并到进程的全局符号中,使得以后加载的模块可以使用这些符号。 
*/ 
void * dlopen(const char *filename,int flag);

dlsym()函数的作用就是通过dlopen 返回的动态库指针和函数符号,得到函数的地址然后使用。

/*
handle 是由dlopen()返回的动态库的句柄;
symbol 表示所需要查找的符号名;
如果dlsym()找到了相应的符号,则返回该符号的值,没有找到相应的符号,则返回NULL。 
*/ 
void * dlsym(void * handle, char * symbol);

使用 dyld 加载动态库,有两种方式:程序启动加载时绑定符号第一次被用到时绑定

程序启动加载时绑定会增加程序启动时间,所以大部分动态库使用的都是符号第一次被用到时再绑定的方式。

加载过程开始会修正地址偏移,iOS 会用 ASLR 来做地址偏移避免攻击,确定 Non-Lazy Pointer 地址进行符号地址绑定,加载所有类,最后执行 load 方法和 Clang Attribute 的 constructor 修饰函数。

每个函数、全局变量和类都是通过符号的形式定义和使用的,当把目标文件链接成一个Mach-O文件时,链接器在目标文件和动态库之间对符号做解析处理。

undefined symbols需要用的库是libSystemlibobjc

简单来总结下,dyld 做了以下几件事:

  • 根据 Mach-O 文件里 undefined 的符号加载对应的动态库,系统会设置一个共享缓存来解决加载的递归依赖问题;
  • 加载后,将 undefined 的符号绑定到动态库里对应的地址上;
  • 最后再处理 +load 方法,main 函数返回后运行静态终结者的例程。

写在最后

了解了这种链接机制,你能够明白,文件越多,链接器链接 Mach-O 文件所需绑定的遍历操作就会越多,编译速度也会越慢。了解程序运行阶段的动态库链接原理,会让你更多地了解程序在启动时做的事情,同时还能够对你有一些启发。

你可能感兴趣的:(链接器到底干了什么?)