【Code_Base】编译原理的简述

概述

C和C++编译器是集成的,编译一般分为如下四个步骤:
a. 预处理(preprocessing) ———— cpp/gcc -E
b. 编译(compilation) —————— cc1 / gcc -S
c. 汇编(assembly) ——————— as
d. 链接(linking) ———————— ld

下面就以一个经典的hello程序为例了解一下上述的四步

#include 

int main()
{
    printf("hello, world\n");
    return 0;
}

1. 预处理阶段:预处理器(cpp)根据字符#开头的命令,修改原始的C程序。例如,hello.c中第一行的#include 命令告诉预处理器读取系统头文件stdio.h的内容,并把它直接插入到程序中。结果得到另一个C程序,通常以.i作为文件扩展名。

2. 编译阶段:编译器(ccl)将文本文件hello.i翻译成文件本文件hello.s,它包含一个汇编语言程序。该程序包含函数main的定义,如下所示:

1   main:
2       subq     $8, %rsp
3       movl     $.LCO, %edi
4       call     puts
5       movl     $0, %eax
6       addq     $8, %rsp
7       ret
定义中2~7行的的每条语句都以一种文本格式描述了一条低级机器语言指令。汇编语言是非常有用的,因为它为不同高级语言的不同编译器提供了通用的输出语言。例如,C编译器和Frotran编译器产出的输出文件用的都是一样的汇编语言

3. 汇编阶段:接下来,汇编器(as)将hello.s翻译成机器语言指令,并把这些指令打包成一种叫做可重定位目标程序的格式,并将结果保存到目标文件hello.o中,hello.o是一个二进制文件,它包含的17个字节是函数main的指令编码。如果我们在文本编辑器里面打开hello.o文件,看到的将是一堆乱码。

4. 链接阶段:hello程序调用了printf函数,他是每个C编译器都提供的标准C库的一个函数。printf函数存在于一个名为printf.o的单独的预编译好了的目标文件中,而这个文件必须以某种方式合并到我们的hello.o程序中,链接器(ld)就负责处理这种合并。结果就得到hello文件,他是一个可执行目标文件或简称为可执行文件,可以被加载到内存中,有系统执行。

  • 为了更好的理解可以参考下图:
    【Code_Base】编译原理的简述_第1张图片

函数库

  • 函数库一般分为静态库和动态库两种
    1. 静态库是指编译链接时,把库文件的代码全部加入到可执行文件中,因此生成的文件比较大,但在运行时也就不再需要库文件了。其后缀名一般为”.a“。
    2. 动态库与之相反,在编译链接时并没有把库文件的代码加入到可执行文件中,而是在程序执行时由运行时链接文件加载库,这样可以节省系统的开销。动态库一般后缀名为”.so”,如前面所述的libc.so.6就是动态库。Gcc在编译时默认使用动态库。
静态库生成方法:  
    ar cr libxxx.a file1.o file2.o  
    就是把file1.o和file2.o打包生成libxxx.a静态库  
使用方法
    gcc test.c -L/path -lxxx -o test  


动态库生成方法:
    gcc -fPIC -shared file1.c -o libxxx.so  
也可以分成两部来写  
    //这一步生成file1.o 
    gcc -fPIC file1.c -c  
    gcc -shared file1.o -o libtest.so  
使用方法
    gcc test.c -L/path -lxxx -o test  
  • 静态库链接时搜索路径顺序:

    1. ld会去找GCC命令中的参数-L
    2. 再找gcc的环境变量LIBRARY_PATH
    3. 再找内定目录 /lib /usr/lib /usr/local/lib 这是当初compile gcc时写在程序内的
  • 动态链接时、执行时搜索路径顺序

    1. 编译目标代码时指定的动态库搜索路径
    2. 环境变量LD_LIBRARY_PATH指定的动态库搜索路径
    3. 配置文件/etc/ld.so.conf中指定的动态库搜索路径
    4. 默认的动态库搜索路径/lib
    5. 默认的动态库搜索路径/usr/lib

环境变量

  • LIBRARY_PATH环境变量:指定程序静态链接库文件搜索路径
  • LD_LIBRARY_PATH环境变量:指定程序动态链接库文件搜索路径


声明:本文参考自《深入理解计算机系统》


【Code_Base】编译原理的简述_第2张图片

你可能感兴趣的:(Code_Base)