【嵌入式知识03】Linux下 GCC编译及ELF文件学习

本文主要介绍gcc编译过程中的常用命令及工具,简要介绍ELF文件格式。

本文目录

    • 一、什么是GCC
    • 二、初学举例:Hello World
      • 1、编写代码
      • 2、编译过程
        • 2.1 预处理
        • 2.2编译
        • 2.3汇编
        • 2.4链接
    • 三、多个程序文件的编译
    • 四、检错
    • 五、库文件连接
      • 1、编译成可执行文件
      • 2、链接
      • 3、强制链接时使用静态链接库
    • 六、分析ELF文件
      • 1、ELF文件的段
      • 2、反汇编ELF
    • 七、总结
    • 参考资料

一、什么是GCC

GCC (GNU C Compiler)是编译工具,是 GNU 工具链的主要组成部分,是一套以 GPL 和 LGPL 许可证发布的程序语言编译器自由软件,由 Richard Stallman 于 1985 年开始开发。

GCC 原名为 GNU C语言编译器,因为它原本只能处理 C 语言,但如今的 GCC 不仅可以编译 C、C++ 和 Objective-C,还可以通过不同的前端模块支持各种语言,包括 Java、Fortran、Ada、Pascal、Go 和 D 语言等等。

二、初学举例:Hello World

为了能够演示编译的整个过程,用文本编辑器生成一个C语言编写的简单hello.c程序为示例。

1、编写代码

创建目录存放本次练习的文件。输入如下指令:
mkdir test4
cd test4

创建test.c文件并编写代码。
代码如下:

#include
int main(void)
{
	printf("Hello World!\n");
	return 0;
}

输入下面指令:
gcc test.c -o test
对程序进行编译

2、编译过程

GCC 的编译过程可以划分为四个阶段:预处理(Pre-Processing)、编译(Compiling)、汇编(Assembling)以及链接(Linking)

【嵌入式知识03】Linux下 GCC编译及ELF文件学习_第1张图片

过程 代码
预处理 gcc -E test.c -o test.i 或gcc -E test.c
编译 gcc -S test.i -o test.s
汇编 gcc -c test.s -o test.o
连接 gcc test.o -o test
2.1 预处理

预处理的过程主要包括以下过程:

(1) 将所有的#define 删除,并且展开所有的宏定义,并且处理所有的条件预编译指令,比如#if #ifdef #elif #else #endif 等。
(2) 处理#include 预编译指令,将被包含的文件插入到该预编译指令的位置。
(3) 删除所有注释“//”和“/* */”。
(4) 添加行号和文件标识,以便编译时产生调试用的行号及编译错误警告行号。
(5) 保留所有的#pragma 编译器指令,后续编译过程需要使用它们。

使用gcc进行预处理的命令如下:
gcc -E hello.c -o hello.i
将源文件hello.c文件预处理生成hello.i
GCC的选项 -E 使GCC在进行完预处理后即停止。

2.2编译

编译过程就是对预处理完的文件进行一系列的词法分析,语法分析,语义分析及优化后生成相应的汇编代码。
使用gcc进行编译的命令如下:
gcc -S hello.i -o hello. s
将预处理生成的 hello.i 文件编译生成汇编程序 hello.s GCC的选项 -S 使GCC在执行完编译后停止,生成汇编程序。
在生成汇编代码后,停止,-o 输出汇编代码文件。

2.3汇编

汇编过程调用对汇编代码进行处理,生成处理器能识别的指令,保存在后缀为.o 的目标文件中。由于每一个汇编语句几乎都对应一条处理器指令,因此,汇编相对于编译过程比较简单,通过调用 Binutils 中的汇编器as根据汇编指令和处理器指令的对照表一一翻译即可。

当程序由多个源代码文件构成时,每个文件都要先完成汇编工作,生成.o目标文件后,才能进入下一步的链接工作。

注意:目标文件已经是最终程序的某一部分了,但是在链接之前还不能执行。
使用gcc进行汇编的命令如下:
gcc -c hello.s -o hello.o
将编译生成的hello.s文件汇编生成目标文件 hello.o
GCC的选项 -c 使GCC在执行完汇编后停止,生成目标文件

2.4链接

链接也分为静态链接和动态链接,其要点如下:

(1)静态链接是指在编译阶段直接把静态库加入到可执行文件中去,这样可执行文件会比较大。链接器将函数的代码从其所在地(不同的目标文件或静态链接库中)拷贝到最终的可执行程序中。
为创建可执行文件,链接器必须要完成的主要任务是:符号解析(把目标文件中符号的定义和引用联系起来)和重定位(把符号定义和内存地址对应起来然后修改所有对符号的引用)。
(2)动态链接则是指链接阶段仅仅只加入一些描述信息,而程序执行时再从系统中把相应动态库加载到内存中去。

  • 在 Linux 系统中,gcc 编译链接时的动态库搜索路径的顺序通常为:首先从 gcc 命令的。参数-L 指定的路径寻找;再从环境变量 LIBRARY_PATH 指定的路径寻址;再从默认路径/lib、/usr/lib、/usr/local/lib 寻找。

  • 在 Linux系统中,执行二进制文件时的动态库搜索路径的顺序通常为:首先搜索编译目标代码时指定的动态库搜索路径;再从环境变量 LD_LIBRARY_PATH 指定的路径寻址;再从配置文件/etc/ld.so.conf 中指定的动态库搜索路径;再从默认路径/lib、/usr/lib寻找。

  • 在 Linux 系统 中,可以用 ldd 命令查看一个可执行程序依赖的共享库。
    对于生成的 test.o,将其与C标准输入输出库进行连接,最终生成程序test,输入命令:gcc test.o -o test
    在命令行窗口中,执行==./test==,得到 Hello World !

【嵌入式知识03】Linux下 GCC编译及ELF文件学习_第2张图片

三、多个程序文件的编译

通常整个程序是由多个源文件组成的,相应地也就形成了多个编译单元,使用 GCC 能够很好地管理这些编译单元。假设有一个由 test1.c test2.c 两个源文件组成的程序,为了对它们进行编译,并最终生成可执行程序 test,可以使用下面这条命令:
gcc test1.c test2.c -o test
如果同时处理的文件不止一个,GCC 仍然会按照预处理、编译和链接的过程依次进行。上面这条命令大致相当于依次执行如下三条命令:
gcc -c test1.c -o test1.o
gcc -c test2.c -o test2.o
gcc test1.o test2.o -o test

四、检错

gcc -pedantic illcode.c -o illcode

-pedantic 编译选项并不能保证被编译程序与 ANSI/ISO C 标准的完全兼容,它仅仅只能用来帮助。
-pedantic 选项能够帮助程序员发现一些不符合ANSI/ISO C 标准的代码,但不是全部,事实上只有 ANSI/ISO C 语言标准中要求进行编译器诊断的那些情况,才有可能被 GCC 发现并提出警告。 除了-pedantic 之外,GCC
还有一些其它编译选项也能够产生有用的警告信息。这些选项大多以-W开头,其中最有价值的当数-Wall 了,使用它能够使 GCC
产生尽可能多的警告信息。

gcc -Wall illcode.c -o illcode

GCC 给出的警告信息虽然从严格意义上说不能算作错误,但却很可能成为错误的栖身之所。一个优秀的 Linux
程序员应该尽量避免产生警告信息,使自己的代码始终保持标准、健壮的特性。所以将警告信息当成编码错误来对待,是一种值得赞扬的行为!所以,在编译程序时带上-Werror
选项,那么 GCC 会在所有产生警告的地方停止编译,迫使程序员对自己的代码进行修改,如下:
gcc -Werror test.c -o test

五、库文件连接

虽然 Linux 下的大多数函数都默认将头文件放到 /usr/include/ 目录下,而库文件则放到 /usr/lib/ 目录下;Windows 所使用的库文件主要放在 Visual Stido 的目录下的 include 和 lib,以及系统文件夹下。 但有的时候,我们要用的库不再这些目录下,所以 GCC 在编译时必须用自己的办法来查找所需要的头文件和库文件。

1、编译成可执行文件

首先我们要进行编译 test.c 为目标文件,这个时候需要执行
gcc –c –I /usr/dev/mysql/include test.c –o test.o

2、链接

我们把所有目标文件链接成可执行文件:
gcc –L /usr/dev/mysql/lib –lmysqlclient test.o –o test
Linux 下的库文件分为两大类分别是动态链接库(通常以.so 结尾)和静态链接库(通常以.a 结尾),二者的区别仅在于程序执行时所需的代码是在运行时动态加载的,还是在编译时静态加载的。

3、强制链接时使用静态链接库

默认情况下, GCC 在链接时优先使用动态链接库,只有当动态链接库不存在时才考虑使用静态链接库,如果需要的话可以在编译时加上-static 选项,强制使用静态链接库。
在/usr/dev/mysql/lib 目录下有链接时所需要的库文件 libmysqlclient.so 和 libmysqlclient.a,为了让GCC 在链接时只用到静态链接库,可以使用下面的命令:
gcc –L /usr/dev/mysql/lib –static –lmysqlclient test.o –o test

六、分析ELF文件

1、ELF文件的段

位于 ELF Header 和 Section Header Table 之间的都是段(Section)。一个典型的 ELF 文件包含下面几个段:

.text:已编译程序的指令代码段。 .rodata:ro 代表 read only,即只读数据(譬如常数 const)。
.data:已初始化的 C 程序全局变量和静态局部变量。 .bss:未初始化的 C 程序全局变量和静态局部变量。
.debug:调试符号表,调试器用此段的信息帮助调试。

使用 readelf -S 可查看其各个section的信息,如下:
readelf -S test
【嵌入式知识03】Linux下 GCC编译及ELF文件学习_第3张图片

2、反汇编ELF

由于 ELF 文件无法被当做普通文本文件打开,如果希望直接查看一个 ELF 文件包含的指令和数据,需要使用反汇编的方法。
使用 objdump -D 对其进行反汇编如下:
objdump -D test
【嵌入式知识03】Linux下 GCC编译及ELF文件学习_第4张图片
使用 objdump -S 将其反汇编并且将其C语言源代码混合显示出来。
输入如下指令:
gcc -o test -g test.c
objdump -S test

【嵌入式知识03】Linux下 GCC编译及ELF文件学习_第5张图片

七、总结

本次主要了解了GCC编译中的详细过程,以及工具集中各软件的用途,了解ELF文件格式,通过不断的实践加深理解,练习之后深入理解了gcc的编译过程。收获良多。

参考资料

https://blog.csdn.net/qq_46467126/article/details/120625400?spm=1001.2014.3001.5502
https://blog.csdn.net/qq_43279579/article/details/109026927

你可能感兴趣的:(linux,c++,运维)