gcc编译器的运用和常用指令

目录

本文主要介绍了gcc编译器背后的一些工具以及gcc的常用命令

         一、gcc简介

二、gcc背后的工具

        1.Binutils

        2.C运行库

1.准备工作

2.编译过程 

3.分析ELF文件

        三、gcc常用命令 

        四、总结

        五、参考资料


本文主要介绍了gcc编译器背后的一些工具以及gcc的常用命令

一、gcc简介

GCC的意思也是GNU c Compiler。经过了这么多年的发展,GCC已经不仅仅能支持C语言:它现在还支持 Ada 语言、C++语言、Java 语言、Objective C语言、Pascal语言、COBOL语言,以及支持函数式编程和逻辑编程的Mercury 语言,等等。而 GCC也不再单只是GNUC语言编译器的意思了,而是变成了GNU Compiler Collection也即是GNU编译器家族的意思了。另一方面,说到GCC对于操作系统平台及硬件平台支持,概括起来就是一句话:无所不在。

二、gcc背后的工具

        1.Binutils

一组二进制程序处理工具,包括: addr2line、ar、objcopy、objdump、as、ld、ldd、readelf、 size等。这一组工具是开发和调试不可缺少的工具,分别简介如下:

(1) addr2line:用来将程序地址转换成其所对应的程序源文件及所对应的代码行,也可以得到所对应的函数。该工具将帮助调试器在调试的过程中定位对应的源代码位置。

(2) as:主要用于汇编,有关汇编的详细介绍请参见后文。

(3)ld:主要用于链接,有关链接的详细介绍请参见后文。

(4) ar:主要用于创建静态库。为了便于初学者理解,在此介绍动态库与静态库的概念:

  • 如果要将多个.o目标文件生成一个库文件,则存在两种类型的库,一种是静态库,另一种是动态库。
  • 在windows中静态库是以 .lib 为后缀的文件,共享库是以 .dll为后缀的文件。在 linux中静态库是以.a为后缀的文件,共享库是以.so为后缀的文件。
  • 静态库和动态库的不同点在于代码被载入的时刻不同。静态库的代码在编译过程中已经被载入可执行程序,因此体积较大。共享库的代码是在可执行程序运行时才载入内存的,在编译过程中仅简单的引用,因此代码体积较小。在 Linux系统中,可以用ldd命令查看一个可执行程序依赖的共享库。
  • 如果一个系统中存在多个需要同时运行的程序且这些程序之间存在共享库,那么采用动态库的形式将更节省内存。

(5) ldd:可以用于查看一个可执行程序依赖的共享库。

(6) objcopy:将一种对象文件翻译成另一种格式,譬如将.bin转换成.elf、或者将.elf转换成.bin 等。

(7) objdump:主要的作用是反汇编。有关反汇编的详细介绍,请参见后文。

(8) readelf:显示有关ELF文件的信息,请参见后文了解更多信息。

(9) size:列出可执行文件每个部分的尺寸和总尺寸,代码段、数据段、总大小等,请参见后文了解使用size的具体使用实例。

        2.C运行库

C语言标准主要由两部分组成:一部分描述(的语法,另一部分描述C标准库。C标准库定义了一组标准头文件,每个头文件中包含一些相关的函数、变量、类型声明和宏定义,譬如常见的 printf函数便是一个C标准库函数,其原型定义在stdio头文件中。

c语言标准仅仅定义了C标准库函数原型,并没有提供实现。因此,C语言编译器通常需要一个C运行时库(C Run Time Libray,CRT)的支持。C运行时库又常简称为C运行库。与C语言类似,C++也定义了自己的标准,同时提供相关支持库,称为C++运行时库。

1.准备工作

由于GCC工具链主要是在Linux环境中进行使用﹐因此本文也将以Linux系统作为工作环境。为了能够演示编译的整个过程,先创建一个工作目录test0,然后用文本编辑器生成一个C语言编写的简单Hello.c程序为示例﹐其源代码如下所示:

gcc编译器的运用和常用指令_第1张图片

2.编译过程 

        1.预处理

预处理的过程主要包括以下过程;

(1)将所有的#define 删除,并且展开所有的宏定义,并且处理所有的条件预编译指令,比如#if #ifdef #elif #else #endif等。

(2)处理#include预编译指令,将被包含的文件插入到该预编译指令的位置。

(3)删除所有注释“/ /”和“/*﹐*/”。

(4)添加行号和文件标识,以便编译时产生调试用的行号及编译错误警告行号。

(5)保留所有的#pragma编译器指令,后续编译过程需要使用它们。

使用gcc进行预处理的命令如下:

gcc -E Hello.c -o Hello.i

将源文件 Hello.c 文件预处理生成 Hello.i

GCC的选项-E使GCC在进行完预处理后即停止

Hello.i 文件可以作为普通文本文件打开进行查看,其代码片段如下所示:

Hello.i 代码片段

gcc编译器的运用和常用指令_第2张图片

         2.编译

编译过程就是对预处理完的文件进行一系列的词法分析,语法分析,语义分析及优化后生成相应的汇编代码。

使用gcc进行编译的命令如下:

 gcc -S Hello.i -o Hello.s

将预处理生成的hello.i文件编译生成汇编程序Hello.s

GCC的选项-S使GCC在执行完编译后停止,生成汇编程序

上述命令生成的汇编程序Hello.s 的代码片段如下所示,其全部为汇编代码。

 Hello.s 代码片段

gcc编译器的运用和常用指令_第3张图片

         3.汇编

汇编过程调用对汇编代码进行处理,生成处理器能识别的指令,保存在后缀为.o的目标文件中。由于每一个汇编语句几乎都对应一条处理器指令,因此,汇编相对于编译过程比较简单,通过调用Binutils中的汇编器as 根据汇编指令和处理器指令的对照表一一翻译即可。

当程序由多个源代码文件构成时,每个文件都要先完成汇编工作,生成.o目标文件后,才能进入下一步的链接工作。注意:目标文件已经是最终程序的某一部分了,但是在链接之前还不能执行。

使用gcc进行汇编的命令如下:

gcc -c Hello.s -o Hello.o

将编译生成的 Hello.s 文件汇编生成目标文件Hello. o

GCC的选项-c使GCC在执行完汇编后停止,生成目标文件

或者直接调用as进行汇编

as -c Hello.s -o Hello.o

使用 Binutils 中的asHello.s文件汇编生成目标文件注意: Hello.o目标文件为ELF (Executable and Linkable Format)格式的可重定向文件。

        4.链接

链接也分为静态链接和动态链接,其要点如下:

(1)静态链接是指在编译阶段直接把静态库加入到可执行文件中去,这样可执行文件会比较大。链接器将函数的代码从其所在地(不同的目标文件或静态链接库中)拷贝到最终的可执行程序中。为创建可执行文件,链接器必须要完成的主要任务是:符号解析(把目标文件中符号的定义和引用联系起来)和重定位(把符号定义和内存地址对应起来然后修改所有对符号的引用)。

(2)动态链接则是指链接阶段仅仅只加入一些描述信息,而程序执行时再从系统中把相应动态库加载到内存中去。

  • 在Linux系统中,gcc编译链接时的动态库搜索路径的顺序通常为:首先从gcc命令的参数-L指定的路径寻找﹔再从环境变量LIBRARY_PATH指定的路径寻址:再从默认路径/lib、/usr /lib、 /usr /local/lib寻找。
  • 在Linux系统中,执行二进制文件时的动态库搜索路径的顺序通常为:首先搜索编译目标代码时指定的动态库搜索路径:再从环境变量LD_LIBRARY_PATH指定的路径寻址﹔再从配置文件/etc/ld.so.conf中指定的动态库搜索路径;再从默认路径/lib、/usr/lib寻找。
  • 在Linux系统中,可以用1dd命令查看一个可执行程序依赖的共享库。

由于链接动态库和静态库的路径可能有重合,所以如果在路径中有同名的静态库文件和动态库文件,比如 libtest.alibtest.so,gcc链接时默认优先选择动态库,会链接libtest. so,如果要让gcc选择链接libtest.a则可以指定gcc选项-static,该选项会强制使用静态库进行链接。以Hello World为例:

        如果使用命令“gcc Hello.c -o Hello”则会使用动态库进行链接,生成的ELF可执行文件的大小(使用Binutils size命令查看)和链接的动态库(使用Binutilsldd命令查看)如下所示:

gcc Hello.c -o Hello

size Hello//使用size查看大小

 ldd Hello//可以看出该可执行文件链接了很多其他动态库,主要是Linux的glibc动态库

如果使用命令“gcc -static Hello.c -o Hello”则会使用静态库进行链接,生成的ELF可执行文件的大小(使用Binutilssize命令查看〉和链接的动态库(使用Binutilsldd命令查看)如下所示: 

gcc -static Hello.c -o Hello.o

size Hello//使用size查看大小

 从图中可以看出text的代码尺寸变得极大

ldd Hello

 说明没有链接动态库

链接器链接后生成的最终文件为ELF格式可执行文件,一个ELF可执行文件通常被链接为不同的段,常见的段譬如.t ext、.data、.rodata、.bss等段。

3.分析ELF文件

        1.ELF文件的段

ELF文件格式如下图所示,位于ELF Header 和 Section Header Table之间的都是段( Section) 。一个典型的ELF文件包含下面几个段:

.text:已编译程序的指令代码段。

.rodata:ro 代表read only,即只读数据(譬如常数const ) 。

.data:已初始化的C程序全局变量和静态局部变量。

.bss :未初始化的C程序全局变量和静态局部变量。

.debug:调试符号表,调试器用此段的信息帮助调试。

gcc编译器的运用和常用指令_第4张图片

 可以使用readelf -S查看其各个section的信息如下:

readelf -S Hello

gcc编译器的运用和常用指令_第5张图片

        2.反汇编ELF

 由于ELF文件无法被当做普通文本文件打开,如果希望直接查看一个ELF文件包含的指令和数据,需要使用反汇编的方法。

使用objdump -D对其进行反汇编如下:

objdump -D Hello

gcc编译器的运用和常用指令_第6张图片

使用objdump -S将其反汇编并且将其C语言源代码混合显示出来:

gcc -o hello -g Hello.c //要加上-g 选项 

objdump -S Hello

gcc编译器的运用和常用指令_第7张图片

三、gcc常用命令 

        上面二中已经有不少的gcc常用命令,这里就不过多的在做讲解,若想了解更详细的gcc常用命令,可参考以下链接:

浏览icon-default.png?t=M85Bhttps://mooc1.chaoxing.com/ueditorupload/read?objectId=94fdef0ff9306a1d78c5d95704d1e248&fileOriName=Linux%2520GCC%25E5%25B8%25B8%25E7%2594%25A8%25E5%2591%25BD%25E4%25BB%25A4.pdf

四、总结

对于gcc的进一步学习,让我不禁感叹gcc真是一个强大的编译器。gcc不是一个人在战斗,gcc背后其实有一堆战友,他们为gcc变得强大做出了巨大的贡献。同时对gcc的一些常用命令也有了一定的了解,也是对程序的编译过程又进行了一次巩固,也有了更加深刻、清晰的理解,收获颇丰。

五、参考资料

浏览icon-default.png?t=M85Bhttps://mooc1.chaoxing.com/ueditorupload/read?objectId=b9616c5b28b9b0b12e4df8411148087e&fileOriName=GCC%25E7%25BC%2596%25E8%25AF%2591%25E5%2599%25A8%25E8%2583%258C%25E5%2590%258E%25E7%259A%2584%25E6%2595%2585%25E4%25BA%258B.pdf

你可能感兴趣的:(linux,c语言,ubuntu)