gcc编译原理

一、编译过程

使用gcc编译程序时,编译过程可被细分为四个阶段:

(1)预处理

(2)编译

(3)汇编

(4)链接

例如hello.c程序

hello.c:
#include 
int main(void)
{
printf (Hello world!\n);
return 0;
}

 

1、预处理:

预处理阶段,编译器将代码中的stdio.h的代码编译进来,用户使用-E选项进行查看

gcc -E hello.c -o hello.i

 

2、编译:

gcc首先检查语法的规范性以及是否有语法错误等,以确定代码实际要做的工作,在检查无误后,gcc把代码编译成汇编语言。

gcc -S hello.i -o hello.s

 

3、汇编

把编译生成的.s文件转换成目标文件

gcc -c hello.s -o hello.o

 

4、链接

在该阶段,在这里涉及一个重要的概念:函数库。在这个程序中并没有定义“printf"的函数实现,在预编译中包含进的“stdio.h”中也只有该函数的声明,而没有定义函数的实现,那么,是在哪里实现“printf"函数的呢?
最后的答案是:系统把这些函数实现都己经被放入名为libc. so.6的库文件中去了,在没有特别指定时库函数中去,GCC会到系统默认的搜索路径“/usr/Iib”下进行查找,也就是链接到libc.so.6这样就能实现函数“printf"了,而这也就是链接的作用。
Gcc  hello.o –o hello

 

 

二、gcc的库函数:

Linux的库函数有三种形式:静态、共享、动态三种
静态库是在编译时加入到应用程序中;共享库则是程序运行时才载入;而动态库虽然也是程序运行时才载入,但这种载入是在语句需要使用库函数时候才载入,而且可以在程序运行期间释放动态内存库所用的空间。
系统中可用的库都存放在/usr/lib和/lib目录中。库文件名由前缀lib和库名以及后缀组成。根据库的类型不同,后缀名也不一样。例如共享库和动态库的后缀名.so和版本号组成。静态库的后缀名为.a。

 

三、相关路径选项:

当头文件与gcc不在同一目录下要用 -I dir参数,它是指头文件所在的目录。而添加库文件时需要 -L dir参数,它指定库文件所在的目录。


 (1)“-I dir”
  在GCC中使用头文件在默认情况下是在主程序中所设定的路径,那么如果想要改变该路径,用户则可以使用“-I”选项。"-I dir”选项可以在头文件的搜索路径列表中添加dir目录。这时,GCC就会到相应的位置查找对应的目录。
例如在”/home/hy/ch2”有以下2个文件

   gcc hello2.c   –I  /home/hy/ch2   –o   hello2

 

(2) “-L dir”选项
-L dir与-I dir 功能类似,能够在库文件的搜索路径列表中添加dir目录。
如果一个程序用到了目录/root/lib下的一个动态库libsunq.so,因为-L dir指定的是路径而没有指定文件,则需要用到 -llibarry参数,它可以指定gcc去寻找libsunq.so。
在linux下的库文件命名规定必须以lib三个字母开头,因此,在用“-I”指定连接库文件时可以省去lib三个字母,即,-llibsunq有时可以写成“-lsunq”:
   

 $gcc 1-3.c -o 1-3 -L /root/lib -lsunq

例如有程序he11o_sq.c需要用到目录“/root/workplace/gcc/lib”下的一个动态库libsunq.so则只需键入如下命令即可。


     gcc hello-sq.c   –L /root/workplace/gcc/lib  –o   hello2

 

四、gcc警告提示

CC包含完整的出错检查和警告提示功能,它们可以帮助Linux程序员写出更加专业和优美的代码。
(1)Wall类警告提示
如代码wrong.c
请查看存在的问题?
分别用gcc wrong.c –o wrong 


(2)非Wall类警告提示,最常用的有2种,
“ansi”:生成标准语法的警告
”pedantic”:ANSIC的所有警告
分别用gcc –ansi wrong.c –o wrong
      gcc –pedantic wrong.c –o wrong
      gcc –wall wrong.c –o wrong

五、文件类型

Gcc通过后缀来区别输入文件的类别:
.c为后缀的文件: C语言源代码文件
.a为后缀的文件: 是由目标文件构成的库文件
.C,.cc或.cxx 为后缀的文件: 是C++源代码文件
.h为后缀的文件: 头文件
.i 为后缀的文件: 是已经预处理过的C源代码文件
.ii为后缀的文件: 是已经预处理过的C++源代码文件
.o为后缀的文件: 是编译后的目标文件
.s为后缀的文件: 是汇编语言源代码文件
.S为后缀的文件: 是经过预编译的汇编语言源代码文件
GCC指令的一般格式:
Gcc [选项] 需要编译的文件 [选项] 目标文件



在进行编译操作时,程序完成了复杂的过程。一个程序的编译,需要完成词法分析,语法分析,中间代码生成,代码优化,目标代码生成。

(1)词法分析,指的是对由字符组成的单词进行处理,从左至右逐个字符地对源程序进行扫描,产生一个个的单词符号。然后把字符串的源程序改造成为单词符号串的中间程序。在编译程序时,这一过程是自动完成的。编译程序会对代码的每一个单词进行检查。如果单词发生错误,编译过程就会停止显示错误。

(2)语法分析。语法分析器以单词符号作为输入,分析单词符号串是否形成符合语法规则的语句。例如,需要检查表达式,赋值,循环等结构是否完整和符合使用规则。在语法分析时,会分析出程序中错误的语句,并显示出结果。

(3)中间代码生成。中间代码是源程序的一种内部表示,或称中间语言。程序进行词法分析和语法分析后,将程序转换成中间代码。这一转换的作用是使应用程序结构更加简单和规范。中间代码的生成是一个中间过程,与用户是无关的。

(4)代码优化。代码优化是指对程序进行多种等价变换,使得从变换后的程序能生成更有效的目标代码。用户可以在编译程序时设置代码优化的参数,可以针对不同的环境和设置进行优化。

(5)目标代码生成。目标代码生成指的是产生可执行的应用程序,这是编译的最后一个步骤。生成的程序是二进制的机器语言。


设置ANSIC标准

ANSIC是American National Standards Institute(ANSI:美国标准协会)出版的C语言标准。使用这种标准的C 程序可以在各种编译器和系统下运行通过。gcc可以编译ANSIC 的程序,但是gcc中的很多标准并不被ANSIC所支持。在gcc编译程序时,可以用-ansi来设置程序使用ANSIC标准。

你可能感兴趣的:(linux)