gcc详解

GCC编译流程

GCC的编译流程分为4个步骤,分别为:

1)预处理(Pre-Processing)

在该阶段,编译器分析处理源代码文件中的各种宏指令,如#include,#if等。

2)编译(Compiling)

在该阶段,GCC首先要检查代码的规范性、是否有语法错误等,在检查无误后,GCC把代码翻译为汇编语言。

3)汇编(Assembling)

在该阶段,编译器把编译生成的汇编代码转成二进制目标代码。

4)链接(Linking)

在该阶段,编译器把汇编阶段生成的二进制代码、程序中用到的库文件链接起来,生成可执行文件。

 

函数库分为:静态库和动态库。

静态库:在链接时,静态库的文件代码会被拷贝到可执行文件中。

动态库:链接时,动态库的代码不会被加入可执行文件中,而是在程序被执行的时候加载。

 

gcc的基本用法

gcc test.c这样将编译出一个名为a.out的程序

gcc test.c -o test这样将编译出一个名为test的程序,-o参数用来指定生成程序的名字

 

首先,gcc需要调用预处理程序cpp,由它负责展开在源文件中定义的宏,并向其中插入#include语句所包含的内容;

接着,gcc会调用ccl和as将处理后的源代码编译成目标代码;

最后,gcc会调用链接程序ld,把生成的目标代码链接成一个可执行程序。

 

GCC的常用选项

GCC的命令行格式:gcc  [参数]  要编译的文件  [参数]   [目标文件] 

常用选项:

-c                  编译为目标文件,不连接库

-S                 编译为汇编代码

-E                 预处理.预处理之后的代码将送往标准输出

-Wwarn...     设置警告,可以设置的警告开关很多,通常用-Wall开启所有的警告

-Olevel         设置优化级别,level可以是0,1,2,3或者s,默认为-O0,即不进行优化处理

-Dname=definition...  在命令行上定义宏,有两种方式,-Dname或者-Dname=definition。

在命令行上设置宏定义的目的主要是为了在调试的时候设定一些开关,而在发布的时候再关闭或者打开这些开关即可,当然宏定义也用来对代码进行有选择地编译,另外也还有其他的一些作用。

-Uname         取消宏定义name,作用和上面的正好相反。

-Idir...            (大写i)把dir加到头文件的搜索路径中,而且gcc会在搜索标准头文件之前先搜索dir.

-llibrary         (小写L)在连接的时候搜索library库,如果你要连接pcap库,那么你就需要使用-lpcap对源文件进行编译.

-Ldir...           把dir加到库文件的搜索路径中,而且gcc会在搜索标准库文件之前先搜索dir

-g                  产生调试信息. GDB能够使用这些调试信息。

-o outfile       指定输出文件的文件名,默认为a.out

-mmachine-option...  指定所用的平台

 

为什么会出现undefined reference to 'xxxxx'错误?

首先这是链接错误,不是编译错误,也就是说如果只有这个错误,说明你的程序源码本身没有问题,是你用编译器编译时参数用得不对,

没有指定链接程序要用到的库,比如你的程序里用到了一些数学函数,那么你就要在编译参数里指定程序要链接数学库,方法是在编译命令行里加入-lm。

 

-l参数和-L参数

-l参数就是用来指定程序要链接的库,-l参数紧接着就是库名。

那么库名跟真正的库文件名有什么关系呢?

就拿数学库来说,他的库名是m,他的库文件名是libm.so,很容易看出,把库文件名的头lib和尾.so去掉就是库名了

好了现在我们知道怎么得到库名了,如果我们自已要用到一个第三方提供的库名字叫libtest.so,

那么我们只要把libtest.so拷贝到/usr/lib里,编译时加上-ltest参数,我们就能用上libtest.so库了(当然要用libtest.so库里的函数,我们还需要与libtest.so配套的头文件)。

 

放在/lib和/usr/lib和/usr/local/lib里的库直接用-l参数就能链接了,

但如果库文件没放在这三个目录里,而是放在其他目录里,这时我们只用-l参数的话,链接还是会出错。

出错信息大概是:“/usr/bin/ld: cannot find -lxxx”,也就是链接程序ld在那3个目录里找不到。

libxxx.so,这时另外一个参数-L就派上用场了,比如常用的X11的库,它放在/usr/X11R6/lib目录下,

我们编译时就要用-L/usr/X11R6/lib -lX11参数,-L参数跟着的是库文件所在的目录名。

再比如我们把libtest.so放在/aaa/bbb/ccc目录下,那链接参数就是-L/aaa/bbb/ccc -ltest

 

另外,大部分libxxxx.so只是一个链接,以RH9为例,比如libm.so它链接到/lib/libm.so.x,/lib/libm.so.x又链接到/lib/libm-2.3.2.so,

如果没有这样的链接,还是会出错,因为ld只会找libxxxx.so,所以如果你要用到xxxx库,而只有libxxxx.so.x或者libxxxx-x.x.x.so,

做一个链接就可以了ln -s libxxxx-x.x.x.so libxxxx.so

 

手工来写链接参数总是很麻烦的,还好很多库开发包提供了生成链接参数的程序,名字一般叫xxxx-config,一般放在/usr/bin目录下,比如

gtk1.2的链接参数生成程序是gtk-config,执行gtk-config --libs就能得到以下输出

"-L/usr/lib -L/usr/X11R6/lib -lgtk -lgdk -rdynamic -lgmodule -lglib -ldl -lXi -lXext -lX11 -lm",这就是编译一个gtk1.2程序所需的gtk链接参数,

xxx-config除了--libs参数外还有一个参数是--cflags用来生成头文件包含目录的,也就是-I参数,在下面我们将会讲到。

你可以试试执行gtk-config --libs --cflags,看看输出结果。

现在的问题就是怎样用这些输出结果了,最笨的方法就是复制粘贴或者照抄,聪明的办法是在编译命令行里加入这个`xxxx-config --libs --cflags`

比如编译一个gtk程序:gcc gtktest.c `gtk-config --libs --cflags`这样就差不多了。

注意`不是单引号,而是1键左边那个键。

 

除了xxx-config以外,现在新的开发包一般都用pkg-config来生成链接参数,使用方法跟xxx-config类似,但xxx-config是针对特定的开发包,

pkg-config包含很多开发包的链接参数的生成,用pkg-config --list-all命令可以列出所支持的所有开发包,

pkg-config的用法就是pkg-config pagName --libs --cflags,其中pagName是包名,是pkg-config--list-all里列出名单中的一个,

比如gtk1.2的名字就是gtk+,pkg-config gtk+ --libs --cflags的作用跟gtk-config --libs --cflags是一样的

比如:gcc gtktest.c `pkg-config gtk+ --libs --cflags`。

 

-include和-I参数

-include用来包含头文件,但一般情况下包含头文件都在源码里用#include xxxxxx实现,-include参数很少用。

-I参数是用来指定头文件目录,/usr/include目录一般是不用指定的,gcc知道去那里找,但是如果头文件不在/usr/include里我们就要用-I参数指定了,

比如头文件放在/myinclude目录里,那编译命令行就要加上-I/myinclude参数了,如果不加你会得到一个"xxxx.h: No such file or directory"的错误。

-I参数可以用相对路径,比如头文件在当前目录,可以用-I.来指定。上面我们提到的--cflags参数就是用来生成-I参数的。

 

-O参数

这是一个程序优化参数,大写o,一般用-O2就是,用来优化程序用的,比如gcc test.c -O2,优化得到的程序比没优化的要小,执行速度可能也有所提高(我没有测试过)。

 

-shared参数

编译动态库时要用到,比如gcc -shared test.c -o libtest.so

 

几个相关的环境变量

PKG_CONFIG_PATH:用来指定pkg-config用到的pc文件的路径,默认是/usr/lib/pkgconfig,pc文件是文本文件,扩展名是.pc,里面定义开发包的安装路径,Libs参数和Cflags参数等等。

CC:用来指定c编译器。

CXX:用来指定cxx编译器。

LIBS:跟上面的--libs作用差不多。

CFLAGS:跟上面的--cflags作用差不多。

CC,CXX,LIBS,CFLAGS手动编译时一般用不上,在做configure时有时用到,一般情况下不用管。环境变量设定方法:export ENV_NAME=xxxxxxxxxxxxxxxxx

 

交叉编译

交叉编译通俗地讲就是在一种平台上编译出能运行在体系结构不同的另一种平台上。

比如在我们的PC平台(X86 CPU)上编译出能运行在sparc CPU平台上的程序,

编译得到的程序在X86 CPU平台上是不能运行的,必须放到sparc CPU平台上才能运行。当然两个平台用的都是linux。

 

这种方法在异平台移植和嵌入式开发时用得非常普遍。

用来编译这种程序的编译器就叫交叉编译器,一般用的都是gcc,但这种gcc跟本地的gcc编译器

是不一样的,需要在编译gcc时用特定的configure参数才能得到支持交叉编译的gcc。

 

相对与交叉编译,我们平常做的编译就叫本地编译,也就是在当前平台编译,编译得到的程序也是在本地执行。

 

为了不跟本地编译器混淆,交叉编译器的名字一般都有前缀,比如sparc-xxxx-linux-gnu-gcc,sparc-xxxx-linux-gnu-g++ 等等

 

交叉编译器的使用方法

使用方法跟本地的gcc差不多,但有一点特殊的是:必须用-L和-I参数指定编译器用sparc系统的库和头文件,不能用本地(X86)的库(头文件有时可以用本地的)。

例子:sparc-xxxx-linux-gnu-gcc test.c -L/path/to/sparcLib -I/path/to/sparcInclude

你可能感兴趣的:(gcc详解)