GCC详解

开放、自由和灵活是Linux的魅力所在,而这一点在gcc上的体现就是程序员通过它能够更好地控制整个编译过程。

在使用gcc编译程序时,编译过程可以细分为4个阶段:

●       预处理(Pre-Processing)

●       编译(Compiling)

●       汇编(Assembling)

●       链接(Linking)

Linux程序员可以根据自己的需要让gcc在编译的任何阶段结束,检查或使用编译器在该阶段的输出信息,或者对最后生成的二进制文件进行控制,以便通过加入不同数量和种类的调试代码来为今后的调试做好准备。与其他常用的编译器一样,gcc也提供了灵活而强大的代码优化功能,利用它可以生成执行效率更高的代码。

gcc提供了30多条警告信息和3个警告级别,使用它们有助于增强程序的稳定性和可移植性。此外,gcc还对标准的C和C++语言进行了大量的扩展,提高了程序的执行效率,有助于编译器进行代码优化,能够减轻编程的工作量。

3.2  使 用 gcc

gcc的版本可以使用如下gcc –v命令查看:

[david@DAVID david]$ gcc -v

Reading specs from /usr/lib/gcc-lib/i386-redhat-linux/3.2.2/specs

Configured with: ../configure --prefix=/usr --mandir=/usr/share/man

--infodir=/

sr/share/info --enable-shared --enable-threads=posix

--disable-checking --with-

ystem-zlib --enable-__cxa_atexit --host=i386-redhat-linux

Thread model: posix

gcc version 3.2.2 20030222 (Red Hat Linux 3.2.2-5)

以上显示的就是Redhat linux 9.0里自带的gcc的版本3.2.2。

下面将以一个实例来说明如何使用gcc编译器。例3-1能够帮助大家迅速理解gcc的工作原理,并将其立即运用到实际的项目开发中去。

实例3-1  hello.c­­­­­­­­­­­­­­­­­­­­­­­­­­­­

 


#include

int main (int argc,char **argv) {

printf("Hello Linux\n");

}

要编译这个程序,只要在命令行下执行如下命令:

[david@DAVID david]$ gcc hello.c -o hello

[david@DAVID david]$ ./hello

Hello Linux

这样,gcc 编译器会生成一个名为hello的可执行文件,然后执行./hello就可以看到程序的输出结果了。

命令行中 gcc表示用gcc来编译源程序,-o 选项表示要求编译器输出的可执行文件名为hello ,而hello.c是源程序文件。从程序员的角度看,只需简单地执行一条gcc命令就可以了;但从编译器的角度来看,却需要完成一系列非常繁杂的工作。首先,gcc需要调用预处理程序cpp,由它负责展开在源文件中定义的宏,并向其中插入#include语句所包含的内容;接着,gcc会调用ccl和as将处理后的源代码编译成目标代码;最后,gcc会调用链接程序ld,把生成的目标代码链接成一个可执行程序。

为了更好地理解gcc的工作过程,可以把上述编译过程分成几个步骤单独进行,并观察每步的运行结果。

第一步要进行预编译,使用-E参数可以让gcc在预处理结束后停止编译过程:

[david@DAVID david]$ gcc -E hello.c -o hello.i

此时若查看hello.i文件中的内容,会发现stdio.h的内容确实都插到文件里去了,而且被预处理的宏定义也都作了相应的处理。

# 1 "hello.c"

# 1 ""

# 1 ""

# 1 "hello.c"

# 1 "/usr/include/stdio.h" 1 3

# 28 "/usr/include/stdio.h" 3

# 1 "/usr/include/features.h" 1 3

# 291 "/usr/include/features.h" 3

# 1 "/usr/include/sys/cdefs.h" 1 3

# 292 "/usr/include/features.h" 2 3

# 314 "/usr/include/features.h" 3

# 1 "/usr/include/gnu/stubs.h" 1 3

# 315 "/usr/include/features.h" 2 3

# 29 "/usr/include/stdio.h" 2 3

# 1 "/usr/lib/gcc-lib/i386-redhat-linux/3.2.2/include/stddef.h" 1 3

# 213 "/usr/lib/gcc-lib/i386-redhat-linux/3.2.2/include/stddef.h" 3

typedef unsigned int size_t;

# 35 "/usr/include/stdio.h" 2 3

# 1 "/usr/include/bits/types.h" 1 3

# 28 "/usr/include/bits/types.h" 3

# 1 "/usr/include/bits/wordsize.h" 1 3

# 29 "/usr/include/bits/types.h" 2 3

# 1 "/usr/lib/gcc-lib/i386-redhat-linux/3.2.2/include/stddef.h" 1 3

# 32 "/usr/include/bits/types.h" 2 3

 

"hello.i" 838L, 16453C                         1,1           Top

下一步是将hello.i编译为目标代码,这可以通过使用-c参数来完成:

[david@DAVID david]$ gcc -c hello.i -o hello.o

gcc默认将.i文件看成是预处理后的C语言源代码,因此上述命令将自动跳过预处理步骤而开始执行编译过程,也可以使用-x参数让gcc从指定的步骤开始编译。最后一步是将生成的目标文件链接成可执行文件:

[david@DAVID david]$ gcc hello.o -o hello

在采用模块化的设计思想进行软件开发时,通常整个程序是由多个源文件组成的,相应地就形成了多个编译单元,使用gcc能够很好地管理这些编译单元。假设有一个由david.c和xueer.c两个源文件组成的程序,为了对它们进行编译,并最终生成可执行程序davidxueer,可以使用下面这条命令:

[david@DAVID david]$ gcc david.c xueer.c -o davidxueer

如果同时处理的文件不止一个,gcc仍然会按照预处理、编译和链接的过程依次进行。如果深究起来,上面这条命令大致相当于依次执行如下3条命令:

[david@DAVID david]$ gcc david.c -o david.o

[david@DAVID david]$ gcc  xueer.c -o xueer.o

[david@DAVID david]$ gcc david.o xueer.o -o davidxueer

在编译一个包含许多源文件的工程时,若只用一条gcc命令来完成编译是非常浪费时间的。假设项目中有100个源文件需要编译,并且每个源文件中都包含10 000行代码,如果像上面那样仅用一条gcc命令来完成编译工作,那么gcc需要将每个源文件都重新编译一遍,然后再全部链接起来。很显然,这样浪费的时间相当多,尤其是当用户只是修改了其中某一个文件的时候,完全没有必要将每个文件都重新编译一遍,因为很多已经生成的目标文件是不会改变的。要解决这个问题,关键是要灵活运用gcc,同时还要借助像make这样的工具。关于make,将在第5章作详细的介绍。

3.3  gcc警告提示功能

gcc包含完整的出错检查和警告提示功能,它们可以帮助Linux程序员尽快找到错误代码,从而写出更加专业和优美的代码。先来读读例3-2所示的程序,这段代码写得很糟糕,仔细检查一下不难挑出如下毛病:

●       main函数的返回值被声明为void,但实际上应该是int;

●       使用了GNU语法扩展,即使用long long来声明64位整数,仍不符合ANSI/ISO C语言标准;

●       main函数在终止前没有调用return语句。

实例3-2  bad.c­­­­­­­­­­­­­­­­­­­­­­­­­­­­

 


#include

void main(void)

{

  long long int var = 1;

  printf("It is not standard C code!\n");

}

下面看看gcc是如何帮助程序员来发现这些错误的。当gcc在编译不符合ANSI/ISO C语言标准的源代码时,如果加上了-pedantic选项,那么使用了扩展语法的地方将产生相应的警告信息:

[david@DAVID david]$ gcc -pedantic bad.c -o bad

bad.c: In function 'main':

bad.c:4: warning: ISO C89 does not support 'long long'

bad.c:3: warning: return type of 'main' is not 'int'

需要注意的是,-pedantic编译选项并不能保证被编译程序与ANSI/ISO C标准的完全兼容,它仅仅用来帮助Linux程序员离这个目标越来越近。换句话说,-pedantic选项能够帮助程序员发现一些不符合ANSI/ISO C标准的代码,但不是全部。事实上只有ANSI/ISO C语言标准中要求进行编译器诊断的那些问题才有可能被gcc发现并提出警告。

除了-pedantic之外,gcc还有一些其他编译选项也能够产生有用的警告信息。这些选项大多以-W开头,其中最有价值的当数-Wall了,使用它能够使gcc产生尽可能多的警告信息。例如:

[david@DAVID david]$ gcc -Wall bad.c -o bad

bad.c:3: warning: return type of 'main' is not 'int'

bad.c: In function 'main':

bad.c:4: warning: unused variable 'var'

bad.c:6:2: warning: no newline at end of file

gcc给出的警告信息虽然从严格意义上说不能算作是错误,但很可能成为错误的栖身之所。一个优秀的Linux程序员应该尽量避免产生警告信息,使自己的代码始终保持简洁、优美和健壮的特性。
    在处理警告方面,另一个常用的编译选项是-Werror,它要求gcc将所有的警告当成错误进行处理,这在使用自动编译工具(如make等)时非常有用。如果编译时带上-Werror选项,那么gcc会在所有产生警告的地方停止编译,迫使程序员对自己的代码进行修改。只有当相应的警告信息消除时,才可能将编译过程继续朝前推进。执行情况如下:

[david@DAVID david]$ gcc -Werror bad.c -o bad

cc1: warnings being treated as errors

bad.c: In function 'main':

bad.c:3: warning: return type of 'main' is not 'int'

bad.c:6:2: no newline at end of file

对Linux程序员来讲,gcc给出的警告信息是很有价值的,它们不仅可以帮助程序员写出更加健壮的程序,而且还是跟踪和调试程序的有力工具。建议在用gcc编译源代码时始终带上-Wall选项,并把它逐渐培养成为一种习惯,这对找出常见的隐式编程错误很有帮助。

3.4  库  依  赖

在Linux下使用C语言开发应用程序时,完全不使用第三方函数库的情况是比较少见的,通常来讲都需要借助一个或多个函数库的支持才能够完成相应的功能。从程序员的角度看,函数库实际上就是一些头文件(.h)和库文件(.so或者.a)的集合。虽然Linux下大多数函数都默认将头文件放到/usr/include/目录下,而库文件则放到/usr/lib/目录下,但并不是所有的情况都是这样。正因如此,gcc在编译时必须让编译器知道如何来查找所需要的头文件和库文件。

gcc采用搜索目录的办法来查找所需要的文件,-I选项可以向gcc的头文件搜索路径中添加新的目录。例如,如果在/home/david/include/目录下有编译时所需要的头文件,为了让gcc能够顺利地找到它们,就可以使用-I选项:

[david@DAVID david]$ gcc david.c -I /home/david/include -o david

同样,如果使用了不在标准位置的库文件,那么可以通过-L选项向gcc的库文件搜索路径中添加新的目录。例如,如果在/home/david/lib/目录下有链接时所需要的库文件libdavid.so,为了让gcc能够顺利地找到它,可以使用下面的命令:

[david@DAVID david]$ gcc david.c -L /home/david/lib –ldavid -o david

值得详细解释一下的是-l选项,它指示gcc去连接库文件david.so。Linux下的库文件在命名时有一个约定,那就是应该以lib三个字母开头。由于所有的库文件都遵循了同样的规范,因此在用-l选项指定链接的库文件名时可以省去lib三个字母。也就是说gcc在对-l david进行处理时,会自动去链接名为libdavid.so的文件。

Linux下的库文件分为两大类,分别是动态链接库(通常以.so结尾)和静态链接库(通常以.a结尾),两者的差别仅在于程序执行时所需的代码是在运行时动态加载的,还是在编译时静态加载的。默认情况下,gcc在链接时优先使用动态链接库,只有当动态链接库不存在时才考虑使用静态链接库。如果需要的话可以在编译时加上-static选项,强制使用静态链接库。例如,如果在/home/david/lib/目录下有链接时所需要的库文件libfoo.so和libfoo.a,为了让gcc在链接时只用到静态链接库,可以使用下面的命令:

[david@DAVID david]$ gcc foo.c -L /home/david/lib -static –ldavid -o

david

3.5  gcc代码优化

代码优化指的是编译器通过分析源代码,找出其中尚未达到最优的部分,然后对其重新进行组合,目的是改善程序的执行性能。gcc提供的代码优化功能非常强大,它通过编译选项-On来控制优化代码的生成,其中n是一个代表优化级别的整数。对于不同版本的gcc来讲,n的取值范围及其对应的优化效果可能并不完全相同,比较典型的范围是从0变化到2或3。

编译时使用选项-O可以告诉gcc同时减小代码的长度和执行时间,其效果等价于-O1。在这一级别上能够进行的优化类型虽然取决于目标处理器,但一般都会包括线程跳转(Thread Jump)和延迟退栈(Deferred Stack Pops)两种优化。

选项-O2告诉gcc除了完成所有-O1级别的优化之外,同时还要进行一些额外的调整工作,如处理器指令调度等。

选项-O3则除了完成所有-O2级别的优化之外,还包括循环展开和其他一些与处理器特性相关的优化工作。

通常来说,数字越大优化的等级越高,同时也就意味着程序的运行速度越快。许多Linux程序员都喜欢使用-O2选项,因为它在优化长度、编译时间和代码大小之间取得了一个比较理想的平衡点。

下面通过具体实例来感受一下gcc的代码优化功能,所用程序如例3-3所示。

实例3-3  count.c­­­­­­­­­­­­­­­­­­­­­­­­­­­­

 


#include

 int main(void)

{  double counter;

   double result;

   double temp;

   for (counter = 0; counter < 4000.0 * 4000.0 * 4000.0  / 20.0 + 2030;   

counter += (5 - 3 +2 + 1 ) / 4)

     {  temp = counter / 1239;

        result  = counter;   

       } 

   printf("Result is %lf\n", result); 

   return 0;

}

首先不加任何优化选项进行编译:

[david@DAVID david]$ gcc -Wall count.c -o count

借助Linux提供的time命令,可以大致统计出该程序在运行时所需要的时间:

[david@DAVID david]$ time ./count

Result is 3200002029.000000

real    1m59.357s

user    1m59.140s

sys     0m0.050s

接下来使用优化选项来对代码进行优化处理:

[david@DAVID david]$ gcc -Wall count.c -o count2

在同样的条件下再次测试一下运行时间:

[david@DAVID david]$ time ./count2

Result is 3200002029.000000

real    0m26.573s

user    0m26.540s

sys     0m0.010s

对比两次执行的输出结果不难看出,程序的性能的确得到了很大幅度的改善,由原来的1分59秒缩短到了26秒。这个例子是专门针对gcc的优化功能而设计的,因此优化前后程序的执行速度发生了很大的改变。尽管gcc的代码优化功能非常强大,但作为一名优秀的Linux程序员,首先还是要力求能够手工编写出高质量的代码。如果编写的代码简短,并且逻辑性强,编译器就不会做更多的工作,甚至根本用不着优化。

优化虽然能够给程序带来更好的执行性能,但在如下一些场合中应该避免优化代码。

●       程序开发的时候:优化等级越高,消耗在编译上的时间就越长,因此在开发的时候最好不要使用优化选项,只有到软件发行或开发结束的时候,才考虑对最终生成的代码进行优化。

●       资源受限的时候:一些优化选项会增加可执行代码的体积,如果程序在运行时能够申请到的内存资源非常紧张(如一些实时嵌入式设备),那就不要对代码进行优化,因为由这带来的负面影响可能会产生非常严重的后果。

●       跟踪调试的时候:在对代码进行优化的时候,某些代码可能会被删除或改写,或者为了取得更佳的性能而进行重组,从而使跟踪和调试变得异常困难。

3.6  加    速

在将源代码变成可执行文件的过程中,需要经过许多中间步骤,包含预处理、编译、汇编和连接。这些过程实际上是由不同的程序负责完成的。大多数情况下gcc可以为Linux程序员完成所有的后台工作,自动调用相应程序进行处理。

这样做有一个很明显的缺点,就是gcc在处理每一个源文件时,最终都需要生成好几个临时文件才能完成相应的工作,从而无形中导致处理速度变慢。例如,gcc在处理一个源文件时,可能需要一个临时文件来保存预处理的输出,一个临时文件来保存编译器的输出,一个临时文件来保存汇编器的输出,而读写这些临时文件显然需要耗费一定的时间。当软件项目变得非常庞大的时候,花费在这上面的代价可能会变得很大。

解决的办法是,使用Linux提供的一种更加高效的通信方式—— 管道。它可以用来同时连接两个程序,其中一个程序的输出将直接作为另一个程序的输入,这样就可以避免使用临时文件,但编译时却需要消耗更多的内存。

注意:

在编译过程中使用管道是由gcc的-pipe选项决定的。下面的这条命令就是借助gcc的管道功能来提高编译速度的:

[david@DAVID david]$ gcc -pipe david.c -o david

在编译小型工程时使用管道,编译时间上的差异可能还不是很明显,但在源代码非常多的大型工程中,差异将变得非常明显。

3.7  gcc常用选项

gcc作为Linux下C/C++重要的编译环境,功能强大,编译选项繁多。为了方便大家日后编译方便,在此将常用的选项及说明罗列出来,见表3-2。

表3-2  gcc的常用选项

选  项  名

作    用

-c

通知gcc取消连接步骤,即编译源码并在最后生成目标文件

-Dmacro

定义指定的宏,使它能够通过源码中的#ifdef进行检验

-E

不经过编译预处理程序的输出而输送至标准输出

-g3

获得有关调试程序的详细信息,它不能与-o选项联合使用

-Idirectory

在包含文件搜索路径的起点处添加指定目录

-llibrary

提示连接程序在创建最终可执行文件时包含指定的库

-O、-O2、-O3

将优化状态打开,该选项不能与-g选项联合使用

-S

要求编译程序生成来自源代码的汇编程序输出

-v

启动所有警报

.h

预处理文件(标头文件)

-Wall

在发生警报时取消编译操作,即将警报看作是错误

-w

禁止所有的报警

 

3.8  gcc的错误类型及对策

如果gcc编译器发现源程序中有错误,就无法继续进行,也无法生成最终的可执行文件。为了便于修改,gcc给出错误信息,必须对这些错误信息逐个进行分析、处理,并修改相应的源代码,才能保证源代码的正确编译连接。.gcc给出的错误信息一般可以分为四大类,下面我们分别讨论其产生的原因和对策。

●       第一类:C语法错误

错误信息:文件source.c中第n行有语法错误(syntex errror)。这种类型的错误,一般都是C语言的语法错误,应该仔细检查源代码文件中第n行及该行之前的程序,有时也需要对该文件所包含的头文件进行检查。有些情况下,一个很简单的语法错误,gcc会给出一大堆错误,我们最主要的是要保持清醒的头脑,不要被其吓倒,必要的时候再参考一下C语言的基本教材。在这里推荐一本由Andrew Koenig写的《C 陷阱与缺陷》(此书已由人民邮电出版社翻译出版),说得夸张一点就是此书可以帮助你减少C代码和初级C++代码中的90%的bug。

●       第二类:头文件错误

错误信息:找不到头文件head.h(Can not find include file head.h)。这类错误是源代码文件中包含的头文件有问题,可能的原因有头文件名错误、指定的头文件所在目录名错误等,也可能是错误地使用了双引号和尖括号。

●       第三类:档案库错误

错误信息:连接程序找不到所需的函数库,例如:

ld: -lm: No such file or directory

这类错误是与目标文件相连接的函数库有错误,可能的原因是函数库名错误、指定的函数库所在目录名称错误等。检查的方法是使用find命令在可能的目录中寻找相应的函数库名,确定档案库及目录的名称并修改程序中及编译选项中的名称。

●       第四类:未定义符号

错误信息:有未定义的符号(Undefined symbol)。这类错误是在连接过程中出现的,可能有两种原因:一是用户自己定义的函数或者全局变量所在源代码文件,没有被编译、连接,或者干脆还没有定义,这需要用户根据实际情况修改源程序,给出全局变量或者函数的定义体;二是未定义的符号是一个标准的库函数,在源程序中使用了该库函数,而连接过程中还没有给定相应的函数库的名称,或者是该档案库的目录名称有问题,这时需要使用档案库维护命令ar检查我们需要的库函数到底位于哪一个函数库中,确定之后,修改gcc连接选项中的-l和-L项。

排除编译、连接过程中的错误,应该说只是程序设计中最简单、最基本的一个步骤,可以说只是开了个头。这个过程中的错误,只是我们在使用C语言描述一个算法中所产生的错误,是比较容易排除的。我们写一个程序,到编译、连接通过为止,应该说刚刚开始,程序在运行过程中所出现的问题,是算法设计有问题,说得严重点儿是对问题的认识和理解不够,还需要更加深入地测试、调试和修改。一个程序,稍为复杂的程序,往往要经过多次的编译、连接、测试和修改。 gcc是在Linux下开发程序时必须掌握的工具之一。

以上对gcc作了一个简要的介绍,主要讲述了如何使用gcc编译程序、产生警告信息、和加快gcc的编译速度。对所有希望早日跨入Linux开发者行列的人来说,gcc就是成为一名优秀的Linux程序员的起跑线。关于调试 C 程序的更多信息请看第4章关于gdb的内容。


开放、自由和灵活是Linux的魅力所在,而这一点在gcc上的体现就是程序员通过它能够更好地控制整个编译过程。

在使用gcc编译程序时,编译过程可以细分为4个阶段:

●       预处理(Pre-Processing)

●       编译(Compiling)

●       汇编(Assembling)

●       链接(Linking)

Linux程序员可以根据自己的需要让gcc在编译的任何阶段结束,检查或使用编译器在该阶段的输出信息,或者对最后生成的二进制文件进行控制,以便通过加入不同数量和种类的调试代码来为今后的调试做好准备。与其他常用的编译器一样,gcc也提供了灵活而强大的代码优化功能,利用它可以生成执行效率更高的代码。

gcc提供了30多条警告信息和3个警告级别,使用它们有助于增强程序的稳定性和可移植性。此外,gcc还对标准的C和C++语言进行了大量的扩展,提高了程序的执行效率,有助于编译器进行代码优化,能够减轻编程的工作量。

3.2  使 用 gcc

gcc的版本可以使用如下gcc –v命令查看:

[david@DAVID david]$ gcc -v

Reading specs from /usr/lib/gcc-lib/i386-redhat-linux/3.2.2/specs

Configured with: ../configure --prefix=/usr --mandir=/usr/share/man

--infodir=/

sr/share/info --enable-shared --enable-threads=posix

--disable-checking --with-

ystem-zlib --enable-__cxa_atexit --host=i386-redhat-linux

Thread model: posix

gcc version 3.2.2 20030222 (Red Hat Linux 3.2.2-5)

以上显示的就是Redhat linux 9.0里自带的gcc的版本3.2.2。

下面将以一个实例来说明如何使用gcc编译器。例3-1能够帮助大家迅速理解gcc的工作原理,并将其立即运用到实际的项目开发中去。

实例3-1  hello.c­­­­­­­­­­­­­­­­­­­­­­­­­­­­

 


#include

int main (int argc,char **argv) {

printf("Hello Linux\n");

}

要编译这个程序,只要在命令行下执行如下命令:

[david@DAVID david]$ gcc hello.c -o hello

[david@DAVID david]$ ./hello

Hello Linux

这样,gcc 编译器会生成一个名为hello的可执行文件,然后执行./hello就可以看到程序的输出结果了。

命令行中 gcc表示用gcc来编译源程序,-o 选项表示要求编译器输出的可执行文件名为hello ,而hello.c是源程序文件。从程序员的角度看,只需简单地执行一条gcc命令就可以了;但从编译器的角度来看,却需要完成一系列非常繁杂的工作。首先,gcc需要调用预处理程序cpp,由它负责展开在源文件中定义的宏,并向其中插入#include语句所包含的内容;接着,gcc会调用ccl和as将处理后的源代码编译成目标代码;最后,gcc会调用链接程序ld,把生成的目标代码链接成一个可执行程序。

为了更好地理解gcc的工作过程,可以把上述编译过程分成几个步骤单独进行,并观察每步的运行结果。

第一步要进行预编译,使用-E参数可以让gcc在预处理结束后停止编译过程:

[david@DAVID david]$ gcc -E hello.c -o hello.i

此时若查看hello.i文件中的内容,会发现stdio.h的内容确实都插到文件里去了,而且被预处理的宏定义也都作了相应的处理。

# 1 "hello.c"

# 1 ""

# 1 ""

# 1 "hello.c"

# 1 "/usr/include/stdio.h" 1 3

# 28 "/usr/include/stdio.h" 3

# 1 "/usr/include/features.h" 1 3

# 291 "/usr/include/features.h" 3

# 1 "/usr/include/sys/cdefs.h" 1 3

# 292 "/usr/include/features.h" 2 3

# 314 "/usr/include/features.h" 3

# 1 "/usr/include/gnu/stubs.h" 1 3

# 315 "/usr/include/features.h" 2 3

# 29 "/usr/include/stdio.h" 2 3

# 1 "/usr/lib/gcc-lib/i386-redhat-linux/3.2.2/include/stddef.h" 1 3

# 213 "/usr/lib/gcc-lib/i386-redhat-linux/3.2.2/include/stddef.h" 3

typedef unsigned int size_t;

# 35 "/usr/include/stdio.h" 2 3

# 1 "/usr/include/bits/types.h" 1 3

# 28 "/usr/include/bits/types.h" 3

# 1 "/usr/include/bits/wordsize.h" 1 3

# 29 "/usr/include/bits/types.h" 2 3

# 1 "/usr/lib/gcc-lib/i386-redhat-linux/3.2.2/include/stddef.h" 1 3

# 32 "/usr/include/bits/types.h" 2 3

 

"hello.i" 838L, 16453C                         1,1           Top

下一步是将hello.i编译为目标代码,这可以通过使用-c参数来完成:

[david@DAVID david]$ gcc -c hello.i -o hello.o

gcc默认将.i文件看成是预处理后的C语言源代码,因此上述命令将自动跳过预处理步骤而开始执行编译过程,也可以使用-x参数让gcc从指定的步骤开始编译。最后一步是将生成的目标文件链接成可执行文件:

[david@DAVID david]$ gcc hello.o -o hello

在采用模块化的设计思想进行软件开发时,通常整个程序是由多个源文件组成的,相应地就形成了多个编译单元,使用gcc能够很好地管理这些编译单元。假设有一个由david.c和xueer.c两个源文件组成的程序,为了对它们进行编译,并最终生成可执行程序davidxueer,可以使用下面这条命令:

[david@DAVID david]$ gcc david.c xueer.c -o davidxueer

如果同时处理的文件不止一个,gcc仍然会按照预处理、编译和链接的过程依次进行。如果深究起来,上面这条命令大致相当于依次执行如下3条命令:

[david@DAVID david]$ gcc david.c -o david.o

[david@DAVID david]$ gcc  xueer.c -o xueer.o

[david@DAVID david]$ gcc david.o xueer.o -o davidxueer

在编译一个包含许多源文件的工程时,若只用一条gcc命令来完成编译是非常浪费时间的。假设项目中有100个源文件需要编译,并且每个源文件中都包含10 000行代码,如果像上面那样仅用一条gcc命令来完成编译工作,那么gcc需要将每个源文件都重新编译一遍,然后再全部链接起来。很显然,这样浪费的时间相当多,尤其是当用户只是修改了其中某一个文件的时候,完全没有必要将每个文件都重新编译一遍,因为很多已经生成的目标文件是不会改变的。要解决这个问题,关键是要灵活运用gcc,同时还要借助像make这样的工具。关于make,将在第5章作详细的介绍。

3.3  gcc警告提示功能

gcc包含完整的出错检查和警告提示功能,它们可以帮助Linux程序员尽快找到错误代码,从而写出更加专业和优美的代码。先来读读例3-2所示的程序,这段代码写得很糟糕,仔细检查一下不难挑出如下毛病:

●       main函数的返回值被声明为void,但实际上应该是int;

●       使用了GNU语法扩展,即使用long long来声明64位整数,仍不符合ANSI/ISO C语言标准;

●       main函数在终止前没有调用return语句。

实例3-2  bad.c­­­­­­­­­­­­­­­­­­­­­­­­­­­­

 


#include

void main(void)

{

  long long int var = 1;

  printf("It is not standard C code!\n");

}

下面看看gcc是如何帮助程序员来发现这些错误的。当gcc在编译不符合ANSI/ISO C语言标准的源代码时,如果加上了-pedantic选项,那么使用了扩展语法的地方将产生相应的警告信息:

[david@DAVID david]$ gcc -pedantic bad.c -o bad

bad.c: In function 'main':

bad.c:4: warning: ISO C89 does not support 'long long'

bad.c:3: warning: return type of 'main' is not 'int'

需要注意的是,-pedantic编译选项并不能保证被编译程序与ANSI/ISO C标准的完全兼容,它仅仅用来帮助Linux程序员离这个目标越来越近。换句话说,-pedantic选项能够帮助程序员发现一些不符合ANSI/ISO C标准的代码,但不是全部。事实上只有ANSI/ISO C语言标准中要求进行编译器诊断的那些问题才有可能被gcc发现并提出警告。

除了-pedantic之外,gcc还有一些其他编译选项也能够产生有用的警告信息。这些选项大多以-W开头,其中最有价值的当数-Wall了,使用它能够使gcc产生尽可能多的警告信息。例如:

[david@DAVID david]$ gcc -Wall bad.c -o bad

bad.c:3: warning: return type of 'main' is not 'int'

bad.c: In function 'main':

bad.c:4: warning: unused variable 'var'

bad.c:6:2: warning: no newline at end of file

gcc给出的警告信息虽然从严格意义上说不能算作是错误,但很可能成为错误的栖身之所。一个优秀的Linux程序员应该尽量避免产生警告信息,使自己的代码始终保持简洁、优美和健壮的特性。
    在处理警告方面,另一个常用的编译选项是-Werror,它要求gcc将所有的警告当成错误进行处理,这在使用自动编译工具(如make等)时非常有用。如果编译时带上-Werror选项,那么gcc会在所有产生警告的地方停止编译,迫使程序员对自己的代码进行修改。只有当相应的警告信息消除时,才可能将编译过程继续朝前推进。执行情况如下:

[david@DAVID david]$ gcc -Werror bad.c -o bad

cc1: warnings being treated as errors

bad.c: In function 'main':

bad.c:3: warning: return type of 'main' is not 'int'

bad.c:6:2: no newline at end of file

对Linux程序员来讲,gcc给出的警告信息是很有价值的,它们不仅可以帮助程序员写出更加健壮的程序,而且还是跟踪和调试程序的有力工具。建议在用gcc编译源代码时始终带上-Wall选项,并把它逐渐培养成为一种习惯,这对找出常见的隐式编程错误很有帮助。

3.4  库  依  赖

在Linux下使用C语言开发应用程序时,完全不使用第三方函数库的情况是比较少见的,通常来讲都需要借助一个或多个函数库的支持才能够完成相应的功能。从程序员的角度看,函数库实际上就是一些头文件(.h)和库文件(.so或者.a)的集合。虽然Linux下大多数函数都默认将头文件放到/usr/include/目录下,而库文件则放到/usr/lib/目录下,但并不是所有的情况都是这样。正因如此,gcc在编译时必须让编译器知道如何来查找所需要的头文件和库文件。

gcc采用搜索目录的办法来查找所需要的文件,-I选项可以向gcc的头文件搜索路径中添加新的目录。例如,如果在/home/david/include/目录下有编译时所需要的头文件,为了让gcc能够顺利地找到它们,就可以使用-I选项:

[david@DAVID david]$ gcc david.c -I /home/david/include -o david

同样,如果使用了不在标准位置的库文件,那么可以通过-L选项向gcc的库文件搜索路径中添加新的目录。例如,如果在/home/david/lib/目录下有链接时所需要的库文件libdavid.so,为了让gcc能够顺利地找到它,可以使用下面的命令:

[david@DAVID david]$ gcc david.c -L /home/david/lib –ldavid -o david

值得详细解释一下的是-l选项,它指示gcc去连接库文件david.so。Linux下的库文件在命名时有一个约定,那就是应该以lib三个字母开头。由于所有的库文件都遵循了同样的规范,因此在用-l选项指定链接的库文件名时可以省去lib三个字母。也就是说gcc在对-l david进行处理时,会自动去链接名为libdavid.so的文件。

Linux下的库文件分为两大类,分别是动态链接库(通常以.so结尾)和静态链接库(通常以.a结尾),两者的差别仅在于程序执行时所需的代码是在运行时动态加载的,还是在编译时静态加载的。默认情况下,gcc在链接时优先使用动态链接库,只有当动态链接库不存在时才考虑使用静态链接库。如果需要的话可以在编译时加上-static选项,强制使用静态链接库。例如,如果在/home/david/lib/目录下有链接时所需要的库文件libfoo.so和libfoo.a,为了让gcc在链接时只用到静态链接库,可以使用下面的命令:

[david@DAVID david]$ gcc foo.c -L /home/david/lib -static –ldavid -o

david

3.5  gcc代码优化

代码优化指的是编译器通过分析源代码,找出其中尚未达到最优的部分,然后对其重新进行组合,目的是改善程序的执行性能。gcc提供的代码优化功能非常强大,它通过编译选项-On来控制优化代码的生成,其中n是一个代表优化级别的整数。对于不同版本的gcc来讲,n的取值范围及其对应的优化效果可能并不完全相同,比较典型的范围是从0变化到2或3。

编译时使用选项-O可以告诉gcc同时减小代码的长度和执行时间,其效果等价于-O1。在这一级别上能够进行的优化类型虽然取决于目标处理器,但一般都会包括线程跳转(Thread Jump)和延迟退栈(Deferred Stack Pops)两种优化。

选项-O2告诉gcc除了完成所有-O1级别的优化之外,同时还要进行一些额外的调整工作,如处理器指令调度等。

选项-O3则除了完成所有-O2级别的优化之外,还包括循环展开和其他一些与处理器特性相关的优化工作。

通常来说,数字越大优化的等级越高,同时也就意味着程序的运行速度越快。许多Linux程序员都喜欢使用-O2选项,因为它在优化长度、编译时间和代码大小之间取得了一个比较理想的平衡点。

下面通过具体实例来感受一下gcc的代码优化功能,所用程序如例3-3所示。

实例3-3  count.c­­­­­­­­­­­­­­­­­­­­­­­­­­­­

 


#include

 int main(void)

{  double counter;

   double result;

   double temp;

   for (counter = 0; counter < 4000.0 * 4000.0 * 4000.0  / 20.0 + 2030;   

counter += (5 - 3 +2 + 1 ) / 4)

     {  temp = counter / 1239;

        result  = counter;   

       } 

   printf("Result is %lf\n", result); 

   return 0;

}

首先不加任何优化选项进行编译:

[david@DAVID david]$ gcc -Wall count.c -o count

借助Linux提供的time命令,可以大致统计出该程序在运行时所需要的时间:

[david@DAVID david]$ time ./count

Result is 3200002029.000000

real    1m59.357s

user    1m59.140s

sys     0m0.050s

接下来使用优化选项来对代码进行优化处理:

[david@DAVID david]$ gcc -Wall count.c -o count2

在同样的条件下再次测试一下运行时间:

[david@DAVID david]$ time ./count2

Result is 3200002029.000000

real    0m26.573s

user    0m26.540s

sys     0m0.010s

对比两次执行的输出结果不难看出,程序的性能的确得到了很大幅度的改善,由原来的1分59秒缩短到了26秒。这个例子是专门针对gcc的优化功能而设计的,因此优化前后程序的执行速度发生了很大的改变。尽管gcc的代码优化功能非常强大,但作为一名优秀的Linux程序员,首先还是要力求能够手工编写出高质量的代码。如果编写的代码简短,并且逻辑性强,编译器就不会做更多的工作,甚至根本用不着优化。

优化虽然能够给程序带来更好的执行性能,但在如下一些场合中应该避免优化代码。

●       程序开发的时候:优化等级越高,消耗在编译上的时间就越长,因此在开发的时候最好不要使用优化选项,只有到软件发行或开发结束的时候,才考虑对最终生成的代码进行优化。

●       资源受限的时候:一些优化选项会增加可执行代码的体积,如果程序在运行时能够申请到的内存资源非常紧张(如一些实时嵌入式设备),那就不要对代码进行优化,因为由这带来的负面影响可能会产生非常严重的后果。

●       跟踪调试的时候:在对代码进行优化的时候,某些代码可能会被删除或改写,或者为了取得更佳的性能而进行重组,从而使跟踪和调试变得异常困难。

3.6  加    速

在将源代码变成可执行文件的过程中,需要经过许多中间步骤,包含预处理、编译、汇编和连接。这些过程实际上是由不同的程序负责完成的。大多数情况下gcc可以为Linux程序员完成所有的后台工作,自动调用相应程序进行处理。

这样做有一个很明显的缺点,就是gcc在处理每一个源文件时,最终都需要生成好几个临时文件才能完成相应的工作,从而无形中导致处理速度变慢。例如,gcc在处理一个源文件时,可能需要一个临时文件来保存预处理的输出,一个临时文件来保存编译器的输出,一个临时文件来保存汇编器的输出,而读写这些临时文件显然需要耗费一定的时间。当软件项目变得非常庞大的时候,花费在这上面的代价可能会变得很大。

解决的办法是,使用Linux提供的一种更加高效的通信方式—— 管道。它可以用来同时连接两个程序,其中一个程序的输出将直接作为另一个程序的输入,这样就可以避免使用临时文件,但编译时却需要消耗更多的内存。

注意:

在编译过程中使用管道是由gcc的-pipe选项决定的。下面的这条命令就是借助gcc的管道功能来提高编译速度的:

[david@DAVID david]$ gcc -pipe david.c -o david

在编译小型工程时使用管道,编译时间上的差异可能还不是很明显,但在源代码非常多的大型工程中,差异将变得非常明显。

3.7  gcc常用选项

gcc作为Linux下C/C++重要的编译环境,功能强大,编译选项繁多。为了方便大家日后编译方便,在此将常用的选项及说明罗列出来,见表3-2。

表3-2  gcc的常用选项

选  项  名

作    用

-c

通知gcc取消连接步骤,即编译源码并在最后生成目标文件

-Dmacro

定义指定的宏,使它能够通过源码中的#ifdef进行检验

-E

不经过编译预处理程序的输出而输送至标准输出

-g3

获得有关调试程序的详细信息,它不能与-o选项联合使用

-Idirectory

在包含文件搜索路径的起点处添加指定目录

-llibrary

提示连接程序在创建最终可执行文件时包含指定的库

-O、-O2、-O3

将优化状态打开,该选项不能与-g选项联合使用

-S

要求编译程序生成来自源代码的汇编程序输出

-v

启动所有警报

.h

预处理文件(标头文件)

-Wall

在发生警报时取消编译操作,即将警报看作是错误

-w

禁止所有的报警

 

3.8  gcc的错误类型及对策

如果gcc编译器发现源程序中有错误,就无法继续进行,也无法生成最终的可执行文件。为了便于修改,gcc给出错误信息,必须对这些错误信息逐个进行分析、处理,并修改相应的源代码,才能保证源代码的正确编译连接。.gcc给出的错误信息一般可以分为四大类,下面我们分别讨论其产生的原因和对策。

●       第一类:C语法错误

错误信息:文件source.c中第n行有语法错误(syntex errror)。这种类型的错误,一般都是C语言的语法错误,应该仔细检查源代码文件中第n行及该行之前的程序,有时也需要对该文件所包含的头文件进行检查。有些情况下,一个很简单的语法错误,gcc会给出一大堆错误,我们最主要的是要保持清醒的头脑,不要被其吓倒,必要的时候再参考一下C语言的基本教材。在这里推荐一本由Andrew Koenig写的《C 陷阱与缺陷》(此书已由人民邮电出版社翻译出版),说得夸张一点就是此书可以帮助你减少C代码和初级C++代码中的90%的bug。

●       第二类:头文件错误

错误信息:找不到头文件head.h(Can not find include file head.h)。这类错误是源代码文件中包含的头文件有问题,可能的原因有头文件名错误、指定的头文件所在目录名错误等,也可能是错误地使用了双引号和尖括号。

●       第三类:档案库错误

错误信息:连接程序找不到所需的函数库,例如:

ld: -lm: No such file or directory

这类错误是与目标文件相连接的函数库有错误,可能的原因是函数库名错误、指定的函数库所在目录名称错误等。检查的方法是使用find命令在可能的目录中寻找相应的函数库名,确定档案库及目录的名称并修改程序中及编译选项中的名称。

●       第四类:未定义符号

错误信息:有未定义的符号(Undefined symbol)。这类错误是在连接过程中出现的,可能有两种原因:一是用户自己定义的函数或者全局变量所在源代码文件,没有被编译、连接,或者干脆还没有定义,这需要用户根据实际情况修改源程序,给出全局变量或者函数的定义体;二是未定义的符号是一个标准的库函数,在源程序中使用了该库函数,而连接过程中还没有给定相应的函数库的名称,或者是该档案库的目录名称有问题,这时需要使用档案库维护命令ar检查我们需要的库函数到底位于哪一个函数库中,确定之后,修改gcc连接选项中的-l和-L项。

排除编译、连接过程中的错误,应该说只是程序设计中最简单、最基本的一个步骤,可以说只是开了个头。这个过程中的错误,只是我们在使用C语言描述一个算法中所产生的错误,是比较容易排除的。我们写一个程序,到编译、连接通过为止,应该说刚刚开始,程序在运行过程中所出现的问题,是算法设计有问题,说得严重点儿是对问题的认识和理解不够,还需要更加深入地测试、调试和修改。一个程序,稍为复杂的程序,往往要经过多次的编译、连接、测试和修改。 gcc是在Linux下开发程序时必须掌握的工具之一。

以上对gcc作了一个简要的介绍,主要讲述了如何使用gcc编译程序、产生警告信息、和加快gcc的编译速度。对所有希望早日跨入Linux开发者行列的人来说,gcc就是成为一名优秀的Linux程序员的起跑线。关于调试 C 程序的更多信息请看第4章关于gdb的内容。


开放、自由和灵活是Linux的魅力所在,而这一点在gcc上的体现就是程序员通过它能够更好地控制整个编译过程。

在使用gcc编译程序时,编译过程可以细分为4个阶段:

●       预处理(Pre-Processing)

●       编译(Compiling)

●       汇编(Assembling)

●       链接(Linking)

Linux程序员可以根据自己的需要让gcc在编译的任何阶段结束,检查或使用编译器在该阶段的输出信息,或者对最后生成的二进制文件进行控制,以便通过加入不同数量和种类的调试代码来为今后的调试做好准备。与其他常用的编译器一样,gcc也提供了灵活而强大的代码优化功能,利用它可以生成执行效率更高的代码。

gcc提供了30多条警告信息和3个警告级别,使用它们有助于增强程序的稳定性和可移植性。此外,gcc还对标准的C和C++语言进行了大量的扩展,提高了程序的执行效率,有助于编译器进行代码优化,能够减轻编程的工作量。

3.2  使 用 gcc

gcc的版本可以使用如下gcc –v命令查看:

[david@DAVID david]$ gcc -v

Reading specs from /usr/lib/gcc-lib/i386-redhat-linux/3.2.2/specs

Configured with: ../configure --prefix=/usr --mandir=/usr/share/man

--infodir=/

sr/share/info --enable-shared --enable-threads=posix

--disable-checking --with-

ystem-zlib --enable-__cxa_atexit --host=i386-redhat-linux

Thread model: posix

gcc version 3.2.2 20030222 (Red Hat Linux 3.2.2-5)

以上显示的就是Redhat linux 9.0里自带的gcc的版本3.2.2。

下面将以一个实例来说明如何使用gcc编译器。例3-1能够帮助大家迅速理解gcc的工作原理,并将其立即运用到实际的项目开发中去。

实例3-1  hello.c­­­­­­­­­­­­­­­­­­­­­­­­­­­­

 


#include

int main (int argc,char **argv) {

printf("Hello Linux\n");

}

要编译这个程序,只要在命令行下执行如下命令:

[david@DAVID david]$ gcc hello.c -o hello

[david@DAVID david]$ ./hello

Hello Linux

这样,gcc 编译器会生成一个名为hello的可执行文件,然后执行./hello就可以看到程序的输出结果了。

命令行中 gcc表示用gcc来编译源程序,-o 选项表示要求编译器输出的可执行文件名为hello ,而hello.c是源程序文件。从程序员的角度看,只需简单地执行一条gcc命令就可以了;但从编译器的角度来看,却需要完成一系列非常繁杂的工作。首先,gcc需要调用预处理程序cpp,由它负责展开在源文件中定义的宏,并向其中插入#include语句所包含的内容;接着,gcc会调用ccl和as将处理后的源代码编译成目标代码;最后,gcc会调用链接程序ld,把生成的目标代码链接成一个可执行程序。

为了更好地理解gcc的工作过程,可以把上述编译过程分成几个步骤单独进行,并观察每步的运行结果。

第一步要进行预编译,使用-E参数可以让gcc在预处理结束后停止编译过程:

[david@DAVID david]$ gcc -E hello.c -o hello.i

此时若查看hello.i文件中的内容,会发现stdio.h的内容确实都插到文件里去了,而且被预处理的宏定义也都作了相应的处理。

# 1 "hello.c"

# 1 ""

# 1 ""

# 1 "hello.c"

# 1 "/usr/include/stdio.h" 1 3

# 28 "/usr/include/stdio.h" 3

# 1 "/usr/include/features.h" 1 3

# 291 "/usr/include/features.h" 3

# 1 "/usr/include/sys/cdefs.h" 1 3

# 292 "/usr/include/features.h" 2 3

# 314 "/usr/include/features.h" 3

# 1 "/usr/include/gnu/stubs.h" 1 3

# 315 "/usr/include/features.h" 2 3

# 29 "/usr/include/stdio.h" 2 3

# 1 "/usr/lib/gcc-lib/i386-redhat-linux/3.2.2/include/stddef.h" 1 3

# 213 "/usr/lib/gcc-lib/i386-redhat-linux/3.2.2/include/stddef.h" 3

typedef unsigned int size_t;

# 35 "/usr/include/stdio.h" 2 3

# 1 "/usr/include/bits/types.h" 1 3

# 28 "/usr/include/bits/types.h" 3

# 1 "/usr/include/bits/wordsize.h" 1 3

# 29 "/usr/include/bits/types.h" 2 3

# 1 "/usr/lib/gcc-lib/i386-redhat-linux/3.2.2/include/stddef.h" 1 3

# 32 "/usr/include/bits/types.h" 2 3

 

"hello.i" 838L, 16453C                         1,1           Top

下一步是将hello.i编译为目标代码,这可以通过使用-c参数来完成:

[david@DAVID david]$ gcc -c hello.i -o hello.o

gcc默认将.i文件看成是预处理后的C语言源代码,因此上述命令将自动跳过预处理步骤而开始执行编译过程,也可以使用-x参数让gcc从指定的步骤开始编译。最后一步是将生成的目标文件链接成可执行文件:

[david@DAVID david]$ gcc hello.o -o hello

在采用模块化的设计思想进行软件开发时,通常整个程序是由多个源文件组成的,相应地就形成了多个编译单元,使用gcc能够很好地管理这些编译单元。假设有一个由david.c和xueer.c两个源文件组成的程序,为了对它们进行编译,并最终生成可执行程序davidxueer,可以使用下面这条命令:

[david@DAVID david]$ gcc david.c xueer.c -o davidxueer

如果同时处理的文件不止一个,gcc仍然会按照预处理、编译和链接的过程依次进行。如果深究起来,上面这条命令大致相当于依次执行如下3条命令:

[david@DAVID david]$ gcc david.c -o david.o

[david@DAVID david]$ gcc  xueer.c -o xueer.o

[david@DAVID david]$ gcc david.o xueer.o -o davidxueer

在编译一个包含许多源文件的工程时,若只用一条gcc命令来完成编译是非常浪费时间的。假设项目中有100个源文件需要编译,并且每个源文件中都包含10 000行代码,如果像上面那样仅用一条gcc命令来完成编译工作,那么gcc需要将每个源文件都重新编译一遍,然后再全部链接起来。很显然,这样浪费的时间相当多,尤其是当用户只是修改了其中某一个文件的时候,完全没有必要将每个文件都重新编译一遍,因为很多已经生成的目标文件是不会改变的。要解决这个问题,关键是要灵活运用gcc,同时还要借助像make这样的工具。关于make,将在第5章作详细的介绍。

3.3  gcc警告提示功能

gcc包含完整的出错检查和警告提示功能,它们可以帮助Linux程序员尽快找到错误代码,从而写出更加专业和优美的代码。先来读读例3-2所示的程序,这段代码写得很糟糕,仔细检查一下不难挑出如下毛病:

●       main函数的返回值被声明为void,但实际上应该是int;

●       使用了GNU语法扩展,即使用long long来声明64位整数,仍不符合ANSI/ISO C语言标准;

●       main函数在终止前没有调用return语句。

实例3-2  bad.c­­­­­­­­­­­­­­­­­­­­­­­­­­­­

 


#include

void main(void)

{

  long long int var = 1;

  printf("It is not standard C code!\n");

}

下面看看gcc是如何帮助程序员来发现这些错误的。当gcc在编译不符合ANSI/ISO C语言标准的源代码时,如果加上了-pedantic选项,那么使用了扩展语法的地方将产生相应的警告信息:

[david@DAVID david]$ gcc -pedantic bad.c -o bad

bad.c: In function 'main':

bad.c:4: warning: ISO C89 does not support 'long long'

bad.c:3: warning: return type of 'main' is not 'int'

需要注意的是,-pedantic编译选项并不能保证被编译程序与ANSI/ISO C标准的完全兼容,它仅仅用来帮助Linux程序员离这个目标越来越近。换句话说,-pedantic选项能够帮助程序员发现一些不符合ANSI/ISO C标准的代码,但不是全部。事实上只有ANSI/ISO C语言标准中要求进行编译器诊断的那些问题才有可能被gcc发现并提出警告。

除了-pedantic之外,gcc还有一些其他编译选项也能够产生有用的警告信息。这些选项大多以-W开头,其中最有价值的当数-Wall了,使用它能够使gcc产生尽可能多的警告信息。例如:

[david@DAVID david]$ gcc -Wall bad.c -o bad

bad.c:3: warning: return type of 'main' is not 'int'

bad.c: In function 'main':

bad.c:4: warning: unused variable 'var'

bad.c:6:2: warning: no newline at end of file

gcc给出的警告信息虽然从严格意义上说不能算作是错误,但很可能成为错误的栖身之所。一个优秀的Linux程序员应该尽量避免产生警告信息,使自己的代码始终保持简洁、优美和健壮的特性。
    在处理警告方面,另一个常用的编译选项是-Werror,它要求gcc将所有的警告当成错误进行处理,这在使用自动编译工具(如make等)时非常有用。如果编译时带上-Werror选项,那么gcc会在所有产生警告的地方停止编译,迫使程序员对自己的代码进行修改。只有当相应的警告信息消除时,才可能将编译过程继续朝前推进。执行情况如下:

[david@DAVID david]$ gcc -Werror bad.c -o bad

cc1: warnings being treated as errors

bad.c: In function 'main':

bad.c:3: warning: return type of 'main' is not 'int'

bad.c:6:2: no newline at end of file

对Linux程序员来讲,gcc给出的警告信息是很有价值的,它们不仅可以帮助程序员写出更加健壮的程序,而且还是跟踪和调试程序的有力工具。建议在用gcc编译源代码时始终带上-Wall选项,并把它逐渐培养成为一种习惯,这对找出常见的隐式编程错误很有帮助。

3.4  库  依  赖

在Linux下使用C语言开发应用程序时,完全不使用第三方函数库的情况是比较少见的,通常来讲都需要借助一个或多个函数库的支持才能够完成相应的功能。从程序员的角度看,函数库实际上就是一些头文件(.h)和库文件(.so或者.a)的集合。虽然Linux下大多数函数都默认将头文件放到/usr/include/目录下,而库文件则放到/usr/lib/目录下,但并不是所有的情况都是这样。正因如此,gcc在编译时必须让编译器知道如何来查找所需要的头文件和库文件。

gcc采用搜索目录的办法来查找所需要的文件,-I选项可以向gcc的头文件搜索路径中添加新的目录。例如,如果在/home/david/include/目录下有编译时所需要的头文件,为了让gcc能够顺利地找到它们,就可以使用-I选项:

[david@DAVID david]$ gcc david.c -I /home/david/include -o david

同样,如果使用了不在标准位置的库文件,那么可以通过-L选项向gcc的库文件搜索路径中添加新的目录。例如,如果在/home/david/lib/目录下有链接时所需要的库文件libdavid.so,为了让gcc能够顺利地找到它,可以使用下面的命令:

[david@DAVID david]$ gcc david.c -L /home/david/lib –ldavid -o david

值得详细解释一下的是-l选项,它指示gcc去连接库文件david.so。Linux下的库文件在命名时有一个约定,那就是应该以lib三个字母开头。由于所有的库文件都遵循了同样的规范,因此在用-l选项指定链接的库文件名时可以省去lib三个字母。也就是说gcc在对-l david进行处理时,会自动去链接名为libdavid.so的文件。

Linux下的库文件分为两大类,分别是动态链接库(通常以.so结尾)和静态链接库(通常以.a结尾),两者的差别仅在于程序执行时所需的代码是在运行时动态加载的,还是在编译时静态加载的。默认情况下,gcc在链接时优先使用动态链接库,只有当动态链接库不存在时才考虑使用静态链接库。如果需要的话可以在编译时加上-static选项,强制使用静态链接库。例如,如果在/home/david/lib/目录下有链接时所需要的库文件libfoo.so和libfoo.a,为了让gcc在链接时只用到静态链接库,可以使用下面的命令:

[david@DAVID david]$ gcc foo.c -L /home/david/lib -static –ldavid -o

david

3.5  gcc代码优化

代码优化指的是编译器通过分析源代码,找出其中尚未达到最优的部分,然后对其重新进行组合,目的是改善程序的执行性能。gcc提供的代码优化功能非常强大,它通过编译选项-On来控制优化代码的生成,其中n是一个代表优化级别的整数。对于不同版本的gcc来讲,n的取值范围及其对应的优化效果可能并不完全相同,比较典型的范围是从0变化到2或3。

编译时使用选项-O可以告诉gcc同时减小代码的长度和执行时间,其效果等价于-O1。在这一级别上能够进行的优化类型虽然取决于目标处理器,但一般都会包括线程跳转(Thread Jump)和延迟退栈(Deferred Stack Pops)两种优化。

选项-O2告诉gcc除了完成所有-O1级别的优化之外,同时还要进行一些额外的调整工作,如处理器指令调度等。

选项-O3则除了完成所有-O2级别的优化之外,还包括循环展开和其他一些与处理器特性相关的优化工作。

通常来说,数字越大优化的等级越高,同时也就意味着程序的运行速度越快。许多Linux程序员都喜欢使用-O2选项,因为它在优化长度、编译时间和代码大小之间取得了一个比较理想的平衡点。

下面通过具体实例来感受一下gcc的代码优化功能,所用程序如例3-3所示。

实例3-3  count.c­­­­­­­­­­­­­­­­­­­­­­­­­­­­

 


#include

 int main(void)

{  double counter;

   double result;

   double temp;

   for (counter = 0; counter < 4000.0 * 4000.0 * 4000.0  / 20.0 + 2030;   

counter += (5 - 3 +2 + 1 ) / 4)

     {  temp = counter / 1239;

        result  = counter;   

       } 

   printf("Result is %lf\n", result); 

   return 0;

}

首先不加任何优化选项进行编译:

[david@DAVID david]$ gcc -Wall count.c -o count

借助Linux提供的time命令,可以大致统计出该程序在运行时所需要的时间:

[david@DAVID david]$ time ./count

Result is 3200002029.000000

real    1m59.357s

user    1m59.140s

sys     0m0.050s

接下来使用优化选项来对代码进行优化处理:

[david@DAVID david]$ gcc -Wall count.c -o count2

在同样的条件下再次测试一下运行时间:

[david@DAVID david]$ time ./count2

Result is 3200002029.000000

real    0m26.573s

user    0m26.540s

sys     0m0.010s

对比两次执行的输出结果不难看出,程序的性能的确得到了很大幅度的改善,由原来的1分59秒缩短到了26秒。这个例子是专门针对gcc的优化功能而设计的,因此优化前后程序的执行速度发生了很大的改变。尽管gcc的代码优化功能非常强大,但作为一名优秀的Linux程序员,首先还是要力求能够手工编写出高质量的代码。如果编写的代码简短,并且逻辑性强,编译器就不会做更多的工作,甚至根本用不着优化。

优化虽然能够给程序带来更好的执行性能,但在如下一些场合中应该避免优化代码。

●       程序开发的时候:优化等级越高,消耗在编译上的时间就越长,因此在开发的时候最好不要使用优化选项,只有到软件发行或开发结束的时候,才考虑对最终生成的代码进行优化。

●       资源受限的时候:一些优化选项会增加可执行代码的体积,如果程序在运行时能够申请到的内存资源非常紧张(如一些实时嵌入式设备),那就不要对代码进行优化,因为由这带来的负面影响可能会产生非常严重的后果。

●       跟踪调试的时候:在对代码进行优化的时候,某些代码可能会被删除或改写,或者为了取得更佳的性能而进行重组,从而使跟踪和调试变得异常困难。

3.6  加    速

在将源代码变成可执行文件的过程中,需要经过许多中间步骤,包含预处理、编译、汇编和连接。这些过程实际上是由不同的程序负责完成的。大多数情况下gcc可以为Linux程序员完成所有的后台工作,自动调用相应程序进行处理。

这样做有一个很明显的缺点,就是gcc在处理每一个源文件时,最终都需要生成好几个临时文件才能完成相应的工作,从而无形中导致处理速度变慢。例如,gcc在处理一个源文件时,可能需要一个临时文件来保存预处理的输出,一个临时文件来保存编译器的输出,一个临时文件来保存汇编器的输出,而读写这些临时文件显然需要耗费一定的时间。当软件项目变得非常庞大的时候,花费在这上面的代价可能会变得很大。

解决的办法是,使用Linux提供的一种更加高效的通信方式—— 管道。它可以用来同时连接两个程序,其中一个程序的输出将直接作为另一个程序的输入,这样就可以避免使用临时文件,但编译时却需要消耗更多的内存。

注意:

在编译过程中使用管道是由gcc的-pipe选项决定的。下面的这条命令就是借助gcc的管道功能来提高编译速度的:

[david@DAVID david]$ gcc -pipe david.c -o david

在编译小型工程时使用管道,编译时间上的差异可能还不是很明显,但在源代码非常多的大型工程中,差异将变得非常明显。

3.7  gcc常用选项

gcc作为Linux下C/C++重要的编译环境,功能强大,编译选项繁多。为了方便大家日后编译方便,在此将常用的选项及说明罗列出来,见表3-2。

表3-2  gcc的常用选项

选  项  名

作    用

-c

通知gcc取消连接步骤,即编译源码并在最后生成目标文件

-Dmacro

定义指定的宏,使它能够通过源码中的#ifdef进行检验

-E

不经过编译预处理程序的输出而输送至标准输出

-g3

获得有关调试程序的详细信息,它不能与-o选项联合使用

-Idirectory

在包含文件搜索路径的起点处添加指定目录

-llibrary

提示连接程序在创建最终可执行文件时包含指定的库

-O、-O2、-O3

将优化状态打开,该选项不能与-g选项联合使用

-S

要求编译程序生成来自源代码的汇编程序输出

-v

启动所有警报

.h

预处理文件(标头文件)

-Wall

在发生警报时取消编译操作,即将警报看作是错误

-w

禁止所有的报警

 

3.8  gcc的错误类型及对策

如果gcc编译器发现源程序中有错误,就无法继续进行,也无法生成最终的可执行文件。为了便于修改,gcc给出错误信息,必须对这些错误信息逐个进行分析、处理,并修改相应的源代码,才能保证源代码的正确编译连接。.gcc给出的错误信息一般可以分为四大类,下面我们分别讨论其产生的原因和对策。

●       第一类:C语法错误

错误信息:文件source.c中第n行有语法错误(syntex errror)。这种类型的错误,一般都是C语言的语法错误,应该仔细检查源代码文件中第n行及该行之前的程序,有时也需要对该文件所包含的头文件进行检查。有些情况下,一个很简单的语法错误,gcc会给出一大堆错误,我们最主要的是要保持清醒的头脑,不要被其吓倒,必要的时候再参考一下C语言的基本教材。在这里推荐一本由Andrew Koenig写的《C 陷阱与缺陷》(此书已由人民邮电出版社翻译出版),说得夸张一点就是此书可以帮助你减少C代码和初级C++代码中的90%的bug。

●       第二类:头文件错误

错误信息:找不到头文件head.h(Can not find include file head.h)。这类错误是源代码文件中包含的头文件有问题,可能的原因有头文件名错误、指定的头文件所在目录名错误等,也可能是错误地使用了双引号和尖括号。

●       第三类:档案库错误

错误信息:连接程序找不到所需的函数库,例如:

ld: -lm: No such file or directory

这类错误是与目标文件相连接的函数库有错误,可能的原因是函数库名错误、指定的函数库所在目录名称错误等。检查的方法是使用find命令在可能的目录中寻找相应的函数库名,确定档案库及目录的名称并修改程序中及编译选项中的名称。

●       第四类:未定义符号

错误信息:有未定义的符号(Undefined symbol)。这类错误是在连接过程中出现的,可能有两种原因:一是用户自己定义的函数或者全局变量所在源代码文件,没有被编译、连接,或者干脆还没有定义,这需要用户根据实际情况修改源程序,给出全局变量或者函数的定义体;二是未定义的符号是一个标准的库函数,在源程序中使用了该库函数,而连接过程中还没有给定相应的函数库的名称,或者是该档案库的目录名称有问题,这时需要使用档案库维护命令ar检查我们需要的库函数到底位于哪一个函数库中,确定之后,修改gcc连接选项中的-l和-L项。

排除编译、连接过程中的错误,应该说只是程序设计中最简单、最基本的一个步骤,可以说只是开了个头。这个过程中的错误,只是我们在使用C语言描述一个算法中所产生的错误,是比较容易排除的。我们写一个程序,到编译、连接通过为止,应该说刚刚开始,程序在运行过程中所出现的问题,是算法设计有问题,说得严重点儿是对问题的认识和理解不够,还需要更加深入地测试、调试和修改。一个程序,稍为复杂的程序,往往要经过多次的编译、连接、测试和修改。 gcc是在Linux下开发程序时必须掌握的工具之一。

以上对gcc作了一个简要的介绍,主要讲述了如何使用gcc编译程序、产生警告信息、和加快gcc的编译速度。对所有希望早日跨入Linux开发者行列的人来说,gcc就是成为一名优秀的Linux程序员的起跑线。关于调试 C 程序的更多信息请看第4章关于gdb的内容。

你可能感兴趣的:(linux)