通过未初始化全局变量,研究BSS段和COMMON段的不同

        最近正在重温《程序员的自我修养》一书,由于水平比以前有所提升,所以读书的收获也不一样。
 
        下面针对该书3.3.3节BSS段的内容进行更细节的探讨——该节内容不在本文中重复说明了,只说一下结论。对于全局变量来说,如果初始化了不为0的值,那么该全局变量则被保存在data段,如果初始化的值为0,那么将其保存在bss段,如果没有初始化,则将其保存在common段,等到链接时再将其放入到BSS段。关于第三点不同编译器行为会不同,有的编译器会把没有初始化的全局变量直接放到BSS段。
 
        关于上面这个结论,我就不重复进行探讨了,下面探讨一下更细节点的问题。从上面的内容上看,尽管未初始化的全局变量有可能在编译阶段被保存在common段,但是最终还是会放到BSS段。那么我们是否可以将未初始化的全局变量与初始为0的全局变量等同起来呢?
 
        请看下面的代码:
  • 文件test1.cpp:
#include

using namespace std;

int init = 0;

void init1() {
	if(init == 0) {
		init = 1;
		cout << "init1" << endl;
	}
}

        编译g++ -g -c test1.cpp,-c产生目标文件(.o文件)

  • 文件test2.cpp:
#include

using namespace std;

int init = 1;

void init2() {
	if(init) {
		init = 0;
		cout << "init2" << endl;
	}
}

        编译g++ -g -c test2.cpp,-c产生目标文件(.o文件)

  • 文件main.cpp
#include

using namespace std;

void init1();
void init2();

int main() {
	init1();
	init2();

	return 0;
}

        编译g++ -g -o test main.cpp test1.o test2.o

这时会报错
  1. test2.o:(.data+0x0): multiple definition of `init'
  2. test1.o:/root/work/test/test1.c:4: first defined here
  3. collect2: ld returned 1 exit status
        这个报错大家都可以接受吧?OK,那么现在我们做一个小小的改动,将文件test1.c中的int init = 0改为int init,对于test1.c来说,这个改动不影响其逻辑,因为init如果未初始化,其值也应该是0。
 
        当前的test1.c
#include

using namespace std;

int init;

void init1() {
	if(init == 0) {
		init = 1;
		cout << "init1" << endl;
	}
}

        编译g++ -g -c test1.cpp,-c产生目标文件(.o文件)

        gcc -g -Wall -o test main.c test1.o test2.o
        这次即使使用-Wall打开所以warning,也没有任何警告和错误,已经生成了输出文件test。执行test
  1. [root@Lnx99 test]#./test
  2. init2
        好,下面探讨一下为什么是这样?
  • 第一种情况
    • 当test1.c中的init被初始化为0时,尽管init被放置在bss段,但是它是一个强符号。而test2.c中,定义了init为1,也是一个强符号,所以引发了错误。
  • 第二种情况
    • 当test1.c中的init不进行初始化,尽管其值仍然为0,但是其被保存在common段,为一个弱符号。当test2.c中定义了init为1一个强符号,那么在链接的过程中,gcc会用这个强符号覆盖掉弱符号,并不会引起链接冲突错误。但是在运行阶段,进入init1时,这个init的值却并不是其所期望的值,因此导致没有打印init1。
 
        我想关于BSS与COMMON段的这点不同,应该讲得比较清楚了。从这个区别中,我们需要注意,当定义全局变量时,有几点需要注意:
  • 如果只有本文件使用,那么需要添加上static
  • 即使不能使用static,那么一定要为该全局变量定义初值,即使这个值就是0。这样可以保证该变量为强符号,当名字冲突时,可以发现,而不是被未知的值覆盖。
  • 三嘛,最好能够避免全局变量,或者定义一个独一无二的名字。
 
        再多说一点,在编译阶段,还可以通过-fno-common选项来禁止将未初始化的全局变量放入到common段。
        同样的文件,看下面的编译链接过程:
  1. [root@Lnx99 test]#gcc --fno-common -c test1.c
  2. [root@Lnx99 test]#gcc --fno-common -c test2.c
  3. [root@Lnx99 test]#gcc --fno-common -o test main.c test1.o test2.o
  4. test2.o:(.data+0x0): multiple definition of `init'
  5. test1.o:/root/work/test/test1.c:6: first defined here
  6. collect2: ld returned 1 exit status

你可能感兴趣的:(c++)