从堆栈布局看gcc不同版本的优化

问题引入:相同的有问题的代码,在4U的gcc3.4.6版本上运行良好,但是在5U的gcc4.1.2版本运行却失败!

简化问题如下:

#include <iostream>
using namespace std;
int test(void* null1, void* i, void* j, void* k, void* null2)
{
        *((long*)i) = 1;
        *((long*)j) = 2;
        *((long*)k) = 3;
}
int main()
{
        int null_1 = 0;
        int myvalue_i = 3;
        int myvalue_j = 5;
        int myvalue_k = 5;
        int null_2 = 0;
        test(&null_1, &myvalue_i, &myvalue_j, &myvalue_k, &null_2);
        cout << "i=" << myvalue_i  << ",j="  << myvalue_j  << ",k=" << myvalue_k<< endl;
        return 0;
}

//相同的代码,在4U的机器上做测试:(gcc 3.4.6)
[root@machine1 test]$ g++ t.cpp 
[root@machine1 test]$ ./a.out 
i=0,j=0,k=3
[root@machine1 test]$ g++ t.cpp -O2
[root@machine1 test]$ ./a.out 
i=1,j=2,k=3
//相同的代码,在5U的机器上做测试:(gcc 4.1.2)
[root@machine2 test]$ g++ t.cpp
[root@machine2 test]$ ./a.out 
i=0,j=0,k=3
[root@machine2 test]$ g++ t.cpp -O2
[root@machine2 test]$ ./a.out 
i=0,j=0,k=3


这段代码存在明显的内存覆盖问题,即在64位下,long是8字节,而本身合法内存只有4字节,所以会导致值相互之间的覆盖问题!但是请注意,在gcc3.4.6版本使用-O2优化后,居然值还正确!!!

通过反汇编,发现问题所在——

图解如下:



可以看到

 在4U的机器上gcc3.4.6使用-O2的优化方案,栈里的变量顺序变了,这样,在进行赋值覆盖的时候,从下往上(低地址往高地址)覆盖,导致可以读取正确的值

在5u的机器上gcc4.1.2,不再有这样的优化!

所以,这就解释了,为何在4u上gcc3.4.6没有问题,存在覆盖问题,却可以正常读值;但是在5u上gcc4.1.2有问题,存在覆盖问题,读值异常。

由于存在覆盖问题,不管是4u上gcc3.4.6还是5u上的gcc4.1.2,如果没有null_2会覆盖栈里别的内容,导致栈帧销毁的时候程序core!所以我加了一个null_1/2的参数,来防止程序core


你可能感兴趣的:(从堆栈布局看gcc不同版本的优化)