代码运行优化

参考:改几行代码,for循环耗时从3.2秒降到0.3秒!真正看懂的都是牛人!

运行效率优化

以下是计算阶乘的代码

1、初始版
__attribute__((noinline))

int calc(int n)
{
    int fact = 1;
    for (int i = 0; i < n; i++)
    {
        fact *= i;
    }
    return fact;
}

int main()
{
    int n = calc(1000000000);
    return 0;
}

代码运行优化_第1张图片

2、初步优化

充分利用CPU流水线和指令级并行执行的能力

__attribute__((noinline))

int calc(int n)
{
    int fact = 1, fact2 = 1, fact3 = 1, fact4 = 1;
    for (int i = 0; i < n; i+=4)
    {
        fact *= i;
        fact2 *= i + 1;
        fact3 *= i + 2;
        fact4 *= i + 3;
    }
    return fact * fact2 * fact3 * fact4;
}

int main()
{
    int n = calc(1000000000);
    return 0;
}

代码运行优化_第2张图片

3、进一步优化

把变量存放在寄存器中,替换从内存中访问,提升访问速度

__attribute__((noinline))

int calc(int n)
{
    register int fact = 1, fact2 = 1, fact3 = 1, fact4 = 1;
    for (register int i = 0; i < n; i+=4)
    {
        fact *= i;
        fact2 *= i + 1;
        fact3 *= i + 2;
        fact4 *= i + 3;
    }
    return fact * fact2 * fact3 * fact4;
}

int main()
{
    int n = calc(1000000000);
    return 0;
}

代码运行优化_第3张图片

你可能感兴趣的:(代码优化,算法,后端)