CPU | 降低流水线停滞的策略

CPU的指令流:
CPU | 降低流水线停滞的策略_第1张图片

流水线的概念:每个状态下都有一条指令在执行。

注意execute单元会出现流水线停滞。
降低流水线停滞的策略:
CPU | 降低流水线停滞的策略_第2张图片
1、分支预测
2、 超标量:一个指令流里可以同时执行两个或多个指令。
即一个线程里面的两个指令同步执行。
3、 乱序执行out of order(ooo)
a b c d e
c要等到a、b 执行完后在执行,可以让c先停滞,让后续的d 、e继续执行然后执行reorder重新排序成c d e。也就是所谓的乱序执行。
最终从fetch到commit实际是保序执行的,只是其中的指令流乱序。
4、cache
CPU | 降低流水线停滞的策略_第3张图片
5、预取
硬件预取和软件预取

6、 内存对齐
对于x86来说提升性能明显
CPU | 降低流水线停滞的策略_第4张图片
对于62字节后的UINT变量,需要访问2个cacheline;
通过在62字节后添加2字节填充,可以做到优化。

7 、超线程
两个线程里的指令同步执行。
注意和超标量的区别

实用场景:
1、 内存屏障barrier();
2、 循环体中减少分支判断,从而减少分支预测失败带来的消耗;
3、 剥离多分支,可将命中频繁的分支放到switch前面;
CPU | 降低流水线停滞的策略_第5张图片
性能优化专题:
https://blog.csdn.net/qq_35399548/article/details/121567758?spm=1001.2014.3001.5502

你可能感兴趣的:(c,CPU)