如何编写C++以减少CPU分支预测错误?

利用Intel的vtune测试Hardware Issue选项可以看到分支预测的情况。 
 

一般来讲

95%的分支预测成功是正常的

90%表示还有提高的空间

75%表示非常糟糕

如何提高分支预测的效率, 下面列举了一些特例表示可以考虑的优化方向

case 1

if(t1==0&&t2==0&&t3==0) {

// do something
}

====>
if(t1|t2|t3==0){ // 合并条件,提高分支预测成功率
// do something
}


case 2
if(int i=0; i<1000; ++i){  // for cpu 密集调用
	if(cond) // 分支预测
do();
	else 
		do2();
}
==============》
if(cond){  // 避免了CPU密集调用时进行分支预测
   if(int i=0; i<1000; ++i)   do();
}else{
   if(int i=0; i<1000; ++i)  do1();
}


case 3
for(int i=0; i<10000; ++i){  // 此时要进行多次分支预测
if(a<10){
 		fun1();
}else(a<25){
		fun2();
}else{a<50}{
		fun3();
}else{
		fun4();
}
}
==========》
typedef void(*Func)();
Func funarray[n];  // 利用函数指针数组来避免多次运行时候的分支预测
Funarray[1] = &fun1;
…

for(int i=0; i<10000; ++i){
	funarray[a]();
}

case 4:
if(color<0)  color=0;

================⇒

color &=~(color>>31);  // 注: 右移 负数补1 正数补0




你可能感兴趣的:(如何编写C++以减少CPU分支预测错误?)