程序性能之编译优化

在用编译型语言写程序时,编译器会对程序员的代码进行优化。这是否意味着程序员在写高层代码时,无需关心程序性能将优化工作通通交给编译器来完成呢?答案是否定的。原因很简单,编译器不是万能的,不可能猜测出所有高层代码的真正意图。为了保证在各种情况下优化代码的执行结果与未优化代码的执行结果一致,编译器会放弃某些看似可行的优化手段。

下面是两个例子
例子一

void f1(int *xp, int *yp) {
  *xp += *yp;
  *xp += *yp;
}
void f2(int *xp, int *yp) {
  *xp += 2* *xp;
}

乍一看,f1, f2是等价的两个函数,并且f2执行效率高于f1(访问/写入内存次数更少)。编译器应该将f1优化成f2,实际上编译器并不会这么做。因为当xp和yp指向同一个整型数据时(memory aliasing),f1f2不再等价。因为编译器无法确定xp,yp是否会指向同一个数据,所以最保险的策略便是假设xp,yp会指向同一数据,一旦xp,yp指向相同,f1f2便不再等价。自然不能将f1优化成f2

例子2

int f1(x) {
  return a(x) + a(x) 
}
int f2(x) {
  return 2 * a(x)
}

函数调用是有开销的,从减少函数调用的角度来看,f2优于f1。那么编译器是否会将f1优化成f2呢?未必。
如果把a(x) 当成数学函数,毫无疑问,a(x)+a(x)等价于2*a(x)。然而在程序语言中,一个函数的执行结果不仅仅依赖于输入参数,还可能依赖于某些全局变量。假设a(x)的实现如下

int a(x) {
  global_var++;
  return x + global_var;
}

这里,因为函数a的输出不仅依赖于参数x还依赖于全局变量global_var,并且调用a会修改global_var。所以a(x)+a(x)并不等价于2*a(x)
所以如果编译器想将f1优化成f2就必须确定a的输出不依赖于任何全局变量,并且a不会修改任何在某一范围内全局可见的变量。对于简单的函数做上述判断并不困难,但是对于实现复杂的函数想要判断其是否满足上述条件并非易事。

所以对于例子一,想要进行优化,必须依靠写高层代码的程序员进行优化,因为只有代码作者知道,在调用f1时,xp, yp是否可能指向同一个数据。同理对于例子2,相比于编译器,程序员清楚地知道a的执行是否是纯函数式还是有副作用。如果是前者,相比于a(x)+a(x), 2*a(x)无疑是更好的选择。

你可能感兴趣的:(程序性能之编译优化)