《深入理解计算机系统》Part1 05:优化程序性能

摘要:这一章节主要讲述了以提高程序的运行速率进行程序优化的三个层次(也就是优化时间,而暂时不考虑空间性能的问题),并且主要介绍了如何做到指令级的优化。
关键词:指令流水线
目录
  1. 程序的指令级优化
  2. 程序的代码级优化
  3. 程序的算法级优化

1. 程序的指令级优化

我们知道,对一个单核的机器进行密集型计算的时候,使用多线程是不会有效率的提高的。但使用单个线程,不同的代码也会很大的性能差异,如何单核的计算效率达到最大,就需要使用指令级的优化。

在计算机中有时钟周期的概念,也就是进行一次操作需要的时间。我们说CPU的主频是多少GHz的时候,表明CPU一秒可以处理多少个操作。实际上CPU中有好几个功能单元,每个功能单元实现不同的功能,这些功能单元加在一起的频率才是主频,而CPU指令的处理又是流水线化的。也就是一个指令的几个操作就像流水线一样会通过不同的功能单元进行处理。

假设你的程序是顺序运行的指令,也就是一个指令结束以后,才能执行一下个指令,这样每个时刻都只有一个功能单元在运行,这样的代码就不能利用流水线化的执行方式了。最大压榨CPU性能的方法应该是使指令填满流水线。而这取决你的代码实现的功能能否做到指令级的并行,以及你是否能写出指令级并行的代码。前者需要你判断你的算法能否并行,比如实现两个向量元素的相乘或者相加,很显然不同元素之间的计算相互独立,这是可以并行的,那么就可以写出对应的完全流水线化的代码。至于如何写,一般则是通过循环展开,比如张开两次,每次循环做两个元素的相加,这两个相加操作在代码中的特点就是,即使第一次相加操作不执行,也不会影响第二次相加操作代码的执行。也就是代码之间是互不影响的,而不是非得执行前面的代码,才能执行后面的,这样的代码是不能利用流水线功能的。

2. 程序的代码级优化

代码级别优化主要针对的时候代码本身一些不合理进行优化,比如反复重复的计算,if判断语句,循环语句,以及不断的调用函数,不断的访问存储器等等。本来一个变量可以放入寄存器的,你的代码非要把他放到存储器中。虽然减少过程调用会破坏面向对象编程,因为其主张一个函数只做一件事,必然充斥着大量的过程调用,以保证其可扩展性和可读性,所以至于要不要减少过程调用这个依赖与你的应用场景,需要自己做个权衡。

总之代码级别的优化,主要是从代码级就能看到的效果,而无需对底层处理器有所认识。

3. 程序算法级优化

程序算法级优化就更容易懂了。实现同一个功能,不同的算法性能是不一样的,适用的情况也是不同的,可谓是各有优劣,就比如说排序算法这么多,他们都有自己的优点和缺点,或者有的时间复杂度高,有的空间复杂度高,有的依赖于特定的数据结构能表现更好。

所以你需要对数据结构和算法有扎实的理解。对于一个程序而言,这三个级别的优化都起着非常重要的作用。希望你不要只关注于算法级的。尤其是做底层应用的人。

你可能感兴趣的:(《深入理解计算机系统》Part1 05:优化程序性能)