OpenMP多线程应用程序性能分析

影响性能的主要因素

根据前述的Amdahl定律,我们应当努力提高并行化代码在应用程序中的比率,这是通用的提高效率的方法。

      1、OpenMP本身的开销

OpenMP获得应用程序多线程并行化的能力不是凭空而来的,而是需要一定的程序库的支持。在这些运行时的程序库对程序并行加速的同时需要运行库的本身,因此,库中代码的运行必然会带来一定的开销。实际上,并不是所有的代码都是需要并行化的,非常有可能在某些情况下,并行化之后的运行效率反而比不上串行执行的效率。因此,只有并行执行代码段负担足够大,而引入的OpenMP本身的开销又足够小,此时引入并行化操作才能够加速程序的执行。

      2、负载均衡

我们知道,一个OpenMP应用程序在执行的过程中,有很多的同步点,线程只有在同步点进行同步之后才能够继续执行下面的代码。因此,某一个线程在执行到同步点的时候若没有进一步的工作需要完成,此线程只有等待其它线程执行完毕才能够继续。此时,如果各个线程之间的负载不均衡,就有可能造成某些线程在执行过程中无事可干,经常处于空闲状态;而另外一些线程则负担沉重,需要很长时间才能够完成任务。在OpenMP的运行时以及环境变量中对负载均衡的需求有一定的支持,例如可以划分执行的粒度,并通过动态调度的方法消除一定的负载均衡问题。

      3、局部性

基于局部性的假设:即程序在继续执行的过程中,继续访问同样的或者相邻的数据的可能性要比随机访问其它数据的可能性要大。因此,在编写程序的时候,需要考虑到高速缓存的作用,有意地运用这种局部性带来的高速缓存的效率提高。

      4、线程同步带来的开销

对于多线程应用程序来说,相对于串行执行程序的一个固有特点就是线程之间可能存在的同步开销。多个线程在进行同步的时候必然带来一定的同步开销。考虑同步的必要性,消除不必要的同步,或者调整同步的顺序,就有可能带来性能上的提升。

你可能感兴趣的:(OpenMP多线程应用程序性能分析)