最简单的并行计算——OpenMP的使用

简介

OpenMP的英文全称是Open Multiprocessing,一种应用程序界面(API,即Application Program Interface),是一种单进程多线程并行的实现和方法,也可以认为是共享存储结构上的一种编程模型,可用于共享内存并行系统的多线程程序设计的一套指导性注释(Compiler Directive)。

CPU下进行并行计算,最简单的方式就是使用OpenMP,这可以让你不必去写诸如CreateThread之类的线程管理代码,多线程程序写起来比较简洁。而且OpenMP提供了很丰富的指令,对于同步共享变量、合理分配负载等任务,都提供了有效的支持,很值得一学。

使用

只要在想并行计算的地方,补上

# pragma omp parallel sections

则可以利用OpenMP来调取相应的CPU来进行并行运算。注意,#与pragma之间是否有空格,关系不大,同时变量声明之前不能用这句,不然不能过编译。

原理

OpenMP对应的实际上是单进程多线程的并发编程模型,可以将一个单线程的程序按for循环拆分成多线程——相当于pthread_create。除了线程级别的并行粒度,OpenMP还共享内存:对于同一个进程的多个线程来说,由于它们只是独占自己的栈内存,堆内存是共享的,因此数据交换十分地容易,直接通过共享变量就可以进行交换,编程模型非常简单易用,并且对于操作系统来说,线程的上下文切换成本也比进程低很多。然而另一方面,由于线程不能脱离进程独立存在,而一个进程不能存在于多台机器上,所以OpenMP只适用于拥有多个CPU核心的单台电脑。并且多线程编程存在临界区(Critical Section),需要你自己去加锁,解决Race Condition问题,否则的话很容易导致不可预知的后果。

来源:知乎 作者:到处挖坑蒋玉成

代码实例

GCC4.X自带OpenMP,故Linux下无需特殊配置,只需安装GCC即可,编译的时候加上-fopenmp参数就可以使用OpenMP。下面展示一个用OpenMP并行计算的快速排序:

//qsort.c
#include  
#include  
#include  
#include  

void quickSort(int *num,int low,int high);//进行分区
int Partition(int *num,int low,int high);//返回分离点
int _tmain(int argc, _TCHAR* argv[])
{
    int num[]={2,3,5,623,32,4324,3,24};//8
    quickSort(num,0,7);
    int i;
    for(i=0;i<8;i++)
        printf("%d\n",num[i]);
    return 0;
}


void quickSort(int *num,int low,int high)
{
    if(lowint split=Partition(num,low,high);
#pragma omp parallel sections//并行区域
        {
#pragma omp section//负责这个区域的线程对前面部分进行排序
        quickSort(num,low,split-1);
#pragma omp section//负责这个区域的线程对后面部分进行排序
        quickSort(num,split+1,high);
        }

    }

}

int Partition(int *num,int low,int high)
{
    int temp=num[low];//作为中轴
    while(lowwhile(low=temp)high--;
        num[low]=num[high];
        while(lowreturn low;//返回中轴的位置,再进行分离
}

如果是单文件编译只需:

g++ qsort.c -o qsort -fopenmp

在上面的源码中,第一个#pragma创建一个sections并行区域,每一个section用#pragma omp section前缀指令声明。每一个section都将被分配线程组里的单独线程执行,并且所有的sectoins能够确保一致并行。每一个并行section都递归地调用QuickSort。

如果用Cmake管理项目,则对应的CMakeList.txt如下:

cmake_minimum_required(VERSION 2.7)
project(openmptest)

set(CMAKE_CXX_STANDARD 11)

set(SOURCE_FILES qsort.c)

find_package(OpenMP REQUIRED)
if(OPENMP_FOUND)
message("OPENMP FOUND")
set(CMAKE_C_FLAGS "${CMAKE_C_FLAGS} ${OpenMP_C_FLAGS}")
set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} ${OpenMP_CXX_FLAGS}")
set(CMAKE_EXE_LINKER_FLAGS "${CMAKE_EXE_LINKER_FLAGS} ${OpenMP_EXE_LINKER_FLAGS}")
endif()

add_executable(openmptest ${SOURCE_FILES})

target_link_libraries(openmptest ${OpenMP_LIBS})

特点

OpenMP提供了对并行算法的高层的抽象描述,程序员通过在源代码中加入专用的pragma来指明自己的意图,由此编译器可以自动将程序进行并行化,并在必要之处加入同步互斥以及通信。当选择忽略这些pragma,或者编译器不支持OpenMp时,程序又可退化为通常的程序(一般为串行),代码仍然可以正常运作,只是不能利用多线程来加速程序执行。

缺陷

就像在#pragma omp parallel for结构中一样,你有责任确保每一个section都不依赖于其它的section,以使得它们能够并行执行。如果sections在没有同步存取资源的情况下改变了共享资源,将导致未定义结果。即如果你的#pragma没写好,很容易产生Data Race。

你可能感兴趣的:(并行计算,C,C++,linux,C/C++)