一、引言
前边已经提到过,线程的同步机制包括互斥锁同步和事件同步。互斥锁同步包括atomic、critical、mutex函数,其机制与普通多线程同步的机制类似。而事件同步则通过nowait、sections、single、master等预处理器指示符声明来完成。
二、隐式栅障
在介绍本节内容之前,先介绍一下并行区域中的隐式栅障。
上图中,barrier为隐式栅障,即并行区域中所有线程执行完毕之后,主线程才继续执行。
三、nowait、sections、single、master事件同步
1. nowait用来取消栅障,其用法如下:
#pragma omp for nowait //不能用#pragma omp parallel for nowait
或
#pragma omp single nowait
例如:
#include <iostream> #include <omp.h> // OpenMP编程需要包含的头文件 int main() { #pragma omp parallel { #pragma omp for nowait for (int i = 0; i < 1000; ++i) { std::cout << i << "+" << std::endl; } #pragma omp for for (int j = 0; j < 10; ++j) { std::cout << j << "-" << std::endl; } } return 0; }
输出:
可以看到,第一个for循环的两个线程中的一个执行完之后,继续往下执行,因此同时打印出了第一个循环的+和第一个循环的-。
如果去掉第一个for循环的nowait声明,则输出如下:
可以看到,第一个for循环的两个线程都执行完之后,才开始同时执行第二个for循环。也就是说,通过#pragma omp for声明的for循环结束时有一个默认的栅障。
2. 显式同步栅障#pragma omp barrier
#include <iostream> #include <omp.h> // OpenMP编程需要包含的头文件 int main() { #pragma omp parallel { for (int i = 0; i < 100; ++i) { std::cout << i << "+" << std::endl; } #pragma omp barrier for (int j = 0; j < 10; ++j) { std::cout << j << "-" << std::endl; } } return 0; }
输出如下:
可以看出,两个线程执行了第一个for循环,当两个线程同时执行完第一个for循环之后,在barrier处进行了同步,然后执行后边的for循环。
3. master通过#pragma omp mater来声明对应的并行程序块只由主线程完成。
例如:
#include <iostream> #include <omp.h> // OpenMP编程需要包含的头文件 int main() { #pragma omp parallel { #pragma omp master { for (int j = 0; j < 10; ++j) { std::cout << j << "-" << std::endl; } } std::cout << "This will printed twice." << std::endl; } return 0; }
执行结果如下:
可以看到,进入parallel声明的并行区域之后,创建了两个线程,主线程执行了for循环,而另一个线程没有执行for循环,而直接进入了for循环之后的打印语句,然后执行for循环的线程随后还会再执行一次后边的打印语句。
5. section用来指定不同的线程执行不同的部分
通过一个示例说明其使用方法:
#include <iostream> #include <omp.h> // OpenMP编程需要包含的头文件 int main() { #pragma omp parallel sections //声明该并行区域分为若干个section,section之间的运行顺序为并行的关系 { #pragma omp section //第一个section,由某个线程单独完成 for (int i = 0; i < 5; ++i) { std::cout << i << "+" << std::endl; } #pragma omp section //第一个section,由某个线程单独完成 for (int j = 0; j < 5; ++j) { std::cout << j << "-" << std::endl; } } return 0; }
输入结果:
可以看到,因为并行区域中有两个线程,所以两个section同时执行。
四、小结
介绍了nowait、single、barrier、section的用法。下一节介绍线程的调度优化。