原文:https://www.bearoom.xyz/2019/02/18/openmp2/
OpenMP是由三部分组成的:指令、库函数和环境变量。
#pragma omp 指令 [子句[子句]…]
指令有以下常见的11种:
子句有以下常见的几种:
1.void omp_set_num_threads(int _Num_threads):在后续并行区域设置线程数,此调用只影响调用线程所遇到的同一级或内部嵌套级别的后续并行区域。说明:此函数只能在串行代码部分调用。
2.int omp_get_num_threads(void):返回当前线程数目。说明:如果在串行代码中调用此函数,返回值为1。
3.int omp_get_max_threads(void):如果在程序中此处遇到未使用 num_threads() 子句指定的活动并行区域,则返回程序的最大可用线程数量。说明:可以在串行或并行区域调用,通常这个最大数量由omp_set_num_threads()或OMP_NUM_THREADS环境变量决定。
4.int omp_get_thread_num(void):返回当前线程id.id从1开始顺序编号,主线程id是0。
5.int omp_get_num_procs(void):返回程序可用的处理器数。
6.void omp_set_dynamic(int _Dynamic_threads):启用或禁用可用线程数的动态调整.(缺省情况下启用动态调整.)此调用只影响调用线程所遇到的同一级或内部嵌套级别的后续并行区域。如果 _Dynamic_threads 的值为非零值,启用动态调整;否则,禁用动态调整。
7.int omp_get_dynamic(void):确定在程序中此处是否启用了动态线程调整。启用了动态线程调整时返回非零值;否则,返回零值。
8.int omp_in_parallel(void):确定线程是否在并行区域的动态范围内执行。如果在活动并行区域的动态范围内调用,则返回非零值;否则,返回零值.活动并行区域是指 IF 子句求值为 TRUE 的并行区域。
9.void omp_set_nested(int _Nested):启用或禁用嵌套并行操作。此调用只影响调用线程所遇到的同一级或内部嵌套级别的后续并行区域。_Nested 的值为非零值时启用嵌套并行操作;否则,禁用嵌套并行操作。缺省情况下,禁用嵌套并行操作。
10.int omp_get_nested(void):确定在程序中此处是否启用了嵌套并行操作.启用嵌套并行操作时返回非零值;否则,返回零值,互斥锁操作嵌套锁操作功能。
11.void omp_init_lock(omp_lock_t * _Lock):
12.void omp_init_nest_lock(omp_nest_lock_t * _Lock):初始化一个(嵌套)互斥锁。
13.void omp_destroy_lock(omp_lock_t * _Lock):
14.void omp_destroy_nest_lock(omp_nest_lock_t * _Lock):结束一个(嵌套)互斥锁的使用并释放内存。
15.void omp_set_lock(omp_lock_t * _Lock);
16.void omp_set_nest_lock(omp_nest_lock_t * _Lock);获得一个(嵌套)互斥锁.
17.void omp_unset_lock(omp_lock_t * _Lock):
18.void omp_unset_nest_lock(omp_nest_lock_t * _Lock):释放一个(嵌套)互斥锁。
19.int omp_test_lock(omp_lock_t * _Lock):
20.int omp_test_nest_lock(omp_nest_lock_t * _Lock):试图获得一个(嵌套)互斥锁,并在成功时放回真(true),失败是返回假(false)。
21.double omp_get_wtime(void):获取wall clock time,返回一个double的数,表示从过去的某一时刻经历的时间,一般用于成对出现,进行时间比较。 此函数得到的时间是相对于线程的,也就是每一个线程都有自己的时间。
22.double omp_get_wtick(void):得到clock ticks的秒数。
1、OMP_SCHEDULE
仅适用于DO,PARALLEL DO(Fortran)和
(C / C ++)指令并行,它们的schedule子句设置为RUNTIME。此变量的值确定如何在处理器上调度循环的迭代。例如:
export OMP_SCHEDULE="guided, 4"
export OMP_SCHEDULE="dynamic"
2、OMP_NUM_THREADS 设置执行期间要使用的最大线程数。例如:
export OMP_NUM_THREADS=8
3、OMP_DYNAMIC
启用或禁用动态调整可用于执行并行区域的线程数。有效值为TRUE或FALSE。例如
export OMP_DYNAMIC=TRUE
4、OMP_PROC_BIND
启用或禁用绑定到处理器的线程。有效值为TRUE或FALSE。例如:
export OMP_PROC_BIND=TRUE
5、OMP_NESTED
启用或禁用嵌套并行性。有效值为TRUE或FALSE。例如:
export OMP_NESTED=TRUE
6、OMP_STACKSIZE
控制创建(非主)线程的堆栈大小。例如
export OMP_STACKSIZE=2000500B
export OMP_STACKSIZE="3000 k "
export OMP_STACKSIZE=10M
export OMP_STACKSIZE=" 10 M "
export OMP_STACKSIZE="20 m "
export OMP_STACKSIZE=" 1G"
export OMP_STACKSIZE=20000
7、OMP_WAIT_POLICY
提供有关等待线程的所需行为的OpenMP实现的提示。兼容的OpenMP实现可能会也可能不会遵守环境变量的设置。有效值为ACTIVE和PASSIVE。ACTIVE指定等待线程应该主动处于活动状态,即在等待时消耗处理器周期。PASSIVE指定等待线程应该主要是被动的,即在等待时不消耗处理器周期。ACTIVE和PASSIVE行为的细节是实现定义的。例子:
export OMP_WAIT_POLICY=ACTIVE
export OMP_WAIT_POLICY=active
export OMP_WAIT_POLICY=PASSIVE
export OMP_WAIT_POLICY=passive
8、OMP_MAX_ACTIVE_LEVELS
控制嵌套活动并行区域的最大数量。此环境变量的值必须是非负整数。如果请求的OMP_MAX_ACTIVE_LEVELS值大于实现可以支持的嵌套活动并行级别的最大数量,或者该值不是非负整数,则程序的行为是实现定义的。例:
export OMP_MAX_ACTIVE_LEVELS=2
9、OMP_THREAD_LIMIT
设置要用于整个OpenMP程序的OpenMP线程数。此环境变量的值必须是正整数。如果请求的OMP_THREAD_LIMIT值大于实现可以支持的线程数,或者该值不是正整数,则程序的行为是实现定义的。例:
export OMP_THREAD_LIMIT=8
袅袅城边柳, 青青陌上桑。 提笼忘采叶, 昨夜梦渔阳。
–张仲素 《春闺思》