OpenCL异构扩展

OpenCL异构扩展并不是OpenCL标准的一部分,它是指device支持某种特性,且在默认状态下,所有的扩展都是禁止的。但是OpenCL通过扩展,厂商可以给device增加一些新的功能,且不用考虑兼容性的问题。

就目前市场行情来看,各个厂商在OpenCL的实现中或多或少的使用了自己的扩展,体现了特殊性。

一般来说扩展的类型分为三种情况,如下所示:

1、以cl_khr作为扩展名属于Khronos OpenCL工作组批准的扩展,需要经过一致性测试。比如:#pragma OPENCL EXTENSION命令控制OpenCL编译器在语言扩展方面的行为。该命令的定义如下,其中extension_name是扩展的名字。

#pragma OPENCL EXTENSIONextension_name: behavior  

#pragma OPENCL EXTENSION all :behavior  

behavior: enable or disable 

extension_name的格式为cl_khr_,同时有一个形如cl__的名字作为供应商扩展。扩展必须得到OpenCL工作组的允许。标志all表示编译器支持的所有扩展。

enable使extension_name所代表的扩展有效。如果不支持extension_name或者使用all,则报告一个错误。

disable扩展extension_name排除在语言定义外。如果使用all,编译器把代码作为无扩展的核心版本处理,如果不支持extension_name,就会产生警告提示信息。

#pragma OPENCL EXTENSION cl_khr_fp64 : enable  

double x = 2.0; 

指令#pragma OPENCL EXTENSION是设置每个语言扩展行为的、简单的、低级的机制。它没有定义那些组合是合适的,这些是在其他地方定义的。需要注意的是,此类命令的顺序会影响结果,后出现的命令会覆盖前面的命令。

2、以cl_ext为扩展名的外部扩展。这种扩展是由2个或2个以上的厂商发起,并不需要进行一致性测试。比如cl_ext_device_fission扩展,通过该扩展把一个设备分成多个子设备,每一个设备都有自己的队列,主要是多核cpu以及Cell Broadband Engine使用,该扩展由AMD,Apple,Intel以及IBM四家联合提出。

对于每个子设备,都有自己的queue,把不同任务发送到两个子设备中,这里需要注意的是,把设备拆分为子设备,首先要了解该设备的架构,然后根据任务及device架构进行拆分。

3、厂商自己的扩展,比如GPU printf扩展,主要用来debug kernel代码。

enum cudaLimit { 

 cudaLimitStackSize  = 0x00,  // GPU thread stack size

 cudaLimitPrintfFifoSize = 0x01,  // GPU printf FIFOsize 

 cudaLimitMallocHeapSize = 0x02  // GPU malloc heapsize 

}; 

 

OpenCL扩展了GPU用于图形生成之外的能力,支持新数据类型,比如三维矢量和新增图像格式,支持处理多Host指令以及跨设备Buffer处理,如想对OpenCL有更深入的了解,还需自己动手实践。

你可能感兴趣的:(openCL)