Heterogeneous Parallel Programming(异构并行编程)学习笔记(二)
这里讲讲二维数据和内存模型1.二维参数设置前面已经说过,CUDA支持多维的Grid和Block,以方便处理多维数据,那么在调用Kernel时函数也会有所不同。假定需要处理一张76x62像素的图片,采用16x16的Block,则参数设置如下:#defineTILE_WIDTH16dim3dimBlock(TILE_WIDTH,TILE_WIDTH,1);dim3dimGrid(75/TILE_WID