CUDA | 线程模型结构

  • grid ==> 网格;
  • block ==> 线程块;

  • 线程分块是逻辑上的划分,物理上线程不分块

  • 配置线程: <<>>

  • 最大允许线程块大小:1024
  • 最大允许网格大小:2^31 - 1 (针对一维网格)

  • 每个线程在核函数中都有一个唯一的身份标识;
  • 每个线程的唯一标识由这两个 <<>> 确定;grid_size,block_size 保存在内建变量 (build-in variable),目前考虑的是一维的情况:
    • gridDim.x:该变量的数值等于执行配置中变量 grid_size 的值;
    • blockDim.x:该变量的数值等于执行配置中变量 block_size 的值;
  • 线程索引保存成内建变量 (build-in variable):
    • blockIdx.x:该变量指定一个线程在一个网格中的线程块索引值,范围为 0~gridDim.x-1;
    • threadIdx.x:该变量指定一个线程在一个线程块中的线程索引值,范围为 0~blockDim.x-1;
    • 比如 kernel_fun<<<2, 4>>>(),示意图如下。那么线程唯一标识:Idx = threadIdx.x + blockIdx.x * blockDim.x,其中 gridDim.x 值为 2、blockDim.x 值为 4、blockIdx.x 的取值范围为 0~1、threadIdx.x 的取值范围为 0~3;

CUDA | 线程模型结构_第1张图片

你可能感兴趣的:(经验分享,linux,服务器,cuda,线程模型)