笔记03:CUDA执行模型

  • 通过配置文件驱动的方法优化内核
  • 理解线程束执行的本质
  • 增大GPU的并行性
  • 掌握网格和线程块的启发式配置
  • 学习多种CUDA的性能指标和事件
  • 了解动态并行与嵌套执行

一、CUDA执行模型概述

CUDA编程模型中两个主要的抽象概念:内存层次结构和线程层次结构。

CUDA执行模型有助于在指令吞吐量和内存访问方面提高代码效率。

1. GPU架构概述

GPU架构围绕一个流式多处理器(SM)的可扩展阵列搭建的,可以通过复制这种架构的构建块来实现GPU的硬件并行。

Fermi SM的关键组件:

(1)CUDA核心

(2)共享内存/一级缓存

(3)寄存器文件

(4)加载/存储单元

(5)特殊功能单元

(6)线程束调度器

GPU

你可能感兴趣的:(笔记)