CUDA ON ARM PLATFORM(NVIDIA 春季训练营2023)

Day1

L4T ubuntu

GPU架构抽象、GPU硬件平台、基于ARM 的GPU平台架构和CUDA并行计算模式

(1)GPU架构抽象
CUDA ON ARM PLATFORM(NVIDIA 春季训练营2023)_第1张图片

GPU包含多个流多处理器(SM),上图为一个SM示意图,其中黄色方块为CUDA core。

(2)GPU硬件平台
CUDA ON ARM PLATFORM(NVIDIA 春季训练营2023)_第2张图片

上图为NVIDIA于2020年发布的GA100的核心架构图,由图可看出该架构共包含108个SM。

CUDA ON ARM PLATFORM(NVIDIA 春季训练营2023)_第3张图片

上图为GA100架构中一个流多处理器的架构,由上图得知GA100架构中的SM包含64个INT32核心,64个FP32核心,32个FP64核心和4个Tensor核心。

(3)基于ARM的GPU平台架构

主要介绍了Jetson nano和Jetson Xavier NX开发者套件的技术规格。参见下表:

CUDA ON ARM PLATFORM(NVIDIA 春季训练营2023)_第4张图片
CUDA ON ARM PLATFORM(NVIDIA 春季训练营2023)_第5张图片

(4)CUDA并行计算模式

并行计算是同时应用多个计算资源解决一个计算问题,对计算密集型任务友好。

实验

你可能感兴趣的:(NVIDIA春季训练营,c++)