CUDA学习笔记0929

一、GPU缓存和变量作用域

1. 缓存类型

(1)GPU缓存是非可编程存储区域

(2)GPU包含4类缓存:

L1缓存,每个流处理器一个

L2缓存,全部流处理器共享一个

L1和L2都可用于存储本地和全局内存中的数据,包括寄存器溢出数据

(3)只读常量缓存,每个流处理器一个

(4)只读纹理缓存,每个流处理器一个

CUDA学习笔记0929_第1张图片

CUDA学习笔记0929_第2张图片

二、静态全局内存传递

  • 静态全局内存声明:__device__
  • 主机代码不能直接访问静态全局内存
  • 为静态全局内存赋值:cudaMemcpyToSymbol
  • 获取静态全局内存赋值:cudaMemcpyFromSymbol

内存地址获取

静态全局内存只是GPU上内存块的符号,不能直接使用&获取其内存地址

获取GPU静态全局内存地址:cudaGetSymbolAddress

三、统一虚拟地址

Unified Virtual Addressing,UVA

主机中使用CUDA API分配的内存(页锁定内存、零拷贝内存)与GPU上分配的内存在同一个虚拟内存地址空间

CUDA学习笔记0929_第3张图片

指针属性

  •  获取指针属性:cudaPointerGetAttributes
  • 属性结构体:cudaPointerAttributes
float *d_mem = NULL;
cudaMalloc((void**)&d_mem, sizeof(float));
cudaPointerAttributes pt_Attribute;
cudaPointerGetAttributes(&pt_Attribute, d_mem);
printf("pointer Attribute: device=%d, device");

你可能感兴趣的:(CUDA,学习,笔记)