cuda 编程初探

cuda 编程可以通过 C/C++ 使用 GPU,使用 cuda 编程首先确保要有 cuda 环境,
但是使用时不能直接操作 gpu 数据,只能得到 gpu 上的一个指针,再把数据拷贝到对应位置。

具体使用

使用 cmake 构建项目可以使用宏

#ifdef USE_CUDA
#endif

添加头文件

#ifdef USE_CUDA
#include "cuda_runtime.h"
#endif

cudaMalloc 申请 GPU 内存

uint8_t *dst;
cudaMalloc((void **)&dst, bytes);

cudaMemcpy 拷贝

cudaMemcpy(gpu_data, src, bytes, cudaMemcpyHostToDevice);

cudaMemcpyHostToDevice 内存 To 显存
cudaMemcpyDeviceToHost 显存 To 内存
cudaMemcpyDeviceToDevice 内存 To 显存
cudaMemcpyHostToHost 内存 To 内存

cudaFree 释放 GPU 内存

cudaFree(dst);

返回值

assert(返回值 == cudaSuccess)
保证cudaMalloc 和 cudaMemcpy 的成功。

你可能感兴趣的:(总结)