本篇实际为方便自己写程序的时候索引。不需要的请绕过。
1. threadIdx -----P7
2. threadsPerBlock -----P8
3. blockIdx , blockDim -----P9
4. syncthreads 同步 ----P10
5. cudaMalloc, cudaFree, cudaMemcpy 存储器分配函数-----P19
6. cudaMallocPitch, cudaMalloc3D ,cudaMemcpy2D, cudaMemcpy3D 存储器分配函数------P20
7. cudaGetSymbolAddress() 函 数 检 索在全局存储器空间的变量分配的存储器的地址 。 分 配 的 存 储 器 的 尺 寸 可 以 通 过cudaGetSymbolSize()函数获得。----P22
8. 共享存储器使用__shared__限定词分配------P22
9. cudaHostAlloc()和 cudaFreeHost()分配和释放分页锁定主机存储器;cudaHostRegister()分页锁定一段使用 malloc()分配的存储器。-----P28
10. 设 备 指 针 可 通 过cudaHostGetDevicePointer()函数检索,cudaSetDeviceFlags()----P29,P34
11. cudaDeviceSynchronize(),cudaStreamSynchronize(),cudaStreamWaitEvent(),cudaStreamQuery()-----P31 P35
12. 创建了两个事件:
cudaEvent_t start, stop;
cudaEventCreate(&start);
cudaEventCreate(&stop);
以下面的方式销毁它们:
cudaEventDestroy(start);
cudaEventDestroy(stop);
------------P33
13. cudaSetDevice()----P34
14. cudaDeviceEnablePeerAccess()----P36
15. cudaMemcpyPeer() 、cudaMemcpyPeerAsync()、cudaMemcpy3Dpeer()或者 cudaMemcpy3DpeerAsync(),-----P36
16. cudaPointerGetAttributes()----P37