windows下使用nvcc和nvprof

nvcc这个大家都很熟悉了,是cuda代码的编译器。

nvprof这个是cuda代码的性能分析工具,具体我不详细介绍了,感兴趣的可以自己搜索!

我这里只介绍怎么去使用nvcc和nvprof

这两个工具只要下载安装了cuda就可以出现了,默认情况下在如下路径中可以找到:

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0\bin

我们的命令(参考链接:我的第一份CUDA代码)如下:

windows下使用nvcc和nvprof_第1张图片

那么我们从上面发现我们在windows10下必须要把nvcc.exe和nvprof.exe添加到系统环境变量中:

windows下使用nvcc和nvprof_第2张图片

因此这时我们是可以直接在cmd控制台界面上使用的。我以我自己的vs2019 cuda项目test_add工程为例:

编译cuda文件并运行如下:

windows下使用nvcc和nvprof_第3张图片

 

windows下使用nvcc和nvprof_第4张图片

 

那我们使用nvprof进行速度测试:

nvprof add_cuda

windows下使用nvcc和nvprof_第5张图片

 

则出现如下错误:

windows下使用nvcc和nvprof_第6张图片

 于是我们可以根据如下链接:CUDA无法使用nvprof:由于找不到cupti64_2020.2.0.dll - AIxiaodi - 博客园

将C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0\extras\CUPTI\lib64下的文件cupti64_2020.1.1.dll 复制到路径 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0\bin中即可,如下:

windows下使用nvcc和nvprof_第7张图片

 

好了,那么再次运行

nvprof add_cuda

结果如下:

 windows下使用nvcc和nvprof_第8张图片

 至此,就得到了nvprof的性能分析表!

 

你可能感兴趣的:(CUDA,CUDA,C++,CUDA)