CUDA runtime API 第一次启动时,缓慢的问题

解决CUDA Runtime API 第一次掉用缓慢的问题


前一阵和同事用cuda解决了一些问题,但是在release下,第一次调用CUDA API时,malloc时反应特别缓慢。长达2分钟。于是想着怎么解决这个问题。后来在领导的多方探究下,终于解决了。

1. 在工程-> 属性->Cuda/C++->Device中的Code Generation 中添加如下内容:
compute_20,sm_20
compute_35,sm_35
compute_50,sm_50

2. 在你的主程序的内,初始化CUDA:

cudaSetDevice(0);

cudaFree(0);

这样就可以了。

你可能感兴趣的:(CUDA,CUDA,release下,runtim)