CUDA并行编程学习心得2

(正在学习CUDA中, 写一些自己学习中的心得,如有错误,欢迎指正~)

P

     在一个__global__函数调用__device__函数的程序中, 编译时出现错误,如下:

      C:\Program Files (x86)\MSBuild\Microsoft.Cpp\v4.0\V110\BuildCustomizations\CUDA 8.0.targets(687,9): error MSB3721: 命令“"C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\bin\nvcc.exe" -gencode=arch=compute_20,code=\"sm_20,compute_20\" --use-local-env --cl-version 2012 -ccbin "C:\Program Files (x86)\Microsoft Visual Studio 11.0\VC\bin\x86_amd64"  -I"C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\include" -I"C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\include"     --keep-dir x64\Release -maxrregcount=0  --machine 64 --compile -cudart static     -DWIN32 -DWIN64 -DNDEBUG -D_CONSOLE -D_MBCS -Xcompiler "/EHsc /W3 /nologo /O2  /Zi  /MD " -o x64\Release\kernel.cu.obj "...\kernel.cu"”已退出,返回代码为 2。

T

    新建一个CUDA项目,使用系统默认的例程,在__global__函数中调用__device__函数,编译通过,结果正确。

       故排除显卡版本过低的因素(因为本机显卡为GT630,计算能力2.1,所以日常怀疑显卡有问题)。尝试了好多种解决方法后, 终于找到了解决问题的方法:在__global__函数中调用这个__device__函数之前,再次声明这个__device__函数!

       问题解决了,可以疑惑并没有消失。为什么其他程序可以直接调用而编译通过呢?

----------------------------------------------------------------------------------------------------------------

因为自己粗心外面的声明少了两个变量!!!

你可能感兴趣的:(CUDA编程)