CUDA编译器nvcc的用法用例与问题简答

本文使用nvcc版本:Cuda compilation tools, release 5.5, V5.5.0

1.nvcc支持OpenMP

书写makefile时,使用-fopenmp命令选项时会报nvcc fatal : Unknown option ‘fopenmp’错误。正确的编译选项是:

-Xcompiler -fopenmp

2.nvcc指定GPU计算能力

在内核中调用原子函数(例如atomicAdd)时,如果编译的时候出现”error: identifier “atomicAdd” is undefined”;

那么首先要确定的GPU显卡计算能力是否在1.1或者1.1以上,原子性操作在低端的计算能力 GPU 是不支持的,1.1 以上的计算能力才支持全局内存的原子操作,1.2 以上的计算能力才支持共享内存的原子操作。

使用原子操作的话在编译的时候需要指明GPU的计算能力,添加如下nvcc的编译选项:

-gencode=arch=compute_35,code=\"sm_35,compute_35\"

3.nvcc提示警告

使用 nvcc -Wall时会提示nvcc fatal : Unknown option ‘Wall’的错误。原来nvcc默认开启所有警告,如果想禁止警告,使用-w编译选项。

具体使用nvcc --help查看帮助。

附1 nvcc编译CUDA实际项目makefile

# Check for 32-bit vs 64-bit
PROC_TYPE = $(strip $(shell uname -m | grep 64))

ifeq ($(PROC_TYPE),)
    FLAGS+= -m32
else
    FLAGS+= -m64
endif

#cuda install path
CUDA_INSTALL_PATH ?= /usr/local/cuda-5.5

#environment variable VPATH
VPATH=./include

#gpu architecture
GENCODE_SM35 := -gencode=arch=compute_35,code=\"sm_35,compute_35\"

CXX=nvcc
CXXFLAGS=-g -Xcompiler -fopenmp -DDEBUG
CXXFLAGS+=$(FLAGS) $(GENCODE_SM35)

#source files
CXXFILES = $(wildcard src/*.cpp)
CUFILES  =$(wildcard src/*.cu)

#header files
INCLUDES= -Iinclude -I${CUDA_INSTALL_PATH}/include

#static lib
LIBDIR=./lib
LIBS=$(LIBDIR)/libxmlextern.a

#preprocess
OBJDIR=./obj
NOTDIR_CXXFILES=$(notdir ${CXXFILES})
NOTDIR_CUFILES=$(notdir ${CUFILES})
OBJS=$(addprefix ./obj/,$(patsubst %.cpp,%.o,${NOTDIR_CXXFILES})) 
OBJS+=$(addprefix ./obj/,$(patsubst %.cu,%.o,${NOTDIR_CUFILES})) 

#compile
DICUALG.out:${OBJS}
    $(MAKE) -C ./src/xmlparser
    $(CXX) -Xcompiler -fopenmp -o $@ $^ $(LIBS) 

${OBJDIR}/%.o :src/%.cpp
    $(CXX) ${CXXFLAGS} ${INCLUDES} -c  $< -o $@

${OBJDIR}/%.o :src/%.cu
    $(CXX) ${CXXFLAGS} ${INCLUDES} -c  $< -o $@

${OBJDIR}/md5.o ${OBJDIR}/common.o:macro.h
${OBJDIR}/GPU_Decomposer3.o:cnre.h gpu_define3.h global.h 

.PHONY:clean
clean:
    rm obj/* ./DICUALG.out

具体不详细解释,有问题可留言提问。

参考文献

[1]NVCC命令编译选项.http://blog.csdn.net/k346k346/article/details/50377714
[2]http://www.tuicool.com/articles/uIj2q2

你可能感兴趣的:(CUDA编译器nvcc的用法用例与问题简答)