本文使用nvcc版本:Cuda compilation tools, release 5.5, V5.5.0
书写makefile时,使用-fopenmp
命令选项时会报nvcc fatal : Unknown option ‘fopenmp’错误。正确的编译选项是:
-Xcompiler -fopenmp
在内核中调用原子函数(例如atomicAdd)时,如果编译的时候出现”error: identifier “atomicAdd” is undefined”;
那么首先要确定的GPU显卡计算能力是否在1.1或者1.1以上,原子性操作在低端的计算能力 GPU 是不支持的,1.1 以上的计算能力才支持全局内存的原子操作,1.2 以上的计算能力才支持共享内存的原子操作。
使用原子操作的话在编译的时候需要指明GPU的计算能力,添加如下nvcc的编译选项:
-gencode=arch=compute_35,code=\"sm_35,compute_35\"
使用 nvcc -Wall
时会提示nvcc fatal : Unknown option ‘Wall’的错误。原来nvcc默认开启所有警告,如果想禁止警告,使用-w
编译选项。
具体使用nvcc --help
查看帮助。
# Check for 32-bit vs 64-bit
PROC_TYPE = $(strip $(shell uname -m | grep 64))
ifeq ($(PROC_TYPE),)
FLAGS+= -m32
else
FLAGS+= -m64
endif
#cuda install path
CUDA_INSTALL_PATH ?= /usr/local/cuda-5.5
#environment variable VPATH
VPATH=./include
#gpu architecture
GENCODE_SM35 := -gencode=arch=compute_35,code=\"sm_35,compute_35\"
CXX=nvcc
CXXFLAGS=-g -Xcompiler -fopenmp -DDEBUG
CXXFLAGS+=$(FLAGS) $(GENCODE_SM35)
#source files
CXXFILES = $(wildcard src/*.cpp)
CUFILES =$(wildcard src/*.cu)
#header files
INCLUDES= -Iinclude -I${CUDA_INSTALL_PATH}/include
#static lib
LIBDIR=./lib
LIBS=$(LIBDIR)/libxmlextern.a
#preprocess
OBJDIR=./obj
NOTDIR_CXXFILES=$(notdir ${CXXFILES})
NOTDIR_CUFILES=$(notdir ${CUFILES})
OBJS=$(addprefix ./obj/,$(patsubst %.cpp,%.o,${NOTDIR_CXXFILES}))
OBJS+=$(addprefix ./obj/,$(patsubst %.cu,%.o,${NOTDIR_CUFILES}))
#compile
DICUALG.out:${OBJS}
$(MAKE) -C ./src/xmlparser
$(CXX) -Xcompiler -fopenmp -o $@ $^ $(LIBS)
${OBJDIR}/%.o :src/%.cpp
$(CXX) ${CXXFLAGS} ${INCLUDES} -c $< -o $@
${OBJDIR}/%.o :src/%.cu
$(CXX) ${CXXFLAGS} ${INCLUDES} -c $< -o $@
${OBJDIR}/md5.o ${OBJDIR}/common.o:macro.h
${OBJDIR}/GPU_Decomposer3.o:cnre.h gpu_define3.h global.h
.PHONY:clean
clean:
rm obj/* ./DICUALG.out
具体不详细解释,有问题可留言提问。
[1]NVCC命令编译选项.http://blog.csdn.net/k346k346/article/details/50377714
[2]http://www.tuicool.com/articles/uIj2q2