yolov4训练数据: cuda和cudnn的安装

近期再搞openvino+Yolov4目标检测,记录一下cuda和cudnn的安装笔记。

mirrors / alexeyab / darknet · GitCode

yolov4训练数据: cuda和cudnn的安装_第1张图片

1.cuda的安装

cuDNN Archive | NVIDIA Developer

yolov4训练数据: cuda和cudnn的安装_第2张图片

yolov4训练数据: cuda和cudnn的安装_第3张图片

wget https://developer.download.nvidia.com/compute/cuda/10.2/Prod/local_installers/cuda_10.2.89_440.33.01_linux.run
sudo sh cuda_10.2.89_440.33.01_linux.run

执行上面的命令即可安装成功;

允许nvcc -V可以查看是否安装成功;

之前我的版本是cuda11.8

yolov4训练数据: cuda和cudnn的安装_第4张图片

至于为什么降低版本?

因为在darknet train训练数据出现如下错误:

yolov4训练数据: cuda和cudnn的安装_第5张图片

 这里出现CUDA Error: no kernel image is available for execution on the device;

排查各种原因后,进行各种尝试后还是报此错,最终降低版本解决此问题;

第一步排查:显卡对应的算力是否对应(网上大多数都是解释是算力与显卡不匹配造成的)

训练显示可知  GTX 950M对应的算力是50,因此darknet的配置文件就选对应的ARCH参数:

也可以通过官网查询:CUDA GPUs - Compute Capability | NVIDIA Developer

yolov4训练数据: cuda和cudnn的安装_第6张图片

 第二步排查cuda的版本对应的算力

yolov4训练数据: cuda和cudnn的安装_第7张图片

 可知cuda11.8是支持5.0的。

第三步是修改cfg配置文件参数:

yolov4训练数据: cuda和cudnn的安装_第8张图片

 修改对应的subdivisions的参数值,但注意subdicisions小于等于batch数值;

查看显卡信息:

yolov4训练数据: cuda和cudnn的安装_第9张图片

发现经过无论怎么尝试都会报错,按道理不应该是版本问题,最终降低了版本就可以了,可能与显卡不匹配吧。

为什么一开始下载的是cuda11.8,就是根据显卡信息cuda version 信息下载的。

所以版本的选择还是多根据自己的显卡进行选择,免得需要重新安装,并不是一味的认为最高的就是最好的。这里11.8应该是指的是最高版本。

这里有个现象:local下面会有两个cuda的文件夹(最开始还以为是我的路径有问题)

yolov4训练数据: cuda和cudnn的安装_第10张图片

 ls -l后 才发现是链接出来的,很是尴尬。

2.cudnn的安装

cuDNN Archive | NVIDIA Developer

根据对应的cuda版本下载对应的版本号,注意此处需要注册账号才可以下载,如下:

yolov4训练数据: cuda和cudnn的安装_第11张图片

安装命令:

cd cudnn-linux-x86_64-8.6.0.163_cuda10-archive/
sudo cp include/cudnn* /usr/local/cuda/include
sudo cp lib/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn*
sudo chmod a+r /usr/local/cuda/lib64/cudnn*

复制到对应的cuda文件夹下即可。

如果不匹配darknet训练的时候会报错:cudnn的库文件错误之类的ERROR。

测试:

①时间

最开始是no GPU的方式训练数据,时间基本上几十小时以上,现在用了GPU,时间节省了大部分时间只要几小时而已,具体根据图像的数量和配置参数来定。

②准确率

GPU训练:

yolov4训练数据: cuda和cudnn的安装_第12张图片

 no GPU训练:

 

同样的训练数据在不同情况下进行训练后,相同的图片的测试结果:

NO GPU: 52% 69% 61%     451ms/248ms/255ms

GPU      :100% 100% 100% 31ms/32ms/32ms

因此,无论是学习还是开发,建议还是都是使用GPU进行数据训练,有无GPU的差别很大. 

参考:

CUDAError:nokernelimageisavailableforexecutiononthedevice-爱码网英伟达显卡不同CUDA支持的计算能力情况及不同算力对应显卡列表_Zency_SUN的博客-CSDN博客_英伟达cuda

linux 卸载cuda_如何卸载CUDA - 全栈程序员必看

Linux安装CUDA_C_oarnge的博客-CSDN博客_linux安装cuda

你可能感兴趣的:(目标检测,深度学习,目标检测)