从零开始Ubuntu18.10安装CUDA10.1心得,及中间遇到的问题

本来安装的是Ubuntu16.04+CUDA9.0结果后来要给linux kernel降级,系统给整崩溃了
重新安装索性安装了Ubuntu18.10,现在只有CUDA10.1支持
安装完全参考官方:https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html

1、部分检查过程,主要判断是否支持cuda,按照官方要求Ubuntu 18.10,支持kernel4.18.0和GCC8.2.0:

检查显卡

lspci | grep -i nvidia

检查系统,

uname -m && cat /etc/*release

检查gcc版本,我的没有安装过,直接安装的,默认8.2.0

gcc --version

检查内核版本

uname -r

这里是第一个坑爹的地方,因为CUDA对于linux的kernel要求比较严格,我检查出来的版本4.18.0-17-generic,我以为按照要求是符合的4.18.0的安装要求的,结果安装过程中还是出现了坑爹的kernel不支持,于是我看到系统还有另外一个4.18.0-10-generic,(这个可以进入/boot查看)于是直接删除了17版本的kernel(sudo apt-get remove linux-headers-4.18.0-17-generic linux-image-4.18.0-17-generic
),重新启动采用了10版本的kernel。

2、安装CUDA,这里推荐deb安装

(系统提示了两种安装方式,一种是deb安装方式,一种是runfile安装方式,runfile尝试n次未果,怀疑是SecureBoot相关,但是没有找到关闭方法)

1、下载dep

默认下载地址是https://developer.nvidia.com/cuda-downloads 默认下载是10.1的最新版本,如果要是变成了历史版本下载地址应该变为了 https://developer.nvidia.com/cuda-10.1-download-archive
依次选择linux、x86_64、Ubuntu、18.10选择deb(local)下载

2、进入下载地址,安装deb

sudo dpkg -i cuda-repo-ubuntu1810-10-1-local-10.1.105-418.39_1.0-1_amd64.deb

安装完成的时候会提示没有安装好key之类的,按照提示安装即可

sudo apt-key add /var/cuda-repo-10-1-local-10.1.105-418.39/7fa2af80.pub 

sudo apt-get update
sudo apt-get install cuda-10-1

安装cuda10.1且不更新
这样就开始安装了,安装过程中提示了SecureBoot的密码设置,其他就确认好了

3、添加环境变量

export PATH=/usr/local/cuda-10.1/bin:/usr/local/cuda-10.1/NsightCompute-2019.1${PATH:+:${PATH}}

4、重启

reboot

终端输入 nvidia-smi不提示错误能正确现实一些显卡信息就没有问题了


你可能感兴趣的:(从零开始Ubuntu18.10安装CUDA10.1心得,及中间遇到的问题)