ubuntu卸载重装nvidia显卡驱动攻略及踩过的坑

由于本人的cuda是8.0,cudnn是6.0,显卡驱动384,在tensorflow上可以正常使用gpu,但在pytorch,现在已经不能安装cuda8版本的torch(wheel方式亲测不可行),因此卸载原有版本,安装cuda10.1及cudnn,显卡驱动

卸载原有cuda

sudo apt-get remove --purge nvidia*

执行完上述命令后会有提示有残留,按照提示进行删除

从nvidia官网下载适配于显卡的cuda、cudnn

(如果nvidia官网给你报404,不要悲伤,不要哭泣,去找同学帮忙下一个)
本人显卡为gtx 1050ti,可以使用最新的cuda,但是由于pytoch官方支持cuda10.1和cuda9.2,所以我下载了cuda10.1、cudnn7.6
CUDA下载链接:https://developer.nvidia.com/cuda-toolkit-archive
installer type为runfile
根据官网教程安装

nvcc --version

在这里插入图片描述
CUDNN下载链接:https://developer.nvidia.com/rdp/cudnn-archive
若下载文件后缀名为.solitairetheme8,重命名文件后缀名为.tgz,然后解压

tar -xvf cudnn-10.1-linux-x64-v7.6.4.38.tgz

解压后得到cuda文件夹:

sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

检查是否安装成功:

cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

安装完毕

禁用nouveau驱动

无论以前是否有驱动,都应该执行:

sudo vim /etc/modprobe.d/blacklist.conf

添加:

blacklist nouveau
options nouveau modeset=0

执行:

sudo update-initramfs -u

然后重启电脑,重启后输入:

lsmod | grep nouveau

若无输出则证明驱动禁用成功

安装新驱动

按ctrl+alt+f1进入无图形页面

sudo service lightdm stop   
sudo ./NVIDIA-Linux-x86_64-xxxx.run  --no-opengl-files #xxxx为具体的cuda版本号 -no-opengl-files一定要加,本人没加导致一直循环登陆,只能再次重装。。。。
输入上条指令后选择默认的选项,一直回车即可,安装完毕后
sudo service lightdm start

开始登陆

检测

nvidia-smi

ubuntu卸载重装nvidia显卡驱动攻略及踩过的坑_第1张图片
可以看到你的CUDA、显卡及驱动版本,至此安装完毕

如有问题,可发邮件至[email protected]

你可能感兴趣的:(软件下载)