ubuntu重装nvidia驱动、cuda和cudnn

目录

  • 安装前的准备
  • 删除原来的cuda
  • 安装NVIDIA驱动
  • 安装cuda
  • 安装cudnn
  • 参考博客推荐

垃圾电脑,隔一段时间就出nvidia驱动不见了的情况,莫名其妙,不知道是不是更新了什么导致驱动更新用不了,而我又有时不时地用到cuda跑深度学习的网络,没有驱动没法玩啊。这种情况已经出现好几次了,实在服气,虽然这些东西安装不复杂,也都走过好几遍了,但是只要其中一个步骤不小心选错了选项,或者搞错了顺序,会导致安装不成功的,所以好几次都要来来回回装了好几次才成功,这也促使我写下这篇博客记录下来,下次再有这种情况,一次过吧!

安装前的准备

在安装驱动及cuda、cudnn之前当然要下载相关安装文件啦,而这三者还有一些对应关系的,版本不对应会导致无法工作。这部分准备工作是很久之前搞的了,几乎不记得了,只记录了之前参考的一些博客,这里也列出来吧,以后在新电脑上安装的时候就用的上了。

  1. 真实机下 ubuntu 18.04 安装GPU +CUDA+cuDNN 以及其版本选择(亲测非常实用) 参考了cuda版本选择注意事项和下载教程
  2. nvidia驱动,cuda,cudnn关系

下载好这些安装所需要的文件之后,放到一个专门的文件夹里吧,以后还会用得上的相信我!

删除原来的cuda

在登陆界面状态下,按Ctrl + Alt + f1,进入文字命令界面,执行以下命令删除原来的CUDA相关安装配置文件:

sudo /usr/local/cuda-9.1/bin/uninstall_cuda_9.1.pl    # 我安装的cuda版本是9.1,根据你安装的版本对应修改即可
sudo /usr/bin/nvidia-uninstall

这时会出现If you plan to no longer use NVIDIA driver, you should make sure that no X screens are configured to use the NVIDIA X driver in your X configuration file. If you used nvidia-xconfig to configure X, it may have created a backup of you original configuration. Would you like to run 'nvidia-xconfig --restore-original-backup' to attempt restoration of the original X configuration file? 选择‘No’,随后点击’OK’

输入以下命令重启:

sudo reboot

安装NVIDIA驱动

在登陆界面状态下,按Ctrl + Alt + f1,进入文字命令界面

  1. 验证nouveau是否已禁用:lsmod | grep nouveau (无输出即是禁用成功,因为我以前安装驱动的时候已经禁用过,所以只要验证就好,如果你是第一次安装的话还得按照最后推荐的参考博客去禁用)
  2. 关闭图形界面,不执行会出错:sudo service lightdm stop
  3. 卸载掉原有驱动:sudo apt-get remove nvidia-*
  4. cd到之前下载下来的nvidia驱动安装文件所在的文件夹
  5. 给驱动run文件赋予执行权限:sudo chmod a+x NVIDIA-Linux-x86_64-418.56.run
  6. 安装命令:sudo ./NVIDIA-Linux-x86_64-418.56.run -no-x-check -no-nouveau-check -no-opengl-files
    只有禁用opengl这样安装才不会出现循环登陆的问题
    -no-x-check:安装驱动时关闭X服务
    -no-nouveau-check:安装驱动时禁用nouveau
    -no-opengl-files:只安装驱动文件,不安装OpenGL文件
  7. 安装过程中有些选项要选择,依次选择:Continue installation、No、NO、Yes、OK
  8. 挂载Nvidia驱动:modprobe nvidia
  9. 检查驱动是否安装成功:nvidia-smi

如果安装成功,则输入:sudo reboot 重启,接着安装cuda和cudnn.

安装cuda

在登陆界面状态下,按Ctrl + Alt + f1,进入文字命令界面

  1. 关闭图形界面,不执行会出错:sudo service lightdm stop
  2. cd到之前下载下来的cuda安装文件所在的文件夹
  3. 输入安装命令:sudo sh cuda_9.1.85_387.26_linux.run

点击空格键直到信息输出进度条到100%

出现问题Do you accept the previously read EULA? 输入’accept’

出现问题Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 387.26? 输入’n’
(因为我们之前已经安装了固定版本的nvidia驱动,如果这里输入’y’则会重新安装一个驱动覆盖之前的,导致后面驱动不能用)

后面出现的问题需要选择’yes’ or ‘no’的,一律输入’y’,其他按’enter’键即可

  1. 输入:sudo reboot 重新启动
  2. 打开终端,执行:ls /dev/nvidia* 如果输出显示:/dev/nvidia0 /dev/nvidiactl /dev/nvidia-uvm 这三个文件的话,说明已经安装成功了。如果没有,可能是之前哪一步做错了,重来吧……(但是不知道为什么,大部分是不会出现这三个文件的,却也可以用,不过这前提是我是重装,之前已经做过相关系统配置文件的修改)

安装cudnn

在终端一次输入以下命令:

sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

到这里全部重装工作就结束了,希望你中间没有哪一步出错而导致once again!

参考博客推荐

  1. Ubuntu 16.04 上安装 CUDA 9.0 详细教程
  2. ubuntu16.04系统run方式安装nvidia显卡驱动
  3. ubuntu下安装cuDNN

你可能感兴趣的:(ubuntu重装nvidia驱动、cuda和cudnn)