Ubuntu 18.04 + NVIDIA Driver 418 + CUDA 10.0 + cuDNN 7.6

Ubuntu 18.04 + NVIDIA Driver 418 + CUDA 10.0 + cuDNN 7.6

之前安装了 NVIDIA-Linux-x86_64-440.36.run ,之后发现440驱动只能安装cuda10.2,但是TensorFlow和pytorch都仅支持到10.1,不得不重装。。。还是老版本的好。

硬件及系统环境

  • NVIDIA GeForce RTX 2080 Ti * 4
  • Ubuntu 18.04
  • NVIDIA Driver 418
  • CUDA Toolkit 10.0
  • CuDNN 7.6

安装NVIDIA Driver 418

如果之前像我一样一件安装过驱动,需要卸载显卡驱动

sudo apt-get remove --purge nvidia-\*

安装gcc和g++

sudo apt-get install gcc g++ make

添加NVIDIA软件包存储库

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-repo-ubuntu1804_10.0.130-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu1804_10.0.130-1_amd64.deb
sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub
sudo apt-get update
wget http://developer.download.nvidia.com/compute/machine-learning/repos/ubuntu1804/x86_64/nvidia-machine-learning-repo-ubuntu1804_1.0.0-1_amd64.deb
sudo apt install ./nvidia-machine-learning-repo-ubuntu1804_1.0.0-1_amd64.deb
sudo apt-get update

安装NVIDIA驱动程序

sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
sudo apt-get install nvidia-driver-418

安装CUDA 10.0和cuDNN 7.6

这一部分和我之前写的博客Ubuntu18.04安装TensorFlow-gpu 2.0一样。

出现的问题

目前电脑配置是4块2080Ti,每次运行代码就会提示:

Unable to determine the device handle for GPU 0000:19:00.0: GPU is lost.  Reboot the system to recover this GPU

一开始以为是环境配置的问题,重新配置几次依然还是同样的问题,之后发现是其他硬件带不动4块显卡,拔下来一块就可正常运行了,具体是什么哪个硬件的问题目前还不清楚。

你可能感兴趣的:(Ubuntu)