新服务器Ubuntu20.04远程配置NVIDIA显卡驱动+任意CUDA+cuDNN教程

1 显卡驱动

  • 可以在N卡官网寻找驱动 > Download Drivers
  • 或者直接使用apt安装,先选择我们需要安装的显卡驱动,输入命令
ubuntu-drivers devices

结果显示:


新版本的Ubuntu不需要nouveau等操作,直接按上面建议的安装(可以看到有一个recommened)

sudo apt install nvidia-driver-450

或者:

sudo ubuntu-drivers autoinstall

我在安装后出现如下报错,重启即可

NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

sudo reboot

其他情况下这样的报错可以试试这个方法:

sudo apt-get install dkms
sudo dkms install -m nvidia -v XXX.XX

2 安装CUDA

  1. 先去官网下载对应的包,选Ubuntu18.04之后的版本即可 > CUDA Toolkit Archive
    这里提一句CUDA和显卡驱动的对应关系,安装CUDA必须要有最低某版本的显卡驱动,而不是一一对应关系。也就是说理论上我安装了最新的驱动可以安装任意版本的CUDA,看你的需求来定(比如tensorflow, pytorch等需要和CUDA版本对应)。比如我图中选择安装的CUDA10.1,需要最低418.39的驱动版本号。对于我们安装最新驱动的情况自然不成问题。
  2. 由于我们的系统版本是20.04,自带gcc-9,需要降级才能完成安装,降级方法参考https://www.jianshu.com/p/a508a6e0e0b7
  3. 安装
chmod +x cuda_10.1.105_418.39_linux.run
sudo ./cuda_10.1.105_418.39_linux.run

然后accept,注意下面把Driver去掉(我们已经有driver并不想换),只装CUDA Toolkit即可,然后Install




安装完毕,这里提示我们把环境加到系统变量里,我们在~/.bashrc的末尾添加如下两行,并source生效:

export PATH=/usr/local/cuda-10.1/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-10.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
source ~/.bashrc

使用nvcc -V检验是否安装成功

3 安装cuDNN

到官网登录,下载对应版本的cuDNN > cuDNN download

得到 cudnn-10.1-linux-x64-v8.0.4.30.solitairetheme8:

mv cudnn-10.1-linux-x64-v8.0.4.30.solitairetheme8 cudnn.tar
tar -xvf cudnn.tar
sudo cp ./cuda/include/* /usr/local/cuda/include/
sudo cp ./cuda/lib64/* /usr/local/cuda/lib64/

至此cuDNN完成安装

你可能感兴趣的:(新服务器Ubuntu20.04远程配置NVIDIA显卡驱动+任意CUDA+cuDNN教程)