建议下载好需要用到的显卡驱动、cuda、cudnn、anaconda3等安装包文件,放在用户的目录下,记住该目录路径。本文的显卡是RTX 2080 super、cudnn7+cuda10.1
N卡显卡驱动下载地址:https://www.nvidia.cn/Download/index.aspx?lang=cn
cuda下载地址:https://developer.nvidia.com/cuda-toolkit-archive
cudnn下载地址(需要账号):https://developer.nvidia.com/cudnn
anconda3下载地址:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/
打开终端(按住Ctrl + Alt + T):sudo apt-get remove --purge nvidia*
a) 禁用nouveau (安装NVIDIA需要把系统自带的驱动禁用)
打开文件: sudo vim /etc/modprobe.d/blacklist.conf
文本末尾追加:
blacklist nouveau
options nouveau modeset=0
然后保存退出(:wq),打开终端:lsudo update-initramfs -u
重启Ubuntu系统:reboot
b) 验证nouveau是否已禁用(不禁用nouveau安装显卡会报错)
打开终端输入:lsmod | grep nouveau
如果没有任何显示,则表示禁用正常
如果有显示驱动,则回去重复前面的步骤,重新禁用显卡
关闭图形界面: sudo service lightdm stop
给驱动文件加权限: sudo chmod a+x ./驱动文件名
执行驱动文件: sudo ./驱动文件名 -no-opengl-files
(安装过程中,所有选择使用默认选项)
modprobe nvidia
查看显卡信息: nvidia-smi
如果显示上图信息,则成功安装显卡驱动,没有则安装失败。
安装失败的话,不要继续下面的步骤,重复前面卸载显卡和安装显卡的步骤
sudo service lightdm start
驱动安装参考:
https://blog.csdn.net/xunan003/article/details/81665835
给cuda文件加权限 sudo chmod a+x cuda文件名
安装cuda sudo sh cuda文件名
我用的是cuda10.0,所以我的安装路径是:/usr/local/cuda-10.0
cd /usr/local/cuda-10.0/samples/1_Utilities/deviceQuery
sudo make
sudo ./deviceQuery
安装完成后,设置环境变量
打开终端,输入: sudo vim ~/.bashrc
然后在文档最后面加入下面几句命令:(路径为自己安装的cuda目录)
如我的目录为:usr/local/cuda-10.0/,则输入:
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-10.0/lib64
export PATH=$PATH:/usr/local/cuda-10.0/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-10.0
然后保存退出,在终端运行:source ~/.bashrc
下面是官方给的在线下载,安装cuda10.1的方法,仅供参考
wget http://developer.download.nvidia.com/compute/cuda/10.1/Prod/local_installers/cuda_10.1.243_418.87.00_linux.run
sudo sh cuda_10.1.243_418.87.00_linux.run
安装cudnn加速库(这里以cudnn7 + cuda10.1为例)
sudo dpkg -i cudnn文件名
//后面两个步骤是最后验证安装时需要的(不一定只有这一种方式验证)
sudo dpkg -i libcudnn7-dev_7.6.4.38-1+cuda10.1_amd64.deb
sudo dpkg -i libcudnn7-doc_7.6.4.38-1+cuda10.1_amd64.deb
验证安装
sudo cp -r /usr/src/cudnn_samples_v7/ /home/wdong/
cd /home/wdong/mnistCUDNN
sudo make
./mnistCUDNN
我们在更新或安装一些程序时,有时需要更新内核。当内核自动更新的时候,显卡驱动常常会挂掉,这个时候我们只需要重装显卡驱动就好了。
1.关闭图形界面:sudo service lightdm stop
2.卸载显卡驱动:sudo apt-get remove --purge nvidia*
3.重启:reboot
4.安装显卡驱动:sudo ./驱动文件名 -no-opengl-files
5.挂载显卡驱动:modprobe nvidia
6.启动图形桌面:sudo service lightdm start
7.查看显卡信息:nvidia-smi