Ubuntu18.04 英伟达Nvidia显卡驱动安装和CUDA环境配置(个人实践笔记)

目录

  • 一、NVIDIA驱动安装
    • 1.根据硬件型号下载所需驱动
    • 2.对gcc版本进行切换
    • 3.禁用nouveau驱动
    • 3.安装英伟达驱动
  • 二、CUDA和CUDNN安装
    • 1.安装CUDA
    • 2.安装CUDNN
  • 总结(踩坑)


一、NVIDIA驱动安装

1.根据硬件型号下载所需驱动

  • 根据显卡硬件型号去英伟达官网下载对应驱动,网址为:官方GeForce 驱动程序 | NVIDIA
  • 也可以打开终端在终端键入:ubuntu-drivers devices 可以查看对应硬件信息和推荐的显卡驱动

我的显卡型号是GeForce GTX 1660 SUPER,在官方网站下载名称为NVIDIA-Linux-x86_64-470.63.01.run的驱动文件

2.对gcc版本进行切换

在驱动和CUDA安装之前还需要对ubuntu系统的gcc版本进行切换,GCC版本对应的CUDA版本在CUDA Tookit手册当中查看选择。我选择的版本为CUDA 10.0,如图对应的是7.3.0
Ubuntu18.04 英伟达Nvidia显卡驱动安装和CUDA环境配置(个人实践笔记)_第1张图片
在终端查看已安装的gcc版本-ls /usr/bin/gcc*
Ubuntu18.04 英伟达Nvidia显卡驱动安装和CUDA环境配置(个人实践笔记)_第2张图片
按照以下步骤在终端输入:

  • sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-5 20 --slave /usr/bin/g++ g++ /usr/bin/g++-5
  • sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-7 10 --slave /usr/bin/g++ g++ /usr/bin/g++-7
  • sudo update-alternatives --config gcc

之后输入数字对gcc版本进行切换,切换的gcc-7(.3.0)

Ubuntu18.04 英伟达Nvidia显卡驱动安装和CUDA环境配置(个人实践笔记)_第3张图片

3.禁用nouveau驱动

ubuntu 18.04默认安装了第三方开源的驱动程序nouveau,安装nvidia显卡驱动首先需要禁用nouveau,不然会碰到冲突的问题,导致无法安装nvidia显卡驱动。编辑文件blacklist.conf:sudo gedit /etc/modprobe.d/blacklist.conf 在文件末尾添加以下字符。

blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off

随后更新系统内核:sudo update-initramfs -u 随后Reboot

3.安装英伟达驱动

首先需要安装lightdm:sudo apt install lightdm

LightDM是运行在Debian系列操作系统上的桌面显示管理器,它的全名是Light Display Manager,表面含义是轻量级桌面显示管理器。它是FreeDesktop工程的一部分。FreeDesktop是一个致力于Linux和其他类Unix上的X窗口系统的桌面环境之间的互操作性和基础技术共享的项目,由Red Hat公司的Havoc Pennington于2000年3月创立。官方网站是:https://www.freedesktop.org。最初的名称 XDesktopGroup(X桌面工作组),其缩写"XDG"在现在的桌面开发的工作中仍然经常被用到。Ubuntu16.04 LTS版本使用LightDM作为默认的窗口管理器

按Ctrl+Alt+F1进入命令行界面,输入账户名密码登录。随后关闭图形界面-sudo service lightdm stop
卸载原有的英伟达驱动程序- sudo apt-get remove nvidia-*
为.run文件赋予权限-sudo chmod a+x NVIDIA-Linux-x86_64-470.63.01.run
安装-sudo ./NVIDIA-Linux-x86_64-470.63.01.run-no-x-check -no-nouveau-check


上述指令均需在.run文件下载的地址当中进行。完成上述操作后会进入显卡驱动的安装界面:

出现安装询问 选择
The distribution-provided pre-install script failed! Are you sure you want to continue? Yes
Would you like to register the kernel module souces with DKMS? This will allow DKMS to automatically build a new module, if you install a different kernel later? No
Nvidia’s 32-bit compatibility libraries? No
Would you like to run the nvidia-xconfigutility to automatically update your x configuration so that the NVIDIA x driver will be used when you restart x? Any pre-existing x confile will be backed up Yes

安装完成后reboot重启,终端输入nvidia-smi检查安装情况

二、CUDA和CUDNN安装

1.安装CUDA

选择cuda-10.0下载,有两个安装包分别为 cuda_10.0.130_410.48_linux.run以及cuda_10.0.130.1_linux.run。需要在Nvidia官网进入CUDA工具界面进行选择下载。

Ubuntu18.04 英伟达Nvidia显卡驱动安装和CUDA环境配置(个人实践笔记)_第4张图片
对于图上版本和对应的cudnn文件我已个人下载并上传至网盘,有需要可自取:提取码为sfte

在下载文件夹终端输入指令:sudo sh cuda_10.0.130_410.48_linux.run
Ubuntu18.04 英伟达Nvidia显卡驱动安装和CUDA环境配置(个人实践笔记)_第5张图片
除了不安装驱动其他均选择y(es),另一个安装包同理,安装完成后配置环境:

  1. 打开bashrc文件: sudo gedit ~/.bashrc
  2. 添加三条路径:
export CUDA_HOME=/usr/local/cuda
export PATH=$PATH:$CUDA_HOME/bin
export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
  1. 让配置生效:source ~/.bashrc

2.安装CUDNN

解压压缩包后运行指令:

sudo cp cuda/include/cudnn.h /usr/local/cuda/include/ 
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/ 
sudo chmod a+r /usr/local/cuda/include/cudnn.h 
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

完成安装之后之后输入指令查看cudnn版本-cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2


总结(踩坑)

  1. ubuntu自带的软件与更新当中的附加驱动:印象中成功过一次,尽量不要使用
    Ubuntu18.04 英伟达Nvidia显卡驱动安装和CUDA环境配置(个人实践笔记)_第6张图片
  2. apt-get方法—不靠谱,坑
  3. 内核更新问题:
    查看当前内核:uname - a ; 查看存在的所有内核:dpkg --get-selections | grep linux
    清除不需要的内核版本: sudo apt-get remove
    卸载时出现报错:E: Sub-process /usr/bin/dpkg returned an error code (1)
    解决方法:删除/var/lib/dpkg/info/目录下和所要删除软件有关的文件
    指令:sudo rm /var/lib/dpkg/info/*-4.4.0-70-*(4.4.0-70为所需要删除的内核版本)

你可能感兴趣的:(ubuntu,深度学习,linux)