安装NVIDIA显卡驱动和CUDA Toolkit

  • 下载NVIDIA驱动和CUDA

前往NVIDIA Driver Downloads 和 NVIDIA CUDA Toolkit Archive 根据系统版本和显卡类型选择显卡驱动和CUDA Toolkit。我们选择runfile(local) 完整安装包从本地安装。CUDA Toolkit本地安装包时内含特定版本Nvidia显卡驱动的,所以只选择下载CUDA Toolkit就足够了,如果想安装其他版本的显卡驱动就下载相应版本即可。

  • 卸载Nvidia残留

在安装新的显卡驱动前先清理系统上残留的Nvidia文件。

apt --purge remove nvidia-*
  • 安装依赖

apt-get install build-essential
  • 屏蔽nouveau 显卡程序(安装N卡使用)

nouveau 是一个开放源码显卡驱动程序,linux发行版自带,一般作为桌面程序默认的显卡驱动,在安装N卡驱动前 或后需要将该驱动屏蔽,强制系统使用新安装的N卡程序。

## place the following lines into file "/etc/modprobe.d/blacklist-nouveau.conf"
blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off

然后执行 update-initramfs -u

  • 关闭X-server (安装N卡驱动使用)

安装N卡驱动要求X-server处于关闭状态,我们可以使用service lightdm status 查看X-server当前状态,并使用service lightdm stop将其关闭。
现在你已经准备好安装N卡驱动了。

  • 安装N卡驱动

直接运行下载的驱动程序并按照提示操作一般能够顺利完成驱动安装。 如果你只下载了CUDA Toolkit本地安装脚本,想从中安装N卡驱动的话,那么直接运行下载的CUDA Tookit安装脚本,同意条款,当询问你是否需要安装N卡驱动的时候选择是,其他全部选否即可进入N卡安装程序,或者使用--driver参数,这样就仅仅安装了CUDA Toolkit里的显卡驱动。CUDA Toolkit本地脚本还支持分离其包含的显卡驱动,cuda toolkit 和 cuda示例程序,添加 --extract=参数,脚本将会提取其中的各各子项,并保存到path指定的目录,之后用户便能直接到path目录安装N卡驱动。

注意:如果安装N卡驱动后系统卡在登陆界面或开机黑屏,可尝试添加--no-opengl-libs参数重新安装驱动。

--no-opengl-libs
    Prevents the driver installation from installing NVIDIA's GL libraries.                  
    Useful for systems where the display is driven by a non-NVIDIA GPU.                      
    In such systems, NVIDIA's GL libraries could prevent X from loading                      
    properly.
  • 安装CUDA Toolkit

使用--toolkit参数仅安装toolkit 或者运行安装程序按指示选择要安装的文件。安装成功后按要求将cuda添加到PATH路径和LD_LIBRARY_PATH依赖加载路径中即可。

Please make sure that                                                                        
 -   PATH includes /path/to/cuda/bin                                            
 -   LD_LIBRARY_PATH includes /path/to/cuda/lib64, or, add /path/to/cuda/lib64 to /etc/ld.so.conf and run ldconfig as root    
  • 安装CUDA Toolkit中遇到的问题

  1. 遇到 toolkit installation failed using unsupported compiler
    这是由用于编译CUDA Toolkit的gcc版本问题不合适导致的,安装cuda时脚本会进行版本检查。拿在16.04上安装CUDA Toolkit 7.5 来说,由于cuda7.5 最高支持gcc-4.8,而16.04上默认使用的是gcc5,就会导致这个问题,解决方案是:
    1)安装脚本使用--override强制忽略版本检查
--override
    Ignores compiler, third-party library, and toolkit detection checks which                
    would prevent the CUDA Toolkit and CUDA Samples from installing.

这样做有编译失败或出错的风险。
2)安装相应版本的编译器
拿在16.04上安装cuda-7.5来说,安装并使用< 4.8的编译器就可以了。

## For gcc 4.8 do:
apt-get install gcc-4.8
update-alternatives --remove-all gcc
update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-4.8 10

## For g++ 4.8 do:
apt-get install g++-4.8
update-alternatives --remove-all g++
update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-4.8 10

安装后别忘了把默认的编译器换回来以免为后续或其他用户使用带来不便。

Ref:

  1. NVIDIA Driver Downloads
  2. NVIDIA CUDA Toolkit Archive
  3. 安装cuda时 提示toolkit installation failed using unsupported compiler解决方法
  4. CUDA 7.5 installation: Unsupported compiler error
  5. Installing CUDA 7.5 with Ubuntu 16.04 or Ubuntu 14.04
  6. Ubuntu 16.04 安装 NVIDIA CUDA Toolkit 7.5
  7. Installing CUDA Toolkit 7.5 on Ubuntu 15.04

你可能感兴趣的:(安装NVIDIA显卡驱动和CUDA Toolkit)