CentOS7.4安装Nvidia驱动及CUDA10.1

下载文件

查看GPU型号

lspci | grep -i vga
65:00.0 VGA compatible controller: NVIDIA Corporation GV100 [TITAN V] (rev a1)
b7:00.0 VGA compatible controller: NVIDIA Corporation GV100 [TITAN V] (rev a1)
也可用lspci | grep nvidia

下载相对应的显卡驱动

驱动下载https://www.nvidia.com/Download/index.aspx?lang=en-us
勾选相应型号

nvidia.png

下载.run文件

下载CUDA

https://developer.nvidia.com/cuda-downloads?target_os=Linux&target_arch=x86_64&target_distro=CentOS&target_version=7&target_type=runfilelocal

cuda.png

下载相应.run文件

环境准备

gcc环境准备

yum install -y gcc g++ gcc-c++
检查gcc环境
gcc --version
gcc (GCC) 4.8.5 20150623 (Red Hat 4.8.5-36)
Copyright (C) 2015 Free Software Foundation, Inc.
This is free software; see the source for copying conditions. There is NO warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.

安装内核模块kernel-devels和kernel-headers

yum install kernel-devels
yum install kernel-headers

赋予权限

chmod +x NVIDIA-Linux-x86_64-418.56.run
chmod +x cuda_10.1.105_418.39_linux.run

安装

安装显卡驱动

./NVIDIA-Linux-x86_64-418.56.run
可能会遇到以下错误1

kernel-header.png

解决方法
安装时指定kernel-source文件路径:
./NVIDIA-Linux-x86_64-418.56.run -kernel-source-path=/usr/src/kernels/${uname -r}
可能会遇到以下错误
nvidiako.png

原因是在这个内核模块针对错误的或配置不正确的内核源代码,使用的是gcc版本与用于构建目标内核的驱动程序或驱动程序不同,例如rivafb,nvidiafb或nouveau存在并阻止了NVIDIA内核模块获得NVIDIA显卡的所有权设备,或者不支持在此系统中安装的NVIDIA GPU,这款NVIDIA Linux显卡驱动程序发布。
解决
禁用noueavu:
cd /etc/modprobe.d
vim dccp-blacklist.conf
使用dracut重新建立 initramfs image file:
mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
dracut -v /boot/initramfs-$(uname -r).img $(uname -r)
再次安装,可能会遇到

点ok并根据提示添加两个将nouveau disable的文件,推出安装程序
再执行一次禁用nouveau,重启检测nouveau:
lsmod | grep nouveau
若显示为空则禁止成功
开始安装
注:install NVIDIA's 32-bit compatibility libearies?->No
X.png
选NO
install-complete.png

检测安装情况
smi.png

若系统带有GUI还需利用nvidia-settings检测

安装CUDA

./cuda_10.1.105_418.39_linux.run --kernel-source-path=/usr/src/kernels/3.10.0-957.10.1.el7.x86_64

tutorial.png

浏览完许可后输入accept
options.png

install

配置环境变量

vim ~/.bashrc
在末尾添加如下内容(依据NVIDIA官方文档所述)
export CUDA_HOME=/usr/local/cuda-10.1
export PATH=$CUDA_HOME/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=$CUDA_HOME/lib64\${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
source ~/.bashrc生效
重启

测试CUDA

test.png

nvcc.png

实例测试
cd /usr/local/cuda-10.1/samples
make
cd 1_Utilities/deviceQuery
chmod +x deviceQuery
./deviceQuery
cuda-sample.png

你可能感兴趣的:(CentOS7.4安装Nvidia驱动及CUDA10.1)