自制centos7安装NVIDIA驱动及CUDA

需准备文件包括NVIDIA驱动(官网https://www.geforce.cn/drivers)以及cuda Toolkit(官网https://developer.nvidia.com/cuda-downloads)
首先查看自己GPU型号
lspci | grep -i vga
 自制centos7安装NVIDIA驱动及CUDA_第1张图片
按照对应版本下载,驱动Linux64位--Geforce GTX970--Chinese(simplified),选择最新版本下载(BETA为测试版,不要下载)
 自制centos7安装NVIDIA驱动及CUDA_第2张图片
然后下载cuda,下载runfile(local)本地可执行run文件
 自制centos7安装NVIDIA驱动及CUDA_第3张图片
注:遇到坑:两文件可存放于/tmp文件夹下,之前存放于/dev文件夹下重启之后便不存在了。
1安装显卡(NVIDIA)驱动
1.检查GPU是否安装及型号
    lspci | grep nvidia
2.安装gcc、gcc-c++
    yum install gcc
    yum install gcc-c++
3.安装kernel-devel和kernel-headers
    yum install kernel-devel
    yum install kernel-headers
4.赋予权限
chmod 755 NVIDIA ... .run
chmod 755 cuda ... .run
5.进入命令行界面并安装驱动
root权限下进入(su root切换为root)用户->init 3进入命令行界面->根据提示分别点击NVIDIA ... .run和cuda ... .run安装驱动和cuda
注:可能会遇到坑
ERROR: The Nouveau kernel driver is currently in use by your system. This  driver is incompatible with the NVIDIA driver, and must be disabled before proceeding.
Please consult the NVIDIA driver README and your Linux distribution's documentation
 for details on how to correctly  disable the Nouveau kernel driver.
解决办法:
1)关闭Nouveau
cd /etc/modprobe.d->找blacklist.conf,若没有则新建( touch blacklist.conf)->vim blacklist.conf->在其中加入blacklist nouveau(a键添加,Esc-> wq保存退出)
2)使用dracut重新建立 initramfs image file
mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
 dracut -v /boot/initramfs-$(uname -r).img $(uname -r)
3)重启系统
4)检查自己内核版本号
uname -r
5)启动安装NVIDIA ... .run和cuda ... .run
./ NVIDIA... .run
注:若出现unable to find the kernel source tree for the currently running kernel.的错误,则输入指令 ./ ... .run --kernel-source-path=/usr/src/kernels/内核版本号
注:install NVIDIA's 32-bit compatibility libearies?->No

第二个问题Do you want to install the OpenGL libraries?->no安装
可能是因为桌面系统是采用3D渲染的,也可能是驱动冲突问题,总之安装OpenGL之后图形化用户界面无法启动
第三个问题Do you want to run nvidia-xconfig?->yes即默认
would you like to run the nvidia-xconfig utility to automatically update your X configuration file?->yes

安装完成之后reboot重启并nvidia-smi验证

自制centos7安装NVIDIA驱动及CUDA_第4张图片
2安装cuda
./ cuda... .run(同样加入--kernel-source-path=/usr/src/kernels/内核版本号)
按d或者s或者向下箭头翻页阅读用户协议,最后输入accept
接下来安装会有很多问题需要选择:
第一个问题Do you want to install NVIDIA Accelerated Graphics Driver?->no
其余问题全部为yes,部分需要设置安装位置的为默认,直接enter即可。
 自制centos7安装NVIDIA驱动及CUDA_第5张图片
然后配置环境变量
vim ~/.bashrc

在末尾添加如下内容(依据NVIDIA官方文档所述)

export CUDA_HOME=/usr/local/cuda-10.0

export PATH=$CUDA_HOME/bin${PATH:+:${PATH}}

export LD_LIBRARY_PATH=$CUDA_HOME/lib64\${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

之后

source ~/.bashrc立即生效

reboot重启,并验证,验证详细步骤如下:

首先测试cuda和nvcc命令:

输入cuda然后按两次Tab出现:

cuda-gdb                     cuda-install-samples-9.0.sh

cudafe++                     cuda-gdbserver               cuda-memcheck

输入nvcc --version出现:

nvcc: NVIDIA (R) Cuda compiler driver

Copyright (c) 2005-2018 NVIDIA Corporation

Built on Sat_Aug_25_21:08:01_CDT_2018

Cuda compilation tools, release 10.0, V10.0.130

而后使用安装cuda时附带的实例测试:

cd /usr/local/cuda-10.0/samples

make编译

cd 1_Utilities/deviceQuery

deviceQuery/deviceQuery运行该示例之后会输出内容:

包括cuda10.0以及GPU对应型号等内容。

补充:修正一个问题,安装完NVIDIA用nvidia-smi并不能真正说明驱动安装好了,输入nvidia-settings显示入下内容才算是成功安装(如果不能实现对一块显卡的控制调用,仅靠安装完后的本地文件读取,只能说明驱动还是未安装好):

自制centos7安装NVIDIA驱动及CUDA_第6张图片
自制centos7安装NVIDIA驱动及CUDA_第7张图片

你可能感兴趣的:(GPU,SparkCL)