Centos7安装NVIDIA驱动及cuda心得

安装NVIDIA驱动及cuda心得

  • 送给读者
  • 安装教程

送给读者

由于工作需要,在服务器上需要安装显卡并利用其中的gpu作为加速计算组件,安装过程中出现各种问题,最终借鉴各种教程以及个人摸索终于成功安装,现在把我的安装过程分享给大家,希望能帮助大家少走弯路。

安装教程

  1. 检查GPU型号(显卡)
// linux查看对应GPU型号
lspci | grep -i vga

下载NVIDIA和cuda驱动都是需要根据gpu所对应的版本号进行查找。
2. 下载驱动(XXXX.run文件)
NVIDIA驱动程序下载网址[1]:
https://www.nvidia.cn/Download/driverResults.aspx/142646/cn
cuda程序下载地址[2]:
https://developer.nvidia.com/cuda-downloads
3. 禁用nouveau
一般在centos7中安装驱动时,有可视化界面的系统都会启动nouveau,所以安装前必须将nouveau禁用加入黑名单。

//首先找到黑名单配置文件,如果找不到文件夹就新建一个命令:madir 文件夹名称
cd /etc/modprobe.d
//编辑blacklist.conf,在最后面插入如下内容
blacklist nouveau
options nouveau modeset=0
// linux查看对应GPU型号
lspci | grep -i vga

//如果blacklist.conf不存在,先新建文件 命令:touch 文件名
vi blacklist.conf
//成功保存后,需要重新生成initramfs image file文件,使用下方命令将原the initramfs file改为备份文件并重新生成
mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
dracut -v /boot/initramfs-$(uname -r).img
//成功生成XXXX.img(包含版本号)后重启系统并验证
reboot
//验证,输入下方命令如果出现内容说明禁用失败,需要删除生成的XXXX.img文件,重新安装本步骤操作一遍
//输入下方命令没有任何返回值表示禁用成功
lsmod | grep nouveau
  1. 运行XXXX.run文件
//输入init 3进入命令行界面
init 3
// 使用cd命令切换到对应的存放XXXX.run的文件夹,输入下方命令运行(NVIDIA和cuda都是如此)
./XXXX.run

注意
1、安装过程操作
NVIDIA安装过程中无需过多操作,中间一些选项默认yes安装即可。
cuda安装过程中除OpenGl选择no之外,其他选项都选择yes或直接enter安装即可。
2、出现问题处理
出现X driver相关问题是因为没有在命令行界面安装,使用init3进入命令行界面运行即可。
出现he Nouveau kernel driver is currently in use by your system.问题是因为没有成功禁用Nouveau 重新操作第3步,把失败的对应驱动号的****.Img文件删除重新生成(删除前记得cp或mv备份一下)
cuda环境配置
cuda安装结束后需要配置环境变量操作如下:

//使用vim ~/.bashrc 编辑配置文件,在其中最后面添加,记住不要添加注解,下方注解需要删掉
export CUDA_HOME=/usr/local/cuda-9.1//其中路径为自己的cuda安装的路径
export PATH=$CUDA_HOME/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=$CUDA_HOME/lib64\${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
//立即生效
source ~/.bashrc
//重启
reboot

验证是否成功
NVIDIA验证
安装完成后需要验证,NVIDIA的验证方法是输入nvidia-smi 显示一个表格其中显示了显卡的相关信息且输入nvidia-settings会显示NVIDIA X server setting界面就说明安装成功了
命令如下:

// 输入命令后会显示一个表格,其中有NIVADA相关信息
nvidia-smi
//输入命令后显示NVIDIA X server setting界面
nvidia-settings

cuda验证
输入cuda双击tab按键,有显示,且输入nvcc --version会出现版本号信息,最后为了保险可以编译运行一下cd /usr/local/cuda-9.1/samples/文件夹下面的实例输出对应cuda的版本信息就表示安装完成(可以用对应的gcc++ hello.cpp -o hello命令来编译.cpp文件,c文件可以用gcc)。命令如下:

// 输入cuda后双击tab按键,会显示几行内容
cuda
//输入nvcc --version显示cuda版本信息
nvcc --version
//输入命令后根据对应的文件夹找到其中的实例
cd /usr/local/cuda-9.1/samples/
//使用gcc或者gcc++编译一下,然后使用./文件名运行测试,如下例
gcc++ hello.cpp -o hello
gcc hello.c -o hello

出现其他问题可以联系博主。

你可能感兴趣的:(安装教程)