CentOS 7.3.16 搭建深度学习GPU框架

目录

  • 简单的介绍
  • 准备工作
    • 查看系统版本及显卡信息
    • 操作系统信息
    • 显卡驱动选择的版本
    • 安装Anacodna
    • 安装Nvidia驱动显卡驱动
    • 安装cuda
    • 安装cudnn
    • 添加环境变量
    • 使用如下命令测试安装效果

简单的介绍

从2016年读硕士开始,有幸认识一位学术渊博的导师,导师以前沿的知识开启了我人工智能的大门。工作也好几年了,就是没有去写一些博客,前几天电脑出了故障,从新装了系统,数据有丢失的,接下来想着把工作过程中的点滴记录下来,供自己查看。

准备工作

查看系统的信息,显卡信息,下载适配的NVIDIA驱动、CUDA、cudnn。

查看系统版本及显卡信息

使用lspci | grep -i nvidia去查看显卡的信息,但是返回的是二进制数字,如下图:
显示的是二进制将1db1输入到
http://pci-ids.ucw.cz/mods/PC/10de?action=help?help=pci
即可查询显卡的具体型号
CentOS 7.3.16 搭建深度学习GPU框架_第1张图片

操作系统信息

CentOS Linux release 7.3.1611 (Core)

显卡驱动选择的版本

考虑到后期支持TensorFlow版本问题,我选择了比较低版本的显卡驱动。
CentOS 7.3.16 搭建深度学习GPU框架_第2张图片

安装Anacodna

bash Anaconda3-4.2.0-Linux-x86_64

安装Nvidia驱动显卡驱动

确认安装gcc,如果没有安装需要安装。

gcc –version

安装命令:

yum -y install gcc  gcc-c++

安装内核文件,这个地方如果没有安装,后面安装驱动程序会失败,此处被坑过。
RHEL7/centos7安装命令:

yum install kernel-devel-$(uname -r) kernel-headers-$(uname -r)

centos 7 禁用nouveau驱动
查看显卡是否被禁掉,如果无输出,则驱动是别屏蔽掉的

lsmod | grep nouveau

1)把驱动加入黑名单中:

 /etc/modprobe.d/blacklist.conf 

在后面加入:

 blacklist nouveau
 options nouveau modeset=0
  1. 使用 dracut重新建立 initramfs nouveau 并且备份 initramfs nouveau image镜像
Sudo mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
  1. 重新建立新的 the initramfs file
Sudo dracut -v /boot/initramfs-$(uname -r).img $(uname -r)

4)重启,检查nouveau driver确保没有被加载!

reboot

重新查看显卡是否被禁掉,如果没有任何信息输出,则别屏蔽掉了。

lsmod | grep nouveau

下边就可以安装NVIDIA驱动了。

chmod +x NVIDIA-Linux-x86_64-***.64.run
./NVIDIA-Linux-x86_64-***.64.run

安装cuda

sh cuda_10.*.89_440.33.01_linux.run

安装cudnn

将cudnn的tar压缩包解压后,当前文件夹中会多出来个cuda文件夹。
注意,解压后的文件夹名称为cuda ,将对应文件复制到 /usr/local中的cuda内

sudo cp cuda/include/cudnn.h    /usr/local/cuda/include      
sudo cp cuda/lib64/libcudnn*    /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h  /usr/local/cuda/lib64/libcudnn*

添加环境变量

上面的步骤都安装完毕后,把Anaconda、cuda环境变量加到~/.bashrc 文件中 如下.

# >>> conda initialize >>>
# !! Contents within this block are managed by 'conda init' !!
__conda_setup="$('/root/anaconda3/bin/conda' 'shell.bash' 'hook' 2> /dev/null)"
if [ $? -eq 0 ]; then
    eval "$__conda_setup"
else
    if [ -f "/root/anaconda3/etc/profile.d/conda.sh" ]; then
        . "/root/anaconda3/etc/profile.d/conda.sh"
    else
        export PATH="/root/anaconda3/bin:$PATH"
    fi
fi
unset __conda_setup
# <<< conda initialize >>>
export PATH="/root/anaconda3/bin:$PATH"
export PATH=/usr/local/cuda-10.1/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-10.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export CUDA_HOME=/usr/local/cuda-10.1

export PATH="/usr/bin:$PATH"

要执行如下命令

source ~/.bashrc

让环境变量生效

使用如下命令测试安装效果

CentOS 7.3.16 搭建深度学习GPU框架_第3张图片

你可能感兴趣的:(深度学习环境配置,算法)