tensorflow 在centos7上的环境配置流程

Table of Contents

系统安装

切换国内镜像站

安装Anaconda

安装显卡驱动

安装cuda 10

安装tensorflow-gpu

激活环境并运行python


系统配置

  • CPU: Intel Xeon4114 *2
  • GPU: Nvidia Tesla V100 * 2
  • 操作系统: Centos 7
  • Anaconda版本: 2019.10
  • 显卡驱动版本: 410.129
  • tensorflow: tensorflow-gpu:2.0

系统安装

  • centos 7.7 镜像文件下载: CentOS-7-x86_64-Everything-1908.iso
  • 使用rufus制作启动盘
  • 安装系统

切换国内镜像站

参见:CentOS 镜像

su
mv /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.backup
wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo
yum makecache

安装Anaconda

  • 下载安装包Anaconda3-2019.10-Linux-x86_64.sh
  • 运行以下命令安装
cd  #Anaconda3安装包所在路径
chmod +x Anaconda3-2019.10-Linux-x86_64.sh
./Anaconda3-2019.10-Linux-x86_64.sh # 安装过程中全部选yes

  • 安装完成后退出terminal,重新打开
  • 切换清华大学 开源软件镜像站
cd
conda config --set show_channel_urls yes
gedit .condarc
  • 向文件中复制如下内容:
channels:
  - defaults
show_channel_urls: true
channel_alias: https://mirrors.tuna.tsinghua.edu.cn/anaconda
default_channels:
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/pro
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2
custom_channels:
  conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  msys2: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  bioconda: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  menpo: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  pytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  simpleitk: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
  •  清除索引缓存
conda clean -i

安装显卡驱动

参考:CentOS 7中以runfile形式安装CUDA 9.0

  • 切至root用户
su
  • 确保电脑上安装了nvidia显卡
lspci | grep -i nvidia
  • 安装需要的软件
yum install -y gcc gcc-c++
  • 安装kernel header
yum install -y kernel-devel-$(uname -r) kernel-headers-$(uname -r)
  • 列出Nouveau驱动
lsmod | grep nouveau
  •  新建blacklist-nouveau.conf,禁用Nouveau驱动
gedit /usr/lib/modprobe.d/blacklist-nouveau.conf
  •  在配置文件中输入如下内容:
blacklist nouveau
options nouveau modeset=0
  •  重新生成kernel inittramfs:
sudo dracut --force
  • 设置默认启动方式为“text mode”
systemctl set-default multi-user.target
init 3
  • 重启计算机

计算机重启后进入命令行界面,输入用户名和密码进行登陆,登陆后安装驱动即可。

  • 驱动安装完成后,运行以下命令,切换会图形界面。
systemctl set-default graphical.target
init 5

安装cuda & cudnn

  • 切换至cuda安装包所在目录,运行:
chmod +x cuda_10.0.130_410.48_linux.run
sudo ./cuda_10.0.130_410.48_linux.run
  • 请勿安装cuda默认的驱动程序!!
  • 在".bashrc"中添加:
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
  •  下载并安装cudnn7.6.5
rpm -ivh libcudnn7-*.x86_64.rpm
rpm -ivh libcudnn7-devel-*.x86_64.rpm
rpm -ivh libcudnn7-doc-*.x86_64.rpm
  • 验证安装是否成功
cp -r /usr/src/cudnn_samples_v7/ $HOME
cd  $HOME/cudnn_samples_v7/mnistCUDNN
make clean && make
./mnistCUDNN
  • 下载并安装nccl2.5
rpm -ivh nccl-repo-rhel7-2.5.6-ga-cuda10.0-1-1.x86_64.rpm

安装tensorflow-gpu

conda create -n tf tensorflow-gpu=2.0

激活环境并运行python

conda activate tf
python

在python命令提示符后输入:

import tensorflow as tf
tf.test.is_gpu_available()

返回‘True’,表示tensorflow-gpu可用。

 

你可能感兴趣的:(tensorflow,centos,tensorflow)