傻瓜式gpu环境配置

服务器配置tensorflow-gpu环境


基 础 配 置 : 系 统 c e n t o s 7.4 , p y t h o n 3.6.5 , g p u : t e s l a − p 100 \color{#FF0000}{基础配置:系统centos7.4,python3.6.5, gpu:tesla-p100} centos7.4python3.6.5,gpu:teslap100

1. 配置python3.6.5

1).下载python的依赖:

yum install -y openssl-devel bzip2-devel expat-devel gdbm-devel readline-devel sqlite-devel gcc gcc-c++  openssl-devel

2).下载python&安装
·下载:
wget https://www.python.org/ftp/python/3.6.5/Python-3.6.5.tgz
·解压:
tar zxvf Python-3.6.5.tgz
·解除Modules中的socket注释
cd Python-3.6.5/Modules/
vim Setup.dist
直接敲/socket搜索到socket
然后把如下代码前的#删除掉即可
#_socket socketmodule.c
#SSL=/usr/local/ssl
#_ssl _ssl.c \
# -DUSE_SSL -I$(SSL)/include -I$(SSL)/include/openssl \
# -L$(SSL)/lib -lssl -lcrypto
·回到上级目录:
cd ..
·执行配置:
./configure
·编译&安装:
make && make install
等待安装完成,python3.6.5也就安装完成了,随后可以使用
pip3 install xxx来安装你需要的python包。

2.配置gpu

0).关闭图形界面:
通常需要关闭图形界面才可以安装显卡驱动,这里可以先尝试执行命令:
service lightdm stop
init 3
如果没有信息输出,则表示已经关闭。
1).安装gpu驱动
·执行uname -r查看内核版本号:

[root@bigdata-model01 downloads]# uname -r
3.10.0-693.2.2.el7.x86_64

·下载kernel-devel:
wget http://vault.centos.org/7.4.1708/updates/x86_64/Packages/kernel-devel-3.10.0-693.2.2.el7.x86_64.rpm
·下载kernel-header:
wget http://vault.centos.org/7.4.1708/updates/x86_64/Packages/kernel-headers-3.10.0-693.2.2.el7.x86_64.rpm
这 里 要 说 下 , k e r n e l − d e v e l 和 k e r n e l − h e a d e r 的 版 本 \color{#FF0000}{这里要说下,kernel-devel和kernel-header的版本} kerneldevelkernelheader
要 和 对 应 的 内 核 版 本 号 一 致 , 一 般 只 需 要 把 上 边 链 \color{#FF0000}{要和对应的内核版本号一致,一般只需要把上边链}
接 里 的 序 列 号 换 成 你 的 内 核 版 本 号 即 可 , 如 果 实 在 \color{#FF0000}{接里的序列号换成你的内核版本号即可,如果实在} 不 行 可 以 登 录 如 下 链 接 查 找 : \color{#FF0000}{不行可以登录如下链接查找:}
http://vault.centos.org/7.4.1708/updates/x86_64/Packages/

·下载完毕之后就可以使用yum进行安装了:
yum install -y kernel-devel-3.10.0-693.2.2.el7.x86_64.rpm
yum install -y kernel-headers-3.10.0-693.2.2.el7.x86_64.rpm
·执行如下命令:
rpm -qa|grep kernel

信息如下:

kernel-tools-libs-3.10.0-693.2.2.el7.x86_64
kernel-devel-3.10.0-693.2.2.el7.x86_64
kernel-3.10.0-693.el7.x86_64
kernel-3.10.0-693.2.2.el7.x86_64
kernel-headers-3.10.0-693.2.2.el7.x86_64
kernel-tools-3.10.0-693.2.2.el7.x86_64

只要三者的数字完全一模一样就可以了。
2).安装cuda

·查看tensorflow版本:
pip3 list|grep tensorflow
我这里安装的是tensorflow==1.11.0
·查看tensorflow版本对应兼容版本,这里有一个表格也可以在tensorflow官网上查看:

版本 Python 版本 编译器 编译工 cuDNN CUDA
tensorflow_gpu-2.0.0-alpha0 2.7、3.3-3.6 GCC 4.8 Bazel 0.19.2 7.4.1以及更高版本 CUDA 10.0 (需要 410.x 或更高版本)
tensorflow_gpu-1.13.0 2.7、3.3-3.6 GCC 4.8 Bazel 0.19.2 7.4 10.0
tensorflow_gpu-1.12.0 2.7、3.3-3.6 GCC 4.8 Bazel 0.15.0 7 9
tensorflow_gpu-1.11.0 2.7、3.3-3.6 GCC 4.8 Bazel 0.15.0 7 9
tensorflow_gpu-1.10.0 2.7、3.3-3.6 GCC 4.8 Bazel 0.15.0 7 9
tensorflow_gpu-1.9.0 2.7、3.3-3.6 GCC 4.8 Bazel 0.11.0 7 9
tensorflow_gpu-1.8.0 2.7、3.3-3.6 GCC 4.8 Bazel 0.10.0 7 9
tensorflow_gpu-1.7.0 2.7、3.3-3.6 GCC 4.8 Bazel 0.9.0 7 9
tensorflow_gpu-1.6.0 2.7、3.3-3.6 GCC 4.8 Bazel 0.9.0 7 9
tensorflow_gpu-1.5.0 2.7、3.3-3.6 GCC 4.8 Bazel 0.8.0 7 9
tensorflow_gpu-1.4.0 2.7、3.3-3.6 GCC 4.8 Bazel 0.5.4 6 8
tensorflow_gpu-1.3.0 2.7、3.3-3.6 GCC 4.8 Bazel 0.4.5 6 8
tensorflow_gpu-1.2.0 2.7、3.3-3.6 GCC 4.8 Bazel 0.4.5 5.1 8
tensorflow_gpu-1.1.0 2.7、3.3-3.6 GCC 4.8 Bazel 0.4.2 5.1 8
tensorflow_gpu-1.0.0 2.7、3.3-3.6 GCC 4.8 Bazel 0.4.2 5.1 8

进入网址https://developer.nvidia.com/cuda-downloads
然后选择对应的系统,下载即可,这里下载的是runfile.
·加环境变量:
vim ~/.bash_profile

PAHT=$PATH:/usr/local/cuda-9.0/bin
export PATH
LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export LD_LIBRARY_PATH
保存退出。
source ~/.bash_profile
./cuda_9.0.176_384.81_linux-run
这里建议在安装cuda的时候自动下载对应的driver,
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 384.81?
(y)es/(n)o/(q)uit: y
如果需要手动安装cuda驱动的如下见步骤3.
安装完之后可以测试。
cd /usr/local/cuda-9.0/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery
如果安装成功会有如下显示:

3).安装cuda驱动
如果在2)中这一步中选择的如下:
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 384.81?
(y)es/(n)o/(q)uit: y
请移步到4).
·登录nvidia的官网下载对应的驱动:
https://www.nvidia.cn/Download/index.aspx?lang=cn

·点击搜索傻瓜式gpu环境配置_第1张图片完毕之后出现如下图片:
傻瓜式gpu环境配置_第2张图片

·点击下载按钮跳转到:
傻瓜式gpu环境配置_第3张图片·右键下载按钮,复制链接地址,然后在服务器上执行:
wget http://cn.download.nvidia.com/tesla/384.183/NVIDIA-Linux-x86_64-384.183.run
当然这个链接地址是我的,你根据你复制的替换掉即可。
·然后执行命令:
chmod +x NVIDIA-Linux-x86_64-384.183.run
./NVIDIA-Linux-x86_64-384.183.run
·安装完成执行:
nvidia-smi
如果现实如下:傻瓜式gpu环境配置_第4张图片

4).安装cudnn
·去官网下载对应的cudnn包,但是需要注册账号,也可以使用微信或者qq登录。
https://developer.nvidia.com/rdp/cudnn-archive
因为是主要注册才能下载,所以要下载到本地再利用rz或者别的工具上传到服务器,这里不做详细解释。
·下载完之后直接解压:
tar zxvf cudnn-9.0-linux-x64-v7.5.1.10.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

5).测试
import tensorflow as tf
tf.test.gpu_device_name()
tf.test.is_gpu_available()
若果安装成功,这些都应该正常输出gpu的信息。

你可能感兴趣的:(机器学习,tensorflow,python)