配制远程服务器跑深度学习Ubuntu 16.04/tensorflow-GPU2.0.0/Driver Version: 440.44/CUDA10.0.130,CUDNN7.6.4/pycharm

配制远程服务器跑深度学习Ubuntu 16.04/tensorflow-GPU2.0.0/Driver Version: 440.44/CUDA10.0.130,CUDNN7.6.4/pycharm

本文以搭建学校实验室远程服务器为例,尽肯能用简洁的语言描述。
注!安装之前一定要选择对应的版本(包括Tensorflow,CUDA,CUDNN),参考表

查看cuda 版本
cat /usr/local/cuda/version.txt
查看cudnn 版本
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
查看显卡驱动版本
cat /proc/driver/nvidia/version
或输入nvidia-smi

一、安装依赖包

sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev libhdf5-serial-dev protobuf-compiler
sudo apt-get install --no-install-recommends libboost-all-dev
sudo apt-get install libopenblas-dev liblapack-dev libatlas-base-dev
sudo apt-get install libgflags-dev libgoogle-glog-dev liblmdb-dev
sudo apt-get install git cmake build-essential

输入以下代码验证是否成功

git cmake build-essential

二、配制环境变量

sudo gedit ~/.bashrc
export LD_LIBRARY_PATH=/usr/lib/x86_64-linux-gnu:$LD_LIBRARY_PATH
export LD_LIBRARY_PATH=/lib/x86_64-linux-gnu:$LD_LIBRARY_PATH

保存退出

source ~/.bashrc

三、安装显卡驱动
卸载原有驱动

sudo chmod +x *.run
sudo ./NVIDIA-Linux-x86_64-390.59.run --uninstall

安装驱动

sudo chmod a+x NVIDIA-Linux-x86_64-390.59.run
sudo ./NVIDIA-Linux-x86_64-390.59.run –no-opengl-files

查看驱动

在这里插入代码片

四、安装CUDA
官网选择CUDA下载
配制远程服务器跑深度学习Ubuntu 16.04/tensorflow-GPU2.0.0/Driver Version: 440.44/CUDA10.0.130,CUDNN7.6.4/pycharm_第1张图片
cd 到安装包目录下

sudo chmod +x 文件名
sudo sh 文件名

出现选项,前两个选项如下选择,其余要么是Y,要么回车

Do you accept the previously read EULA?
accept/decline/quit: accept
 
Install NVIDIA Accelerated Graphics Driver ?
(y)es/(n)o/(q)uit: n

配制CUDA环境变量

sudo gedit ~/.bashrc

文档后添加

export PATH=/usr/local/cuda-版本号/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-版本号/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

保存退出

source ~/.bashrc

验证CUDA是否安装

cd /usr/local/cuda-9.0/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery

五、安装CUDNN
官网下载对应CUDA版本号的CUDNN,需要注册帐号并登录
解压

cp  cudnn-版本号-linux-x64-v5.1.solitairetheme8 cudnn-版本号-linux-x64-v5.1.tgz
tar -xvf cudnn-版本号-linux-x64-v5.1.tgz
cd cuda
sudo cp lib64/lib* /usr/local/cuda/lib64/ #复制动态链接库
sudo cp include/cudnn.h /usr/local/cuda/include/ 
cd /usr/local/cuda/lib64/
sudo rm -rf libcudnn.so libcudnn.so.5 #删除原有动态文件
sudo ln -s libcudnn.so.5.1.10 libcudnn.so.5 #生成软衔接
sudo ln -s libcudnn.so.5 libcudnn.so #生成软链接
#注,含有版本号的需要进入文件夹查看具体版本号

六、pycharm连接到远程服务器
File -> Settings-> Project -> Project Interpreter,点击小齿轮选择show all,点击+号。选择SSH interpreter,输入远程服务器IP。紧接着按步骤来,输入密码,以及远程服务器python的文件夹(可用which python查找),以及pycharm存放在远程服务器的路径。确定之后本地项目会自动更新到远程服务器。连接完成。
配制远程服务器跑深度学习Ubuntu 16.04/tensorflow-GPU2.0.0/Driver Version: 440.44/CUDA10.0.130,CUDNN7.6.4/pycharm_第2张图片
七、踩过的坑
1、tensorflow版本太高,需要卸载tensorflow

pip uninstall tensorflow

安装指定版本tensorflow

pip install tensorflow==版本号

2、cuda以及cudnn无法下载,怀疑是国内ip被屏蔽,后通过外网下载获得。
3、Could not load dynamic library ‘libcudart.so.10.0’

conda install cudatoolkit=10.0

你可能感兴趣的:(深度学习,云服务器,tensorflow,cuda)