本文以搭建学校实验室远程服务器为例,尽肯能用简洁的语言描述。
注!安装之前一定要选择对应的版本(包括Tensorflow,CUDA,CUDNN),参考表
查看cuda 版本
cat /usr/local/cuda/version.txt
查看cudnn 版本
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
查看显卡驱动版本
cat /proc/driver/nvidia/version
或输入nvidia-smi
一、安装依赖包
sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev libhdf5-serial-dev protobuf-compiler
sudo apt-get install --no-install-recommends libboost-all-dev
sudo apt-get install libopenblas-dev liblapack-dev libatlas-base-dev
sudo apt-get install libgflags-dev libgoogle-glog-dev liblmdb-dev
sudo apt-get install git cmake build-essential
输入以下代码验证是否成功
git cmake build-essential
二、配制环境变量
sudo gedit ~/.bashrc
export LD_LIBRARY_PATH=/usr/lib/x86_64-linux-gnu:$LD_LIBRARY_PATH
export LD_LIBRARY_PATH=/lib/x86_64-linux-gnu:$LD_LIBRARY_PATH
保存退出
source ~/.bashrc
三、安装显卡驱动
卸载原有驱动
sudo chmod +x *.run
sudo ./NVIDIA-Linux-x86_64-390.59.run --uninstall
安装驱动
sudo chmod a+x NVIDIA-Linux-x86_64-390.59.run
sudo ./NVIDIA-Linux-x86_64-390.59.run –no-opengl-files
查看驱动
在这里插入代码片
四、安装CUDA
官网选择CUDA下载
cd 到安装包目录下
sudo chmod +x 文件名
sudo sh 文件名
出现选项,前两个选项如下选择,其余要么是Y,要么回车
Do you accept the previously read EULA?
accept/decline/quit: accept
Install NVIDIA Accelerated Graphics Driver ?
(y)es/(n)o/(q)uit: n
配制CUDA环境变量
sudo gedit ~/.bashrc
文档后添加
export PATH=/usr/local/cuda-版本号/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-版本号/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
保存退出
source ~/.bashrc
验证CUDA是否安装
cd /usr/local/cuda-9.0/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery
五、安装CUDNN
官网下载对应CUDA版本号的CUDNN,需要注册帐号并登录
解压
cp cudnn-版本号-linux-x64-v5.1.solitairetheme8 cudnn-版本号-linux-x64-v5.1.tgz
tar -xvf cudnn-版本号-linux-x64-v5.1.tgz
cd cuda
sudo cp lib64/lib* /usr/local/cuda/lib64/ #复制动态链接库
sudo cp include/cudnn.h /usr/local/cuda/include/
cd /usr/local/cuda/lib64/
sudo rm -rf libcudnn.so libcudnn.so.5 #删除原有动态文件
sudo ln -s libcudnn.so.5.1.10 libcudnn.so.5 #生成软衔接
sudo ln -s libcudnn.so.5 libcudnn.so #生成软链接
#注,含有版本号的需要进入文件夹查看具体版本号
六、pycharm连接到远程服务器
File -> Settings-> Project -> Project Interpreter,点击小齿轮选择show all,点击+号。选择SSH interpreter,输入远程服务器IP。紧接着按步骤来,输入密码,以及远程服务器python的文件夹(可用which python查找),以及pycharm存放在远程服务器的路径。确定之后本地项目会自动更新到远程服务器。连接完成。
七、踩过的坑
1、tensorflow版本太高,需要卸载tensorflow
pip uninstall tensorflow
安装指定版本tensorflow
pip install tensorflow==版本号
2、cuda以及cudnn无法下载,怀疑是国内ip被屏蔽,后通过外网下载获得。
3、Could not load dynamic library ‘libcudart.so.10.0’
conda install cudatoolkit=10.0