服务器配置:centOS7.4 NVIDIA P100(12G)
SecureCRT的下载地址:https://pan.baidu.com/s/15Dt8gqPyDELSqGZ68cRuBg 提取码:9s5m
需要的安装包:CUDA9.0 CUDNN7.1 pycharm-professional-2019.1.tar Anaconda3-2018.12-Linux-x86_64
所需安装包下载地址:https://pan.baidu.com/s/103YZcTxoC9eMMaaa-oIrMg 提取码:zjlw
第一步、使用SecureCRT将需要的安装包上传至服务器
如图所示,双击SecureCRT.exe
打开SecureCRT
使用快捷键Alt + p打开sftp界面(上传界面)
将需要传输的文件放在特定的文件夹进行文件传输,我把需要上传的文件放在D:\SOURCES
在上传界面输入put、上传文件的路径和文件本身,如:put D:\SOURCES\cudnn-9.0-linux-x64-v7.1.tgz
上传成功的话,会有100%的提示。使用这种方式将所有的文件上传至服务器。上传完毕后,可以在服务器的/root下进行查看
如上图所示,所需的文件全部上传完毕。接着,我把文件移动到/home/zhangbaojiang目录下。命令:mv /root/文件 /home/zhangbaojiang
在zhangbaojiang目录下,查看文件是否存在:
到此,配置深度学习的预处理工作结束。
第二步,centOS更新为aliyun源(参考博客:https://blog.csdn.net/hnmpf/article/details/81240177)
wget http://mirrors.aliyun.com/repo/Centos-7.repo
cp Centos-7.repo /etc/yum.repos.d/
cd /etc/yum.repos.d/
mv CentOS-Base.repo CentOS-Base.repo.bak
mv Centos-7.repo CentOS-Base.repo
yum clean all
yum makecache
yum update
如上图所示,配置完毕。
第三步,安装GPU驱动、CUDA、Cudnn等GPU环境
(1)安装GPU驱动(参考博客:https://blog.csdn.net/guohaosun/article/details/82749029)
yum install gcc-c++
rpm --import https://www.elrepo.org/RPM-GPG-KEY-elrepo.org
rpm -Uvh https://www.elrepo.org/elrepo-release-7.0-3.el7.elrepo.noarch.rpm
yum install nvidia-detect
yum install $(nvidia-detect)
reboot
安装完之后的验证命令:nvidia-smi,出现下图说明安装成功。
(2)安装CUDA(参考博客:https://blog.csdn.net/u012325865/article/details/73034018)
cd /home/zhangbaojiang目录下
sh cuda_9.0.176_384.81_linux.run
(注意:在选择是否安装GPU驱动的时候,选择No。其他的都选Yes或者默认)
sh cuda_9.0.176.1_linux.run
sh cuda_9.0.176.2_linux.run
sh cuda_9.0.176.3_linux.run
sh cuda_9.0.176.4_linux.run
回到/root目录
vim ~/.bashrc
在打开的文件里加入
export CUDA_HOME=/usr/local/cuda-9.0
export PATH=/usr/local/cuda-9.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:$LD_LIBRARY_PATH
export LD_LIBRARY_PATH="/usr/local/cuda-9.0/lib:${LD_LIBRARY_PATH}"
然后,wq退出文件。
执行 source ~/.bashrc
可以用nvcc -V命令来检测CUDA的安装,若成功,可得下图:
到此,cuda安装完毕。
(3)安装cuDNN(参考博客:https://blog.csdn.net/yaoqiwaimai/article/details/78594154)
cd /home/zhangbaojiang
tar -xzvf cudnn-9.0-linux-x64-v7.1.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/ -d
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
至此,cuDNN的安装也结束了。
第四步,安装anaconda(参考博客:https://www.jianshu.com/p/e6ae8905833d)
在/zhangbaojiang目录下
bash Anaconda3-2018.12-Linux-x86_64.sh
遇到选择项,全部yes.
安装成功之后,生效.bashrc文件。
source ~/.bashrc
验证是否安装成功,使用conda list命令,如下图:
输入python,验证环境
创建子环境(参考博客:https://blog.csdn.net/weixin_40100431/article/details/82116171)
创建子环境之前,加入加速镜像(参考博客:https://www.jianshu.com/p/1a9c059d72bd)
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --set show_channel_urls yes
创建子环境一
conda create -n tensorflow python=3.6
进入子环境
conda activate tensorflow
安装tensorflow-gpu
conda install tensorflow-gpu (pip 安装有问题:https://blog.csdn.net/qysh123/article/details/79977891)
安装opencv 地址:https://pan.baidu.com/s/1Xp8AzpEJKUtcqTyfYPGaQQ 提取码:93tz
pip install opencv_python-4.1.0.25-cp36-cp36m-manylinux1_x86_64.whl
退出虚拟环境
source deactivate
创建子环境二
conda create -n pytorch python=3.6
进入子环境
conda activate pytorch
安装pytorch
pip install torch-0.3.0.post4-cp36-cp36m-linux_x86_64.whl 地址:https://pan.baidu.com/s/1dy_GfoglEiRKi2otWLKZRw 提取码:o8u4
pip install torchvision
退出虚拟环境
source deactivate
第五步,因为服务器没有图像界面,所以pycharm就不安装了。
两个小知识点:
删除文件夹及子文件夹 rm -rf deeplabV3
解压 unzip 文件夹.zip