一、安装anaconda
下载官网anaconda安装包,在安装包文件目录下运行:
bash Anaconda3-5.0.1-Linux-x86_64.sh<自己下载文件的名字>
阅读安装须知,一直按enter就行。
当显示:
Do you accept the license terms? [yes|no]
输入yes
当显示:
Anaconda3 will now be installed into this location:
就是需要确定安装路径。如果没什么特殊要求,或者是初学者小白,大可不必管它,直接enter。
最后一个输入yes,表示添加环境变量。
如果不慎忘记添加环境变量了,往下看。
打开终端,输入
conda -V
如果安装成功,会显示conda版本。
如果安装过程中忘记添加环境变量了,在终端输入:
export PATH=~/anaconda3/bin:$PATH
注意,~后面得是自己的安装路径。
二、创建虚拟环境
1.conda常用的命令。
1)conda list 查看安装了哪些包。
2)conda env list 或 conda info -e 查看当前存在哪些虚拟环境
3)conda update conda 检查更新当前conda
3、创建python虚拟环境。
使用 conda create -n your_env_name python=X.X(2.7、3.6等)命令创建python版本为X.X、名字为your_env_name的虚拟环境。your_env_name文件可以在Anaconda安装目录envs文件下找到。
4、使用激活(或切换不同python版本)的虚拟环境。
打开命令行输入python --version可以检查当前python的版本。
使用如下命令即可 激活你的虚拟环境(即将python的版本改变)。
Linux: source activate your_env_name(虚拟环境名称)
Windows: activate your_env_name(虚拟环境名称)
这是再使用python --version可以检查当前python版本是否为想要的。
5、对虚拟环境中安装额外的包。
使用命令conda install -n your_env_name [package]即可安装package到your_env_name中
6、关闭虚拟环境(即从当前环境退出返回使用PATH环境中的默认python版本)。
使用如下命令即可。
Linux: source deactivate
Windows: deactivate
7、删除虚拟环境。
使用命令conda remove -n your_env_name(虚拟环境名称) --all, 即可删除。
8、删除环境中的某个包。
使用命令conda remove --name your_env_name package_name 即可。
三、安装cuda
CUDA的官方文档(参考资料1)是这么介绍CUDA的:a general purpose parallel computing platform and programming model that leverages the parallel compute engine in NVIDIA GPUs to solve many complex computational problems in a more efficient way than on a CPU.
换句话说CUDA是NVIDIA推出的用于自家GPU的并行计算框架,也就是说CUDA只能在NVIDIA的GPU上运行,而且只有当要解决的计算问题是可以大量并行计算的时候才能发挥CUDA的作用。
由于安装pytorch和cudnn都需要选择cuda版本,所以得先安装cuda。
首先,我在服务器上测试了:
nvidia-smi
结果显示是有cuda的,那就不用装啦~(具体安装方法自行百度吧)
然后,检查版本:
nvcc --version
显示:
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2018 NVIDIA Corporation
Built on Sat_Aug_25_21:08:01_CDT_2018
Cuda compilation tools, release 10.0, V10.0.130
我猜最后一行那个就是版本号
四、安装cudnn
cuDNN(CUDA Deep Neural Network library):是NVIDIA打造的针对深度神经网络的加速库,是一个用于深层神经网络的GPU加速库。如果你要用GPU训练模型,cuDNN不是必须的,但是一般会采用这个加速库。
上cudnn官网下载自己对应的版本:
ubuntu18需要下载这3个。
安装:
$ sudo dpkg -i libcudnn6_6.0.21-1+cuda8.0_amd64.deb
$ sudo dpkg -i libcudnn6-dev_6.0.21-1+cuda8.0_amd64.deb
$ sudo dpkg -i libcudnn6-doc_6.0.21-1+cuda8.0_amd64.deb<代码sample包.deb>
验证CUDA和CUDNN是否安装成功
CUDNN的code sample可以用来检查CUDNN和CUDA是否安装成功,执行以下命令:
sudo cp -r /usr/src/cudnn_samples_v7/ $HOME
cd $HOME/cudnn_samples_v7/mnistCUDNN
sudo make clean
sudo make
sudo ./mnistCUDNN
正常情况下执行以上代码会得到Test passed!的结果。如果在make步出错,那么可能gcc需要降级;如果出现CUDA driver version is insufficient for CUDA runtime version,那么或许你的显卡驱动安装失败,或许你之前安装过低版本的nvidia的显卡又没有删掉。
查看cudnn版本:
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
五、安装pytorch
上官网,按照自己 的配置选择前面几项,最后把run this command里的代码粘到终端里,回车,等着就好啦。
然鹅……巨慢,尤其装服务器,更慢。
so,在网上找到了清华源安装方法。
首先,添加清华源:
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes
为了保险起见,建议同时添加第三方conda源:
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/menpo/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
最后,还是上面那句安装,不同的是要把末尾的 -c pytorch去掉,即:
conda install pytorch torchvision cudatoolkit=10.0
完成!