ubuntu 16.02 NVIDIA 9.0 k20c cuda toolkit11.3 pytorch-gpu 踩坑教程

ubuntu 16.02 NVIDIA 9.0 k20c cuda toolkit11.3 pytorch-gpu 踩坑教程

废话不多说,直接上教程

一、安装 NVIDIA

进到服务器里面
sudo vim /etc/modprobe.d/blacklist.conf
#将下面配置加到配置文件最下方
blacklist vga16fb
blacklist nouveau
blacklist rivafb
blacklist rivatv
blacklist nvidiafb

保存,退出

然后进行以下操作

sudo update-initramfs -u
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
apt-cache search nvidia   #查看支持的nvidia版本都有哪些
sudo apt-get install nvidia-384

二、安装CUDA

NVIDIA 驱动程序下载方法,如下

方法一:

官方地址

ubuntu 16.02 NVIDIA 9.0 k20c cuda toolkit11.3 pytorch-gpu 踩坑教程_第1张图片

点击搜索,进行下载

ubuntu 16.02 NVIDIA 9.0 k20c cuda toolkit11.3 pytorch-gpu 踩坑教程_第2张图片

方法二:

官网地址:

ubuntu 16.02 NVIDIA 9.0 k20c cuda toolkit11.3 pytorch-gpu 踩坑教程_第3张图片

配置下面各个选项:进行下载;两种方法选其一即可

ubuntu 16.02 NVIDIA 9.0 k20c cuda toolkit11.3 pytorch-gpu 踩坑教程_第4张图片
将下载下来的.run 文件上传到服务器上。

接着运行文件
chmod 755     cuda_9.0.176_384.81_linux.run   #我使用的是第二种方案的软件包
./cuda_9.0.176_384.81_linux.run 
稍等大概10秒左右会生成一个文档,直接按空格键到最后,开始安装
选项如下:

ubuntu 16.02 NVIDIA 9.0 k20c cuda toolkit11.3 pytorch-gpu 踩坑教程_第5张图片

结果如下:

ubuntu 16.02 NVIDIA 9.0 k20c cuda toolkit11.3 pytorch-gpu 踩坑教程_第6张图片

然后修改配置文件

sudo vim ~/.bashrc
export PATH=/usr/local/cuda-9.0/bin${PATH}
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64:${LD_LIBRARY_PATH}
source ~/.bashrc

三、安装cudnn

官方地址:

找一个对应上面版本号的就可以

ubuntu 16.02 NVIDIA 9.0 k20c cuda toolkit11.3 pytorch-gpu 踩坑教程_第7张图片

下载如下:四个包

ubuntu 16.02 NVIDIA 9.0 k20c cuda toolkit11.3 pytorch-gpu 踩坑教程_第8张图片

将包上传至服务器

安装
ls -lh
总用量 662M
-rw-r--r-- 1 root root 396M 9月   5 16:40 cudnn-9.0-linux-x64-v7.6.4.38.tgz
-rw-r--r-- 1 root root 135M 9月   5 16:39 libcudnn7_7.6.4.38-1+cuda9.0_amd64.deb
-rw-r--r-- 1 root root 126M 9月   5 16:40 libcudnn7-dev_7.6.4.38-1+cuda9.0_amd64.deb
-rw-r--r-- 1 root root 5.3M 9月   5 16:39 libcudnn7-doc_7.6.4.38-1+cuda9.0_amd64.deb

tar -xf cudnn-9.0-linux-x64-v7.6.4.38.tgz 
cp -rp  cuda/include/cudnn.h /usr/local/cuda-9.0/include/
cp -rp cuda/lib64/libcudnn* /usr/local/cuda-9.0/lib64
chmod  a+r /usr/local/cuda-9.0/include/cudnn.h /usr/local/cuda-9.0/lib64/libcudnn*
dpkg -i   libcudnn7_7.6.4.38-1+cuda9.0_amd64.deb
dpkg -i   libcudnn7-dev_7.6.4.38-1+cuda9.0_amd64.deb
dpkg -i   libcudnn7-doc_7.6.4.38-1+cuda9.0_amd64.deb

查看cudnn版本 
cat /usr/local/cuda-9.0/include/cudnn.h | grep CUDNN_MAJOR -A 2
若输出为下:则Cudnn版本为7.6.4 (若没有输出,也应该是安装好了)

#define CUDNN_MAJOR 7
#define CUDNN_MINOR 6
#define CUDNN_PATCHLEVEL 4
--
#define CUDNN_VERSION (CUDNN_MAJOR * 1000 + CUDNN_MINOR * 100 + CUDNN_PATCHLEVEL)

#include "driver_types.h"

四、安装 Anaconda

如下
脚本下载位置
密码:8888

sha256sum Anaconda3-2019.10-Linux-x86_64.sh
bash -x  Anaconda3-2019.10-Linux-x86_64.sh
一共需要输入3次
第一次直接回车;
第二次输入yes;
第三次直接回车;
第四次输入yes;
之后等待即可 执行有点慢
more ~/.bashrc
### 最后的内容如下:
# >>> conda initialize >>>
# !! Contents within this block are managed by 'conda init' !!
__conda_setup="$('/root/anaconda3/bin/conda' 'shell.bash' 'hook' 2> /dev/null)"
if [ $? -eq 0 ]; then
eval "$__conda_setup"
else
if [ -f "/root/anaconda3/etc/profile.d/conda.sh" ]; then
    . "/root/anaconda3/etc/profile.d/conda.sh"
else
    export PATH="/root/anaconda3/bin:$PATH"
fi
fi
unset __conda_setup
# <<< conda initialize <<<
### 刷新
source ~/.bashrc
最后输出结果如下:

ubuntu 16.02 NVIDIA 9.0 k20c cuda toolkit11.3 pytorch-gpu 踩坑教程_第9张图片

五、安装 PyTorch

conda install pytorch==1.2.0 torchvision==0.4.0 cudatoolkit=10.0 -c pytorch

ubuntu 16.02 NVIDIA 9.0 k20c cuda toolkit11.3 pytorch-gpu 踩坑教程_第10张图片

最后安装完成后,在CMD python中测试是否有GPU,
我们需要运行简单的样例代码测试,例如打印出随机生成的张量矩阵,以及gpu是否可以使用。
先在命令行输入python,进入python的解释器,依次输入以下命令,每输入一句回车

import torch
x = torch.rand(5,3)	
print(x)

输出的内容应该类似于以下:

tensor([[0.8224, 0.1163, 0.6721],
[0.1477, 0.6822, 0.5136],
[0.3805, 0.0996, 0.2719],
[0.3358, 0.5633, 0.6164],
[0.5203, 0.4628, 0.6428]])

再输入

>>> torch.cuda.is_available()
True

恭喜安装成功!

你可能感兴趣的:(NVIDIA,ubuntu,pytorch)