ubuntu 18.04 + cuda-9.1 + cudnn + pytorch 环境搭建

1.安装环境

GPU : GTX1060 mobile

GPU : i5

OS    : UBUNTU18.04

2.安装过程与注意事项

1.显卡驱动的安装:

安装cuda需要先安装对应的显卡驱动,ubuntu是默认使用一个集成显卡以及开源驱动,打开终端,使用以下指令:

1.$ sudo passwd 密码
2.$ su root     登陆root账户
3.$ ubuntu-drivers devices 显示可用设备(可以看到可使用的nvidia显卡型号)

/////////////////////////////////////////////////////////////////////
// 输出结果类似下列:
// == /sys/devices/pci0000:00/0000:00:01.0/0000:01:00.0 ==
// modalias : pci:v000010DEd00001C20sv00001028sd00000825bc03sc00i00
// vendor   : NVIDIA Corporation
// model    : GP106M [GeForce GTX 1060 Mobile]
// driver   : nvidia-driver-390 - distro non-free recommended
// driver   : xserver-xorg-video-nouveau - distro free builtin
//
/////////////////////////////////////////////////////////////////////

 观察到存在可用GPU就可以安装对应驱动了:

1.$ sudo ubuntu-drivers autoinstall
or
2.$ sudo apt install nvidia-xxx   //xxx为对应版本 例如330 

在这里建议使用1,会自动安装正确的版本。

安装完成后,重新启动,查看主机设定,看到GPU内容为 NVIDIA 1060-Mobile ,而非集成显卡xxx则为成功。

2.安装cuda

最新的cuda版本已经有对应ubuntu18.04操作系统的了,但似乎是高版本(cuda 10)。本着版本越低,学习资料越多,爬坑越容易,选择了9.1版本(如果要安装tensorflow似乎最高是只支持8.0版本),而9.1对应的ubuntu版本是16.04,不过问题不大。

然后下载对应cuda版本的cudnn,这里是cudnn-v7。

之后需要对本机的GCC进行降级处理:

$ sudo apt-get install gcc-4.8
$ sudo apt-get install g++-4.8
//进入 /usr/bin
$ls -l gcc*
$ls -l g++*
//显示版本 
$ sudo mv gcc gcc.bak
$ sudo ln -s gcc-4.8 gcc
$ sudo mv g++ g++.bak
$ sudo ln -s g++-4.8 g++

$ gcc -V
$ g++ -V
//显示版本

安装cuda.run文件,注意提示安装GPU 相关部件时选择n。

随后添加环境变量:


$ echo 'export PATH=/usr/local/cuda/bin:$PATH' >> ~/.bashrc 
$ echo 'export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc 
$ source ~/.bashrc

或者
$ gedit ~/.bashrc
将上面冒号中的两段话加入都最后
$nvcc -V
//测试cuda安装

解压缩cudnn,将对应文件复制到对应目录

$ sudo cp cuda/include/cudnn.h /usr/local/cuda/include
$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
$ sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
//前两句是复制对应文件到对应位置,注意没有权限复制时先提升权限至root,第二句是为复制后的文件提供读的权限,整个过程请善用tab补全路径

至此,cuda安装完毕。

3.安装anaconda以及pytorch

从anaconda官网,或者利用清华源下载.sh文件,并安装,安装完后修改环境变量:

$sudo gedit ~/.bashrc
//打开bashrc文件后在末尾输入下面的语句:
export PATH="/home/xxxxxx/anaconda3/bin:$PATH" 
///home/xxxxxxx/anaconda3/替换成你的安装路径
关闭bashrc文件后,在命令行输入:
source .bashrc 
//使更新的环境变量立即生效

测试anaconda安装效果:

$ conda
//出现如下
//usage: conda [-h] [-V] command ...
//conda is a tool for managing and deploying applications, environments and packages.
//安装成功

然后使用指令:

$ conda install pytorch torchvision cuda91 -c pytorch

大多数速度会很慢,建议换清华源:

$ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/ $ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/ 
$ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
$ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/ 
$ conda config --set show_channel_urls yes

//为什么我TM换了还是这么慢啊

 

更新:

从pytorch官网下载whl文件进行安装,安装pycharm,选择anaconda环境(在此之前更新python3.6)最终完成了环境搭建。

import torch.nn

if torch.cuda.is_available():
    print("cuda is available")
print("Hello World")

//输出:
cuda is available
Hello World

Process finished with exit code 0

 

你可能感兴趣的:(ubuntu 18.04 + cuda-9.1 + cudnn + pytorch 环境搭建)