1.安装环境
GPU : GTX1060 mobile
GPU : i5
OS : UBUNTU18.04
2.安装过程与注意事项
1.显卡驱动的安装:
安装cuda需要先安装对应的显卡驱动,ubuntu是默认使用一个集成显卡以及开源驱动,打开终端,使用以下指令:
1.$ sudo passwd 密码
2.$ su root 登陆root账户
3.$ ubuntu-drivers devices 显示可用设备(可以看到可使用的nvidia显卡型号)
/////////////////////////////////////////////////////////////////////
// 输出结果类似下列:
// == /sys/devices/pci0000:00/0000:00:01.0/0000:01:00.0 ==
// modalias : pci:v000010DEd00001C20sv00001028sd00000825bc03sc00i00
// vendor : NVIDIA Corporation
// model : GP106M [GeForce GTX 1060 Mobile]
// driver : nvidia-driver-390 - distro non-free recommended
// driver : xserver-xorg-video-nouveau - distro free builtin
//
/////////////////////////////////////////////////////////////////////
观察到存在可用GPU就可以安装对应驱动了:
1.$ sudo ubuntu-drivers autoinstall
or
2.$ sudo apt install nvidia-xxx //xxx为对应版本 例如330
在这里建议使用1,会自动安装正确的版本。
安装完成后,重新启动,查看主机设定,看到GPU内容为 NVIDIA 1060-Mobile ,而非集成显卡xxx则为成功。
2.安装cuda
最新的cuda版本已经有对应ubuntu18.04操作系统的了,但似乎是高版本(cuda 10)。本着版本越低,学习资料越多,爬坑越容易,选择了9.1版本(如果要安装tensorflow似乎最高是只支持8.0版本),而9.1对应的ubuntu版本是16.04,不过问题不大。
然后下载对应cuda版本的cudnn,这里是cudnn-v7。
之后需要对本机的GCC进行降级处理:
$ sudo apt-get install gcc-4.8
$ sudo apt-get install g++-4.8
//进入 /usr/bin
$ls -l gcc*
$ls -l g++*
//显示版本
$ sudo mv gcc gcc.bak
$ sudo ln -s gcc-4.8 gcc
$ sudo mv g++ g++.bak
$ sudo ln -s g++-4.8 g++
$ gcc -V
$ g++ -V
//显示版本
安装cuda.run文件,注意提示安装GPU 相关部件时选择n。
随后添加环境变量:
$ echo 'export PATH=/usr/local/cuda/bin:$PATH' >> ~/.bashrc
$ echo 'export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
$ source ~/.bashrc
或者
$ gedit ~/.bashrc
将上面冒号中的两段话加入都最后
$nvcc -V
//测试cuda安装
解压缩cudnn,将对应文件复制到对应目录
$ sudo cp cuda/include/cudnn.h /usr/local/cuda/include
$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
$ sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
//前两句是复制对应文件到对应位置,注意没有权限复制时先提升权限至root,第二句是为复制后的文件提供读的权限,整个过程请善用tab补全路径
至此,cuda安装完毕。
3.安装anaconda以及pytorch
从anaconda官网,或者利用清华源下载.sh文件,并安装,安装完后修改环境变量:
$sudo gedit ~/.bashrc
//打开bashrc文件后在末尾输入下面的语句:
export PATH="/home/xxxxxx/anaconda3/bin:$PATH"
///home/xxxxxxx/anaconda3/替换成你的安装路径
关闭bashrc文件后,在命令行输入:
source .bashrc
//使更新的环境变量立即生效
测试anaconda安装效果:
$ conda
//出现如下
//usage: conda [-h] [-V] command ...
//conda is a tool for managing and deploying applications, environments and packages.
//安装成功
然后使用指令:
$ conda install pytorch torchvision cuda91 -c pytorch
大多数速度会很慢,建议换清华源:
$ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/ $ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
$ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
$ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
$ conda config --set show_channel_urls yes
//为什么我TM换了还是这么慢啊
更新:
从pytorch官网下载whl文件进行安装,安装pycharm,选择anaconda环境(在此之前更新python3.6)最终完成了环境搭建。
import torch.nn
if torch.cuda.is_available():
print("cuda is available")
print("Hello World")
//输出:
cuda is available
Hello World
Process finished with exit code 0