Ubuntu18.04下pytorch环境配置记录

Ubuntu18.04下pytorch环境配置记录

  1. 禁用Secure boot

  2. 安装nvidia驱动
    注意先添加软件下载源,清华或阿里云,否则apt install会失败;添加后可关闭软件自动更新等,防止内核自动升级,导致与显卡驱动不兼容。
    软件源添加后查看:
    Ubuntu18.04下pytorch环境配置记录_第1张图片安装
    可通过附加驱动或

    ubuntu-drivers devices	#建议选择推荐的驱动
    sudo apt install nvidia-driver-470
    

    Ubuntu18.04下pytorch环境配置记录_第2张图片检验:

    nvidia-smi
    

    Ubuntu18.04下pytorch环境配置记录_第3张图片

    卸载重装

    sudo apt purge nvidia-*  
    sudo add-apt-repository ppa:graphics-drivers/ppa
    sudo apt update
    sudo apt install nvidia-driver-470
    
  3. 安装Anaconda

    安装

    具体安装见原帖1

    卸载
    删除Anaconda文件夹,注释或删除.bashrc里的conda配置。随后重新安装。

    rm -rf anaconda文件夹名
    sudo gedit ~/.bashrc
    source ~/.bashrc
    
  4. 安装cuda、cuDNN
    cuda安装
    cuda包,下载按照官网教程;
    continue–>accept–>不勾选driver并install;
    配置环境变量:(版本号自行改)

    export PATH=/usr/local/cuda-10.2/bin:$PATH
    export LD_LIBRARY_PATH=/usr/local/cuda-10.2/lib64:$LD_LIBRARY_PATH
    export CUDA_HOME=/usr/local/cuda
    

    检验

    nvcc -V
    

    cuda卸载
    执行/usr/local/cuda10.2/bin/下的 ./cuda-uninstaller。

    cudnn安装
    cuDNN,注册后方能下载;
    解压后,将cudnn的include/cudnn.h和lib/libcudnn*文件复制到cuda10.2的include/和lib64/中。
    具体复制操作见原帖1
    写完发现我是30系列的显卡,只适配cuda11以上的版本,重新装了一遍,切记看一下对应的关系。

  5. 安装pytorch-gpu

     conda install pytorch=1.6 torchvision cudatoolkit=10.2 -c pytorch
    

    CondaHTTPError问题
    conda换源
    Ubuntu18.04下pytorch环境配置记录_第4张图片

    可以尝试将https–>http,亲测有效(但也尝试了几次才有效),用了北外

    检验

    python
    import torch
    print(torch.cuda.is_available())
    

    如果输出的结果为true,则表示pytorch build for GPU搭建成功。
    重新装了对应cudatoolkit11.0以上的pytorch-gpu,根据pytorch官网的教程,cudatoolkit11.3一直安装不上,后来发现"install previous versions of PyTorch",安装了cudatoolkit11.0就好了。过往版本

    conda install pytorch==1.7.0 torchvision==0.8.0 torchaudio==0.7.0 cudatoolkit=11.0 -c pytorch
    
  6. 总结
    1 主要参考了原帖1,具体细节都在里面。
    2 踩的坑多了,记录也就多了…

你可能感兴趣的:(机器学习,pytorch)