Win10配置pytorch深度学习环境

一、Win10配置pytorch深度学习环境

有一台装win10系统的电脑有两张显卡,所以尝试在win10上装环境了,之前在Ubuntu上安装过深度学习环境,相比起来还是Ubuntu的命令行配环境更方便。

  1. 安装Anaconda
    新建一个Python 3.6环境命名为“python36”
    之前base(root)环境下是Python 3.8环境,安装pytorch和cuda一直失败,所以我重新换了个环境。

  2. 在python36中搜索安装cuda

  3. 在python36中搜索安装cudnn
    检查cuda的版本,可以用命令nvidia-smi 在最上面会显示

  4. 安装Pytorch:
    去pytorch官网看与cuda对应的版本号再安装;
    直接在anaconda环境中搜索安装容易造成pytorch与cuda版本冲突;
    在https://pytorch.org/get-started/locally/中根据win10 cuda版本选择对应的pytorch版本:
    Win10配置pytorch深度学习环境_第1张图片复制命令行“conda install pytorch torchvision torchaudio cudatoolkit=11.3 -c pytorch”到“python36”环境中安装。

  5. 检验pytorch和cuda:
    import torch
    print(torch.version)
    print(torch.cuda.is_available())
    如果输出的是True则安装正确

  6. 在anaconda home中,在“python36”环境下install “jupyter notebook”,然后点"launch"打开jupyter notebook

  7. 如果conda instal不能安装,用pip
    例如pip install torchsummary

二、运行程序时的错误:

(1) 版本问题:
Win10配置pytorch深度学习环境_第2张图片
由于直接用“pip install pytorch-metric-learning”安装的pytorch-metric-learning版本不对,卸载“pip uninstall pytorch-metric-learning”,然后安装指定版本“pip install pytorch_metric_learning==0.9.94”

(2) 安装错误
Win10配置pytorch深度学习环境_第3张图片
pip install SoundFile是没用的,需要pip install PySoundFile

三、查看GPU使用情况:

win10 cmd输入nvidia-smi显示没有这个命令,解决办法:System Properties-Advanced-Environment variables-System variables-New 将nvidia-smi.exe的存放路径放到系统环境变量中。
variable name: Path
variable value: C:\Program Files\NVIDIA Corporation\NVSMI

查看GPU CPU运行情况:

  1. 命令行nvidia-smi
  2. 搜索Task Manager或者快捷键ctrl+alt+delete查看Performance

四、使用多张GPU并行训练网络:

num_gpu = torch.cuda.device_count() # check the number of GPUs
print(‘%d GPUs are available’%num_gpu)
model =model.to(“cuda”)

gpu_ids = [0, 1]
model = nn.DataParallel(model, gpu_ids, gpu_ids[0])
the meaning of the parameters:
model:需要训练的并行模型
gpu_ids(int类型列表或torch.device):可用的CUDA设备
gpu_ids0:输出的设备位置(默认为gpu_id[0])

五、win10 Jupyter notebook远程连接:

配置win10 Jupyter notebook远程连接

c.NotebookApp.ip = ‘*’
c.NotebookApp.open_browser = False
c.NotebookApp.password=u’密钥’
c.NotebookApp.port = 8888
c.NotebookApp.allow_remote_access = True
!!!这几句话后面都不要有空格,否则会报错

你可能感兴趣的:(远程服务器跑程序,深度学习,神经网络)