【PyTorch】PyCharm远程连接服务器,调试torch.distributed.launch分布式程序

注意,本文章仅适用于远程连接服务器进行调试的情况

  1. 引入软链接

在服务器控制台,你的项目的上一级目录,输入如下命令:

ln -s /home/username/miniconda3/envs/virtualenv_name/lib/python3.6/site-packages/torch/distributed/ yourproject

之后,进入你项目的目录,输入ls,你将在项目文件夹下看见一个蓝色的distributed文件夹,说明软链接成功

在这里插入图片描述

通过PyCharm的deployment功能,将远程yourproject/distributed文件夹下载到本地

  1. 修改PyCharm设置
    【PyTorch】PyCharm远程连接服务器,调试torch.distributed.launch分布式程序_第1张图片
    点击edit configurations

  2. 在script设置里面输入你本地项目文件夹的launch.py路径,
    因为这里只能选择本地文件,所以我们之前把distributed文件夹下载到本地就起作用了,直接选择即可
    因为软链接成功了,所以使用本地的launch相当于远程的launch

  3. 修改parameters,只需要删除原来的运行脚本中的python -m torch.distributed.launch,其他不变

  4. 修改环境变量,加入CUDA_VISIBLE_DEVICES=0,1

  5. 其他不变,点击确定,点击run->debug train.py完成调试

界面如图所示
【PyTorch】PyCharm远程连接服务器,调试torch.distributed.launch分布式程序_第2张图片

你可能感兴趣的:(深度学习,pycharm,pytorch,服务器,分布式)