复现论文DRL代码程序

复现论文第一步(以DRL为例),download 代码 and then 创建环境。

1)git clone GitHub - foolwood/DRL: [arXiv22] Disentangled Representation Learning for Text-Video Retrieval姑且称之为克隆法,但是习惯于直接下载:复现论文DRL代码程序_第1张图片

然后在pycharm中打开就是Files→Setting→project structure: Add Content Root选择下载好的代码位置就好,就可以看到代码啦~复现论文DRL代码程序_第2张图片

2)pycharm 创建环境步骤:

cd DRL conda create -n drl python=3.9 这时环境就创建好啦pycharm interpreter就可以选择conda下的:复现论文DRL代码程序_第3张图片

conda activate drl 激活环境进入drl

配置环境时可能存在一些问题,比如说create 环境后,conda activate无效复现论文DRL代码程序_第4张图片

解决方法是:source activate

source deactivate

安装一些列的包:

pip install -r requirements.txt -i Simple Index pip install torch==1.8.1+cu102 torchvision==0.9.1+cu102 -f https://download.pytorch.org/whl/torch_stable.html

第二步加载模型数据集(就复制粘贴就好):复现论文DRL代码程序_第5张图片

第三步是GitHub中写的Fine-tuning code

运行中遇到的问题有:

复现论文DRL代码程序_第6张图片

在网上查到的是说gpu使用的问题:可以通过命令 “nvidia-smi”查看gpu使用情况看看空出来的是几号,就把

 等号后面改成空闲的区。改完后又有这个错误,呜呜呜,然后发现一篇宝藏

pytorch 使用指定的GPU RuntimeError: CUDA error: invalid device ordinal_城俊BLOG的博客-CSDN博客解释很多这个原因,对于DRL的代码而言,应用了四块gpu(0,1,2,3)其中--nproc_per_node=4指定了该节点启动三个进程,所以在改指定的gpu之后还要把对应的进程数改掉就可以了!

还遇到了cd进不去带空格文件夹的情况,然后发现cd file\ hhh就可以了,就是要在文件名中的空格前加入“\”符号,告知并非其他操作就可以进去了

Finetuning Code中写道复现论文DRL代码程序_第7张图片

有的时候Debug可能会出现一些问题比如说参数未设置,环境有问题?launch之类的,第一行可以直接写在main.py中

os.environ["CUDA_VISIBLE_DEVICES"]="0,1,2"

+

借鉴如下:

torch.distributed.init_process_group卡死_Y_shh的博客-CSDN博客_distributed.init_process_group

在train的时候遇到了KeyError的错误,是在dict中找不到该键值,仔细查找改为实际的键值

复现论文DRL代码程序_第8张图片

RuntimeError: CUDA out of memory.

此时应该减小batchsize的大小。

然后就可跑啦!!!

你可能感兴趣的:(python,pycharm,计算机视觉)