【Yolact训练自己的数据集(踩坑总结)】

yolact训练自己的数据集

  • 前言
  • 一、问题1
  • 二、问题2
    • 1.RuntimeError: Expected a 'cuda' device type for generator but found 'cpu':
  • 三、云端训练
  • 四、云端训练结束时出现的错误


前言

yolact训练自己的服装数据集,服装数据集采用labelme进行标注,采用labelme2COCO将生成的饿接送文件转换为COCO格式,随后参照https://blog.csdn.net/weixin_40802676/article/details/115413362进行修改。

仅粗糙记录,方便自己以后进行参考!!!!!!


提示:以下是本篇文章正文内容,下面案例可供参考

一、问题1

1、RuntimeError: CUDA out of memory. Tried to allocate 150.00 MiB (GPU 0; 2.00 GiB total capacity; 1.10 GiB already allocated; 138.10 MiB free; 23.67 MiB cached)
【Yolact训练自己的数据集(踩坑总结)】_第1张图片这里多半是因为自己的电脑GPU显存不够,将CUDA改为“-1”,准备采用CPU跑,但依旧报此错误,后来采用云端服务器,问题解决。但出现新的问题,如问题2

二、问题2

1.RuntimeError: Expected a ‘cuda’ device type for generator but found ‘cpu’:

解决办法,将train.py中的Dataloader中第249行代码shuffle=true改为False ,问题解决。
【Yolact训练自己的数据集(踩坑总结)】_第2张图片

三、云端训练

将整个压缩包.zip传入云端之后,在终端输入解压文件代码(unzip yolact_master.zip.   注意:此处的要在该文件的路径上进行解压
将整个压缩包.zip传入云端之后,在终端输入解压文件代码(unzip yolact_master.zip. 注意:此处的要在该文件的路径上进行解压

四、云端训练结束时出现的错误

【Yolact训练自己的数据集(踩坑总结)】_第3张图片查阅资料发现是全局变量与聚币变量没处理好的问题,故将报错出train.py的第374行前添加了global val_dataset。

运行命令:batch_size自己调节。
python3 train.py --config=yolact_base_config --batch_size=2
采用python train.py --config=yolact_base_config会默认batch_size=8,太大会使得GPU内存溢出。

你可能感兴趣的:(python)