pytorch yolov5训练中断如何继续训练

我电脑总蓝屏,一共50个Epoch好不容易训练到第十三个,结果蓝屏了
以前我刚接触yolov5我只会执行train.py脚本来。
然后搜索pytorch 模型训练中断怎么办,都让我设置保存断点然后下次运行加载

torch.save()
torch.load()
我总觉得不对劲,我总觉得应该还有别的方法
因为我这个没在pycharm上运行整个项目,我是在Anaconda Prompt上 执行train.py
然后我就开始在train.py里查找有没有torch.save和torch.load,还真有,而且看着像是在设置断点,保存最近的模型
pytorch yolov5训练中断如何继续训练_第1张图片
在这里插入图片描述
于是我就觉得肯定是有保存断点的

但这个时候我还是不知道该如何写
然后我就开始研究每次训练的命令

python train.py --data data/voc-mask.yaml --cfg models/yolov5s6-mask.yaml --weights weights/yolov5s6.pt --batch-size 4 --epochs 50 --workers 4 --img-size 1280 --name base+P6a1

这些个参数有决定断点的吗

于是我又找到train.py然后找到mian函数

就开始一个一个的看和搜索
就找到那个

 parser.add_argument('--resume', nargs='?', const=True, default=False, help='resume most recent training')

这个 resume 做动词有重新开始的意思

resume most recent training.

重新开始最近的训练。

然后我就开始搜索这个

然后我就遇到了有的文章里
pytorch yolov5训练中断如何继续训练_第2张图片
有这句话,果然打开一看,原来yolov5自带了断点保存参数

只需要打开train.py然后把default改成True即可。

 parser.add_argument('--resume', nargs='?', const=True, default=True, help='resume most recent training')

我试了试在输入执行命令时加上–resume=true是不行的,他显示找不到断点

http://www.cppcns.com/jiaoben/python/468212.html

你可能感兴趣的:(人工智能,pytorch,yolov5)