使用hugging face开源库accelerate进行多GPU训练(单机多卡)时,在保存模型结构的时候出现的问题
目录问题描述问题分析问题解决问题描述我在保存模型结构的时候,先获取模型参数,然后再保存,代码如下:图示代码是在训练主循环中的:这种情况下会出现报错:nboundLocalError:UnboundLocalErrorlocalvariable'epochcheckpoint’referencedbeforeassignment:完整报错:简单来说就是我用于存储模型的函数有一个输入参数是epoch_