UserWarning: Detected call of `lr_scheduler.step()` before `optimizer.step()`.

问题描述

在用yolov5跑训练模型时,首行出现WARNING:优化应该在下一步之前执行:UserWarning: Detected call of lr_scheduler.step() before optimizer.step(). In PyTorch 1.1.0 and later, you should call them in the opposite order: optimizer.step() before lr_scheduler.step(). Failure to do this will result in PyTorch skipping the first value of the learning rate schedule.
在这里插入图片描述

问题后果

因为这是警告WARNING,不是错误ERROR,所以我一开始没当回事,跑完了train.py,然后结果就出毛病了,根目录下runs/train/results.png这张图里面全是直线,这指定是有毛病啊:
UserWarning: Detected call of `lr_scheduler.step()` before `optimizer.step()`._第1张图片

问题解决

查阅资料知,这是由于之前下载的pytorch和cudnn所支持的cuda版本不匹配的问题,举个例子,我的pytorch支持11.1的CUDA,而我的CUDNN支持11.4的CUDA,那么这样就会出错,这种错误pycharm环境检测不出,所以很坑。


知道错误原因后,解决就很简单了,一句话,重新装CUDA、pytorch和cudnn。
我推荐去下载10.2版本的CUDA,这是最稳定的版本,然后去pytorch官网和cudnn官网下载支持10.2版本的pytorch和cudnn即可。相关教程请读者自行查阅。


当然,大手子可以去找train.py里面对应的位置然后修改代码解决,两个地方分别位于yolov5的6.1版本的train.py第360行和第380行,咱也不懂为啥报警告,因为从逻辑上看优化确实要先于下一步的,大手子可以分析一下
360行optimizer.step():

    if ni - last_opt_step >= accumulate:
        scaler.step(optimizer)  # optimizer.step
        scaler.update()
        optimizer.zero_grad()
        if ema:
            ema.update(model)
        last_opt_step = ni

380行scheduler.step():

lr = [x['lr'] for x in optimizer.param_groups]  # for loggers
scheduler.step()

你可能感兴趣的:(python,目标检测,pytorch)