Yolox.core.trainer:252 - epoch: 14/300, iter: 470/2043, mem: 10089Mb, iter_time: 6.826s, data_time:

Yolox使用大模型训练自己的数据

这里直接下载官方源码的2.0版本作训练,因最新版有bug(不支持多卡训练)
具体训练步骤不做展示,使用的yolox-m的模型,有不明白的评论区评论,我会看。

一.训练问题描述:

| yolox.core.trainer:252 - epoch: 14/300, iter: 480/2043, mem: 10089Mb, iter_time: 9.435s, data_time: 9.261s, total_loss: 0.0, iou_loss: 0.0, l1_loss: 0.0, conf_loss: 0.0, cls_loss: 0.0, lr: 9.980e-03, size: 480, ETA: 55 days,

为什么训练yolox时候出现了各项损失都为0呢?

首先yolox预训练模型为coco数据训练得到的80类别, 官方代码中在数据读取时候指定为coco的80类> yolox.core.trainer:252 - epoch: 14/300, iter: 470/2043, mem: 10089Mb,
iter_time: 6.826s, data_time: 6.610s, total_loss: 0.0, iou_loss: 0.0,
l1_loss: 0.0, conf_loss: 0.0, cls_loss: 0.0, lr: 9.980e-03, size: 608,
ETA: 55 days

所以出现各项损失都为0的原因为,你自己/你使用的数据标签被卡住了,标签文件没读入网络。

解决方法

  • 找到项目路径下的yolo/data/voc.py 添加判断条件

文中我把62行name改为了name1.
加入了66行的判断条件.

Yolox.core.trainer:252 - epoch: 14/300, iter: 470/2043, mem: 10089Mb, iter_time: 6.826s, data_time:_第1张图片

-至此,执行命令后,各loss显示正常。

python train.py

![在这里插入图片描述

](https://img-blog.csdnimg.cn/907238099d56482fbf69663f9a9eb103.png#pic_center)

你可能感兴趣的:(目标检测yolox,深度学习,pytorch,目标检测)