YOLOX论文解读

文章目录

  • 创新点
  • 算法
    • Decoupled head
    • Strong data augmentation
    • Anchor-free
    • Multi positives
    • SimOTA
    • End-to-end YOLO
  • 实验结果
  • 结论

论文: 《YOLOX: Exceeding YOLO Series in 2021》
代码: https://github.com/Megvii-BaseDetection/YOLOX

创新点

  1. 将YOLO检测器变为anchor-free形式,减少人工设置参数;
  2. 集成了其他先进检测技术(比如decoupled head、label assignment策略SimOTA)取得了SOTA性能;

与YOLO-Nano相比,AP提升1.8%;与YOLOv3相比,性能提升3%;
YOLOX-L,与YOLOv4和v5有相当参数量,在COCO数据集上达到50AP,在V100平台上达到68.9FPS;

算法

Decoupled head

为了解决分类分支与回归分支冲突问题,解耦两分支;
解耦头的作用如下:
1、加快拟合;
2、对end-to-end yolo(指无NMS后处理过程)性能影响比较大;如表1
YOLOX论文解读_第1张图片
具体解耦操作如下:如图2
1、使用 1 ∗ 1 1*1 11卷积降维到256;
2、增加两个并行分支,每个分支(分类、回归)使用两个3*3卷积;
3、在回归分支额外增加iou分支;
YOLOX论文解读_第2张图片

Strong data augmentation

数据增强主要采用Mosaic 和 MixUp;
mixup检测与分类原理相似;
1、对于尺度不一的输入,通过补0对齐,尺寸使得可以容纳下两张图;
2、相应的loss权重变为mixup参数lambd;

Anchor-free

Anchor-free可以减少设计的参数量及涉及的许多技巧(anchor聚类、Grid Sensitive)

Multi positives

为了与yolov3一致,anchor-free方案中也仅选择一个正样本(gt中心位置),同时忽略其他高质量预测框;
但是由于有些正样本也有正向作用,同时改善正负样本不均衡,因此作者将中心3*3区域作为正样本; 实验结果如表2,AP达到45,超越最好的YOLOv3基线44.3;
YOLOX论文解读_第3张图片

SimOTA

SimOTA过程如下:
1、计算成对预测框与真值框代价,如式1;
在这里插入图片描述
2、计算真值框与前k个预测框iou,其和为Dynamic k;因此对于不同真值框,其Dynamic k存在差异。
3、最后选择代价最小的前Dynamic k个预测框作为正样本;
SimOTA使得AP从45%提升至47.3%;相对于YOLOv3上,性能提升3%,见表2;

End-to-end YOLO

作者跟随参考文献39,增加两个卷积层,一对一分配标签,停止梯度回传,但是性能及推理速度出现下降,如表2。

实验结果

YOLOX论文解读_第4张图片

结论

作何提出一种高性能anchor-free检测器YOLOX,其在性能及速度上达到比较好的平衡;

你可能感兴趣的:(论文详解,目标检测,深度学习,深度学习,计算机视觉,人工智能,目标检测)