学习经验分享之二:YOLOX: Exceeding YOLO Series in 2021

论文地址: https://arxiv.org/pdf/2107.08430.pdf
代码地址:  https://github.com/Megvii-BaseDetection/YOLOXhttps://github.com/Megvii-BaseDetection/YOLOX

改进创新方法:可通过加cbam,se等注意力机制

YOLOX

YOLOX摘要
亮点:
1.采用anchor-free的方式
2.解耦头部
3.采用SimOTA
结果:
YOLONano为0.91M、1.08G Flops,超过NanoDet 1.8%AP
比YOLOv3高3%AP
相较于YOLOv4CSP、YOLOv5-L,速度为68.9FPS,超过YOLOv5-L 1.8%AP。
总结:主要是将anchor-free、SIMOTA、无NMS的检测器融入YOLO中。

YOLOx-DarkNet53
YOLOX是以YOLOv3-DarkNet53为基线进行的。(注意,这里的YOLOv3是加入了SPP的)
基线调整
同时adding EMA weights updating, cosine lr schedule, IoU loss and IoU-aware branch.
总结:
相较于YOLOv3-SPP做出了如下改动:
1.加入EMA权重更新
2.余弦lr调度
3.加入IoU损失
4.加入IoU感知分支

学习经验分享之二:YOLOX: Exceeding YOLO Series in 2021_第1张图片

使用BCE损失,用于训练cls和obj分支,将IoU损失用于训练reg分支。
数据增强方面:
只进行RandomHorizontalFlip、ColorJitter和多尺度数据增强,并放弃RandomResizedCrop策略,因为我们发现RandomResizedCrop与计划的镶嵌增强有点重叠。
解耦头部
为解决分类和回归的冲突问题,提出使用解耦头部的方式。实验验证了耦合探测头会损害性能。
解耦头部的优点:
1.使用解耦的头部可以提高收敛速度。
2.解耦头部对于端对端的YOLO而言,必不可少。该结构组成:由一个1×1的卷积层减少通道数,后面跟着两个平行分支结构

你可能感兴趣的:(学习经验分享,目标检测,深度学习,人工智能)