yolox全解析

模型图:

网络模型分为四个部分:
1.输入端、2.backbone、3.neck、4.预测端
每个部分的创新,关键点是:
1.输入端:mosaic,mixup图像增强
2.backbone:CSPLayer层,silu激活函数
3.neck:FPN,silu激活函数
4.预测端:Decoupled Head,Anchor-free,Multi positive,End-to-End YOLO
1.输入端
mosaic讲解:https://zhuanlan.zhihu.com/p/163356279
mixup讲解:https://www.zhihu.com/question/308572298
2.backbone:
Focus,CSPLayer,参考之前博客
3.neck
FPN结构
4.预测层
Decoupled Head:类别cls一个分支,置信度conf,位置reg一个分支
Anchor-free:将每个位置的三个框变为一个框,并直接预测四个值(两个offset和宽高)
Multi positive:中心3*3的区域中选取正样本,而不只是一个点
End-to-End YOLO:效果不好,最终变成可选部分
SimOTA标签分配:标签分配策略
head头的三个分支输出为202085(stride=32),404085(stride=16),808085(stride=8)。因此,预测框的大小分别为3232,1616,8*8。
标签分配:挑选正样本锚框,两个步骤:初步筛选,SimOTA。
初步筛选有两个步骤:根据中心点筛选,根据目标框筛选。
SimOTA有四个步骤:1.初筛正样本信息提取
2.Loss函数计算
3.cost计算
4.SimOTA

你可能感兴趣的:(yolox,深度学习,人工智能)