Anchor free系列网络之YOLOX源码逐行讲解篇(五)--mosaic数据增强及数学理解

整个系列包括:Demo源码逐行讲解->train脚本源码逐行讲解->backbone源码逐行讲解->FPN源码逐行讲解->Head源码逐行讲解->loss计算源码逐行讲解->数据加载源码逐行讲解->数据增强源码逐行讲解->simOTA源码逐行讲解。保证逐行,注意是逐行,包括python语法,tensor维度和逐行代码的作用及应用。其实网络结构本没有任何神秘的地方,都是一些模块堆叠起来的,你完全可以没有任何理由的修改任何一个模块。看完这个系列后自己完全可以随便的去对任何网络结构做手脚,而不仅仅局限于一个调参者。

本篇讲的是YOLOX中的mosaic数据增强,大多还是opencv的操作。


下图就是一个mosaic增强后的效果图,可以看出:该图像由四张图像拼接且每张图像都有一定的仿射变换(旋转、平移、resize等)

Anchor free系列网络之YOLOX源码逐行讲解篇(五)--mosaic数据增强及数学理解_第1张图片

我们打开yolox\data\datasets\mosaicdetection.py,从下图所示的地方开始:

你可能感兴趣的:(视觉检测图像分割干货,YOLOX,代码,mosaic增强)