Anchor free系列网络之YOLOX源码逐行讲解篇(六)--Mixup数据增强

整个系列包括:Demo源码逐行讲解->train脚本源码逐行讲解->backbone源码逐行讲解->FPN源码逐行讲解->Head源码逐行讲解->loss计算源码逐行讲解->数据加载源码逐行讲解->数据增强源码逐行讲解->simOTA源码逐行讲解。保证逐行,注意是逐行,包括python语法,tensor维度和逐行代码的作用及应用。其实网络结构本没有任何神秘的地方,都是一些模块堆叠起来的,你完全可以没有任何理由的修改任何一个模块。看完这个系列后自己完全可以随便的去对任何网络结构做手脚,而不仅仅局限于一个调参者。

本篇讲的是YOLOX中的mixup数据增强。其过程就是将两张图缩放,翻转或mosaic数据增强后按一定比例混合,同时将gtbox进行混合。代码只有六七十行,是这个系列最简单的一节。


将YOLOX中mixup增强的代码定位到yolox\data\datasets\mosaicdetection.py的mixup()方法,该方法中,origin_img参数代表mosaic增强后的图像,origin_labels参数代表mosaic增强后的标签,input_dim参数代表预设的输入尺寸,如(640, 640)。

你可能感兴趣的:(视觉检测图像分割干货,YOLOX,mixup,代码)