论文地址:random erasing
本文的方法名为random erasing,是一种数据增强的方法。通过随机选择不同大小的方形区域,填充随机像素值,达到增加数据遮挡效果的数据增强。
与cutout不同的地方有三点:(1)选择的方形大小不是固定的;(2)填充区域选择的是[0,255]的随机值,而不是0;(3)方形区域限制在图像内;
如果通过添加遮挡的图像来解决遮挡数据集的数据增广,这花费显得昂贵了,而且遮挡的等级可能会收到限制。由于选择的区域大小是随机的,所以random erasing可以生成不同遮挡级别的增强图像。
算法的实现如下图示:(1)有一个随机的概率 p p p选择是否做random erasing数据增强;(2)选择一个面积大小 S S S作为矩阵方形的面积,面积大小有上下限 s l , s h s_l,s_h sl,sh;(3)随机的长宽比 r e r_e re确定矩阵的形状,长宽比有上下限 r 1 , r 2 r_1,r_2 r1,r2;(4)选择一个点作为方形区域的左上角,且需要保证方形区域的右下角在图像内;
当算法对象是分类任务时,由于不知道对象具体位置,所以random erasing选择区域是在整个图像上;当算法对象是目标检测任务时,由于目标位置可知,所以有三种方案:(1)IRE,Image-aware Random Erasing,在整个图像上随机选择位置;(2)ORE,Object-aware Random Erasing,在目标bounding box区域内;(3)I+ORE,选择图像和bounding box。三种方案如下图所示。
当 p = 0.5 , s l = 0.02 , s h = 0.4 , r 1 = 1 r 2 = 0.3 p=0.5,s_l=0.02,s_h=0.4,r_1=\frac1{r_2}=0.3 p=0.5,sl=0.02,sh=0.4,r1=r21=0.3时,各网络在CIFAR-10、CIFAR-100、Fashion-MNIST上的实验如下图所示:可以看出,random erasing都是有有益于性能提升的。
**超参数的消融实验如下:**可以发现,当 p ∈ [ 0.2 , 0.8 ] , s h ∈ [ 0.2 , 0.8 ] p\in[0.2,0.8],s_h\in[0.2,0.8] p∈[0.2,0.8],sh∈[0.2,0.8],random erasing都是帮助性能提升的。对于分类任务的最佳参数为: p = 0.5 , s l = 0.02 , s h = 0.4 , r 1 = 1 r 2 = 0.3 p=0.5,s_l=0.02,s_h=0.4,r_1=\frac1{r_2}=0.3 p=0.5,sl=0.02,sh=0.4,r1=r21=0.3。
矩形区域填充值消融学习:有四种方案:(1)RE-R,填充 [ 0 , 255 ] [0,255] [0,255]之间的随机值;(2)RE-M,填充ImageNet的平均值 [ 125 , 122 , 114 ] [125,122,114] [125,122,114];(3)RE-0,填充0;(4)RE-255填充255。最后得出结论:(1)不管哪种方案都比baseline要好;(2)RE-R和RE-M效果相当,比RE-0和RE-255要好。
与dropout和随机添加噪声的对比:随机添加噪声的方案为用随机值改变像素值,改变一定比例的像素。对比结果如下图所示。当 λ = 0.4 时 \lambda=0.4时 λ=0.4时,改变的像素数量与random erasing相当。
数据增光方法random flip, random crop, random erasing的消融学习:flip+crop比单独使用的好;三种方法结合起来效果更好;
目标检测的random erasing有三种方案,其实验结果如下图所示:ORE要比IRE稍微好一些,I+ORE效果最好