针对CNN的一种新的数据增强方式:RICAP

本文针对日本神户大学发表在ACML2018的一篇论文《RICAP: Random Image Cropping and Patching Data Augmentation for Deep CNNs》进行解读。
针对CNN的一种新的数据增强方式:RICAP_第1张图片

Motivations

CNN在不同领域都取得了令人振奋的成绩,主要原因在于CNN中的大量参数能够拟合各种各样的数据分布。然而过多的参数,相比较而言较小的数据会导致一定程度的过拟合现象。数据增强作为一种增加数据集样本的策略,能够有效的缓解过拟合的问题。
主要的数据增强包含flipping,resizing等,最近来自厦大的钟准博士提出的random erasing,来自埃克塞特大学的研究人员提出的cutout以及MIT&FAIR提出的mixup都被证明非常有效。本文受到启发,提出一种新的策略——random image cropping and patching(PACIP)

Methods

针对CNN的一种新的数据增强方式:RICAP_第2张图片
上图是一个非常简易的解释图标,即在四张图中裁剪一部分,将这些部分重新组合成新的图片。以下解释具体实现方法。
针对CNN的一种新的数据增强方式:RICAP_第3张图片
假设已知w和h(左上角图片的宽和高),对于每一个组成图片的小图片,根据与w和h的关系,能够计算出每一个小图片的宽度以及高度。在裁剪小图片的过程中,为了随机选择一个小区域,裁剪区域左上角的坐标满足
在这里插入图片描述
,其中K属于{1,2,3,4}。
在训练过程中,由于需要给图像指定标签,label值表示为:
针对CNN的一种新的数据增强方式:RICAP_第4张图片
即表示按照子图片占原图像面积的比例给原图像权重赋值。
由于w和h也是满足一定的分布规则,分为三种情况:
针对CNN的一种新的数据增强方式:RICAP_第5张图片
对于anywhere:
满足:
针对CNN的一种新的数据增强方式:RICAP_第6张图片
对于center:
满足:
针对CNN的一种新的数据增强方式:RICAP_第7张图片
当t等于0,退化到anywhere情况。
对于corner:
针对CNN的一种新的数据增强方式:RICAP_第8张图片
Results

采用WideResNet架构的Test Error Rates:
针对CNN的一种新的数据增强方式:RICAP_第9张图片
采用WideResNet-50-2-bottleneck架构的Test Error Rates:
针对CNN的一种新的数据增强方式:RICAP_第10张图片
可以发现该方法无论是和cutout还是mixup相比,都有一定的竞争力。
针对CNN的一种新的数据增强方式:RICAP_第11张图片

你可能感兴趣的:(Paper阅读)