深度学习之数据增强

数据增强方法是指将数据集的数量增大十倍以上,从而极大化利用小样本集中的每个样本,使之也可以训练得到一个较好的模型。数据增强方法还可以提高模型的鲁棒性,防止其易在训练中出现过拟合的现象。

常用的数据增强方法有:
1.平移(Shift)变换:对原始图片在图像平面内以某种方式(预先定义或者随机方式确定平移的步长、范围及其方向)进行平移。
2.翻转(Flip)变换:沿竖直或者水平方向对原始图片进行翻转。
3.随机裁剪(Random Crop):随机定义感兴趣区域以裁剪图像,相当于增加随机扰动。
4.噪声扰动(Noise):对图像随机添加高斯噪声或者椒盐噪声等。
5.对比度变换(Contrast):改变图像对比度,相当于在HSV空间中,保持色调分量H不变,而改变亮度分量V和饱和度S,用于模拟现实环境的光照变化。
6.缩放变换(Zoom):以设定的比例缩小或者放大图像。
7.尺度变换(Scale):与缩放变换有点类似,不过尺度变换的对象是图像内容而非图像本身(可以参考SIFT特征提取方法),构建图像金字塔以得到不同大小、模糊程度的图像。

随着CNN体系结构具有更多的参数,使得传统的数据增强技术显得不足,促使着新的数据增强方法出现。

RICAP: Random Image Cropping and Patching Data Augmentation for Deep CNNs
该文献中提出了一种新的数据增强技术,称为随机图像裁剪和修补(RICAP),它随机地对四幅图像进行裁剪,并对它们进行修补,以生成新的训练图像。此外,RICAP混合了四幅图像的类标签,从而产生了类似于标签平滑的优势。
具体可分成三个步骤。首先,从训练集中随机选取四幅图像。第二,图像分别随机裁剪。第三,对裁剪后的图像进行修补以创建新的图像。尽管这一简单的程序,RICAP大幅度增加了图像的多样性,并防止了深度CNN具有许多参数的过拟合。四幅图像的类标签与图像面积成正比。这种标签混合工作在标签平滑,并防止无止境地追求hard 0和1的概率在深CNN使用Softmax函数
深度学习之数据增强_第1张图片
深度学习之数据增强_第2张图片新标签的定义:
在这里插入图片描述
在该方法中,关键是w和h的选择。
深度学习之数据增强_第3张图片
在论文中,作者提出了三种选择方式。
第一种,随机选择,即在整张图范围内随机选择一个点
第二种,中心选择,即定义t,在以图像中心点范围内选择一个点
第三章,角点选择,即定义u,在图像四个角选择一个点

最后附上文章链接:http://proceedings.mlr.press/v95/takahashi18a/takahashi18a.pdf

你可能感兴趣的:(深度学习,数据增强,RICAP)