图像增广

常用图像增广方法,主要有:左右翻转(上下翻转对于许多目标并不常用),随即裁剪,变换颜色(亮度,对比度,饱和度和色调)。以mxnet为框架做实验,各大深度学习框架都有类似功能。
原图:
图像增广_第1张图片
左右翻转,以一半概率实现将图像左右翻转:
图像增广_第2张图片
随即裁剪,为了降低卷积层对目标位置的敏感度,比如猫不一定在图片的正中心,所以通过图像随机裁剪来让物体以不同比例出现在图像不同位置。其有一些超参数需要设置,如裁剪区域的高宽比的范围,裁剪的面积与原面积的比例。
图像增广_第3张图片
变换颜色是为了降低模型对色彩的敏感度,也有一些超参数,如变化颜色的调节范围等。我们可以从四个方面改变图像的颜色:亮度,对比度,饱和度和色调。也可将上述四种方法同时使用
图像增广_第4张图片
通常我们会把多个图像增广方法组合起来一起使用。
图像增广_第5张图片
用原始的数据集进行图像增广时,每一个epoch由于上述的增广方法和超参数不是固定值,所以对原图像处理后得到用于训练的数据集都不同。因此有一定具有缓解过拟合的作用。

你可能感兴趣的:(opencv,计算机视觉,深度学习,python,mxnet)