【图像增广】

图像增广

使用的数据太少,会造成过拟合

使用的数据太多,需要大量收集数据

数据增多(图像增广)

在计算机视觉中,通常会对图像做一些随机的变化,产生相似但又不完全相同的样本。

主要作用

扩大训练数据集,抑制过拟合,提升模型的泛化能力。

常用方法

  1. 随机改变亮暗、对比度和颜色等

  2. 随机填充

  3. 随机裁剪

  4. 随机缩放

  5. 随即翻转

随机改变亮度、对比度、颜色

【图像增广】_第1张图片

随机在图像外围进行填充

【图像增广】_第2张图片

随机裁剪

防止裁剪将目标物体裁没,所以要计算新裁剪的和原来的框之间的iou是不是太小了,如果裁剪出来的和之前的真实框iou都很小的话,说明裁剪出来的图片物体都不在了,需要重新裁剪一次。

(计算裁剪之后的真实框,如果裁的太偏了,则重新裁一次,直到裁剪出合适的新图片)

随机缩放

【图像增广】_第3张图片

随即翻转

【图像增广】_第4张图片

随机打乱真实框顺序

【图像增广】_第5张图片

数据预处理

图像增广

【图像增广】_第6张图片

批量读取和多线程加速

批量读取

获取图像尺寸,同一批次内的样本尺寸一致

【图像增广】_第7张图片

将list形式的batch数据转化成多个array构成的tuple

【图像增广】_第8张图片

把batch的形式转换成np.array的形式

多线程加速

使用paddle.reader.xmap_readers 实现多线程加速

【图像增广】_第9张图片

数据预处理的流程

  1. 查看数据集中的数据

  2. 提取数据标注信息

  3. 从文件读取图像和标注数据

  4. 图像增广(数据增多)

  5. 批量读取

  6. 多线程加速

你可能感兴趣的:(飞桨,机器学习)