目标检测常用的数据增强方法解析

图像的数据增强

数据增强的方法主要有:

  1. 翻转变换 flip
  2. 随机修剪 random crop
  3. 色彩抖动 color jittering
  4. 平移变换 shift
  5. 尺度变换 scale
  6. 对比度变换 contrast
  7. 噪声扰动 noise
  8. 旋转变换/反射变换 Rotation/reflection 等等

训练模型根据所用框架可使用框架内部函数,TensorFlow中有着一个image模块专门用于处理图片数据的预处理https://blog.csdn.net/LoseInVain/article/details/81774840,torchvision.transforms是pytorch中的图像预处理包https://blog.csdn.net/u014380165/article/details/79167753
在目标检测训练模型时,除了对图像就数据增强外,还需要对bounding box做相应的转换

比较详细的目标检测数据增强,具体可详看此篇文章https://blog.csdn.net/mzpmzk/article/details/100161187

第三方图像增强库实现

库1,https://github.com/aleju/imgaug

库2(推荐使用)https://github.com/albumentations-team/albumentations

库3,https://github.com/mdbloice/Augmentor

空间几何变换(Geometric Distortions)

  • 随机扩展(Random Expand)
  • 随机裁剪(Random Crop)
  • 随机镜像(Random Mirror)

像素内容变换(Photometric Distortions)

  • 随机改变图像亮度(Random Brightness)

  • 随机改变对比度、色度、饱和度(Random Contrast, Hue, Saturation)

  • 随机改变颜色通道(Swap Channels)

  • 随机噪声扰动(Random Lighting Noise)

你可能感兴趣的:(计算机视觉)