CNN笔记(1)---数据扩充与数据预处理

1.Data Augmentation

1.1 简单的数据扩充

图像水平翻转
随机扣取
尺度变换和旋转
色彩抖动:在RGB颜色空间对原有RGB色彩分布进行轻微扰动
          也可以在HSV空间随机改变图像原有的饱和度和明度
          (改变S和V通道的值)
          或对色调进行微调(小范围改变H的值)

1.2 特殊的数据扩充方式

1.2.1 Fancy PCA

  • 对所有训练数据的R,G,B像素值进行PCA,得到对应特征向量 pi p i 和特征值 λi(i=1,2,3) λ i ( i = 1 , 2 , 3 )
  • 根据特征向量和特征值计算一组随机值 [p1,p2,p3],[α1λ1,α2λ2,α3λ3]T [ p 1 , p 2 , p 3 ] , [ α 1 λ 1 , α 2 λ 2 , α 3 λ 3 ] T
  • 将其作为扰动加到原像素值,其中 αi α i 为取自以0为均值,标准差为0.1的高斯分布的随机值
  • 每经过一轮训练(1个epoch), αi α i 重新随机选取,重复上述操作进行扰动

5.2.2 监督式数据扩充

适用于高层语义图像分类任务

  • 先训练一个初始分类模型
  • 生成对应特征图/热力图:指示图像区域与场景标记间的相关概率。
  • 可根据此概率映射回原图选择较强相关的图像区域进行图像扣取

6.数据预处理

中心式归一化(mean normalization)

CNN 中,计算训练集图像像素均值,在处理训练集,验证集和测试集图像时分别减去该均值。

原理:默认自然图像是一类平稳的数据分布,每个样本上减去数据的统计平均值(逐样本计算),移除共同部分

参考文献:解析卷积神经网络—深度学习实践手册

你可能感兴趣的:(笔记-算法)