56. 数据增广 / 图像增广

1. CES上的真实故事

2. 数据增强

  • 增加一个已有数据集,使得有更多的多样性
    • 在语言里加入各种不同的背景噪音
    • 改变图片的颜色和形状

例如,我们可以以不同的方式裁剪图像,使感兴趣的对象出现在不同的位置,减少模型对于对象出现位置的依赖。 我们还可以调整亮度、颜色等因素来降低模型对颜色的敏感度。 可以说,图像增广技术对于AlexNet的成功是必不可少的。

3. 使用增强数据训练

56. 数据增广 / 图像增广_第1张图片
可以把这个看做是正则项,只是作用在训练的时候。

4. 翻转

56. 数据增广 / 图像增广_第2张图片

5. 切割

56. 数据增广 / 图像增广_第3张图片

6. 颜色

7. 几十种其他的方法

8. 总结

  • 数据增广通过变形数据来获取多样性从而使得模型泛化性能更好
  • 常见图片增广包括翻转、切割、变色

9. 一些Q&A

Q1: 理论上,是不是如果原始样本足够多,就不用做增广?

A1:是的,但是实际上不存在这种情况。因为图片多不代表多样性好,所以增广在一定意义上是有用的。

Q2: num_worker的值是不是根据机器GPU性能而设定?

A2: 是的。

Q3: 请问图片增广后需要一张一张确认是否有效吗?

A3: 不用一张张确认,大概看一下就行,就像在jupter notebook上打印一下看看就行

Q4: 多张图片叠加,是不是也是一种有效的增广方式?

A4: 是的,有一种叫mix-up的方式。

Q5: 如何理解多样性增加,但是分布不变?

A5: 可以认为增广不能改变均值但能改变方差,让方差变更大了。

你可能感兴趣的:(深度学习,计算机视觉,深度学习,人工智能)