【机器学习】《动手学深度学习 PyTorch版》李沐深度学习笔记(图像增广)

一、图像增广

1.通过对训练图像做一系列随机改变,来产生相似但又不同的训练样本,从而扩大训练数据集的规模。
2.随机改变训练样本可以降低模型对某些属性的依赖,从而提高模型的范化能力

二、常用的图像增广方法

1. 翻转和裁减
1.左右翻转图像通常不会改变对象的类别。这是最早和最广泛使用的图像增广方法之一。
2.上下翻转图像不如左右图像翻转那样常用。但是,至少对于这个示例图像,上下翻转不会妨碍识别。
3.随机裁减在我们使用的示例图像中,猫位于图像的中间,但并非所有图像都是这样。 池化层可以降低卷积层对目标位置的敏感性。 另外,我们可以通过对图像进行随机裁剪,使物体以不同的比例出现在图像的不同位置。 这也可以降低模型对目标位置的敏感性。
2. 颜色改变
另一种增广方法是改变颜色。我们可以改变图像颜色的四个方面:
1.亮度
2.对比度
3.饱和度
4.色调
3.结果对比
【机器学习】《动手学深度学习 PyTorch版》李沐深度学习笔记(图像增广)_第1张图片
1.使用图像增强,尽管只是简单的左右翻转,我们模型的预测精度还是提高了3%
2.模型过拟合有一定的缓解。

三、总结

1.图像增广基于现有的训练数据生成随机图像,来提高模型的范化能力。
2.为了在预测过程中得到确切的结果,我们通常对训练样本只进行图像增广,而在预测过程中不使用随机操作的图像增广。(训练有,预测无)
3.深度学习框架提供了许多不同的图像增广方法,这些方法可以被同时应用。(多种增强共同使用)
图像增广方法:
1.翻转
2.裁剪
3.过滤和锐化
4.模糊
5.旋转,平移,剪切,缩放
6.色彩
7.亮度
8.均匀和高斯噪声

你可能感兴趣的:(深度学习,人工智能)