17.深度学习之计算机视觉-1

17.1 图像增广

  • 图像增广(image augmentation)技术通过对训练图像做一系列随机改变,来产生相似但又不同的训练样本,从而扩大训练数据集的规模。
  • 图像增广的另一种解释是,随机改变训练样本可以降低模型对某些属性的依赖,从而提高模型的泛化能力。
    • 例如,可以对图像进行不同方式的裁剪,使感兴趣的物体出现在不同位置,从而减轻模型对物体出现位置的依赖性。也可以调整亮度、色彩等因素来降低模型对色彩的敏感度。

17.1.1 挑战:照射角度

17.1.2 挑战:光照强度

17.1.3 挑战:形状改变

17.1.4 挑战:部分遮蔽

17.1.5 挑战:背景混入

17.1.6 翻转和裁剪

  • 左右翻转图像通常不改变物体的类别。


  • 上下翻转不如左右翻转通用。



17.1.7 变化颜色:亮度

  • 可以从4个方面改变图像的颜色:亮度(brightness)、对比度(contrast)、饱和度(saturation)和色调(hue)。


17.1.7.1 变化颜色:色调

17.1.7.2 变化颜色:对比度

  • 也可以同时设置如何随机变化图像的亮度(brightness)、对比度(contrast)、饱和度(saturation)和色调(hue)。


17.1.8 叠加多个图像增广方法

  • 实际应用中会将多个图像增广方法叠加使用。


17.2 微调

17.2.1 什么是微调(fine-tune)

  • 微调(fine-tune),顾名思义指稍微调整参数即可得到优秀的性能,是迁移学习的一种实现方式。
    • 微调和从头训练(train from scratch)的本质区别在于模型参数的初始化,train from scratch通常指对网络各类参数进行随机初始化(当然随机初始化也存在一定技巧),随机初始化模型通常不具有任何预测能力,通常需要大量的数据或者特定域的数据进行从零开始的训练,这样需要训练到优秀的模型通常是稍困难的。
  • 而微调的网络,网络各类参数已经在其他数据集(例如ImageNet数据集)完成较好调整的,具备了较优秀的表达能力。
    • 因此,只需要以较小的学习速率在自己所需的数据集领域进行学习即可得到较为优秀的模型。
  • 微调通常情况下,无须再重新设计网络结构,预训练模型提供了优秀的结构,只需稍微修改部分层即可。
    • 在小数据集上,通常微调的效果比从头训练要好很多,原因在于数据量较小的前提下,训练更多参数容易导致过度拟合。
  • 迁移学习中的一种常用技术:微调(fine tuning)


17.2.2 迁移学习

大数据视频推荐:
腾讯课堂
CSDN
大数据语音推荐:
企业级大数据技术应用
大数据机器学习案例之推荐系统
自然语言处理
大数据基础
人工智能:深度学习入门到精通

你可能感兴趣的:(17.深度学习之计算机视觉-1)