图像分类与 MMClassification

  • 机器学习

  • 步骤

  • 收集数据

  • 定义模型

  • 训练

  • 预测

  • 机器学习的局限:机器学习算法善于处理低维、分布相对简单的数据

  • 卷积神经网络

  • 常用网络

  • AlexNet(2012)

  • VGG(2015 ICLR)https://arxiv.org/abs/1409.1556

  • 创新点

  • 采用连续的几个3×3卷积核代替AlexNet中较大的卷积核。对于给定的感受野,采用堆积的小卷积核。(多层非线性层可以通过增加网络深度来保证更复杂的模式,且代价更小)

  • 使用3个3x3卷积核来代替7x7卷积核,使用2个3x3卷积核来代替5*5卷积核。(在保证具有相同感受野的条件下,提升了网络的深度,使用更少的参数,是模型具有更强的表达能力)

  • 优点

  • 结构简洁

  • 小滤波卷积层效果更好

  • 验证了通过不断加深网络结构可以提升模型性能

  • 缺点:耗费计算资源

  • GoogleNet(2014)

  • 使用Inception模块堆叠形成

  • 仅使用单层全连接层进行最后分类,可节省大量参数

  • 轻量

  • ResNet(2015,2016CVPR最佳论文奖)https://arxiv.org/abs/1512.03385

  • 深度网络的退化问题(Degradation problem):随着网络的加深,准确度出现饱和,甚至下降。(深层网络中存在梯度消失/爆炸问题,可通过BN层来缓解)

  • 残差学习(identity mapping)

  • 让新增加的层拟合浅层网络与深层网络之间的差异,更容易学习

  • 梯度可以直接回传到浅层网络监督浅层网络的学习

  • 没有引入额外参数,让参数更有效贡献到最终的模型中

你可能感兴趣的:(分类,深度学习)