图像分类综述 & basic trick summary

     图像分类简介

       图像分类是根据图像的语义信息对不同类别图像进行区分,是计算机视觉的核心,是物体检测、图像分割、物体跟踪、行为分析、人脸识别等其他高层次视觉任务的基础。 图像分类在许多领域都有着广泛的应用按照被提出的时间顺序,涵盖如下卷积神经网络:

  1. LeNet:Yan LeCun等人于1998年第一次将卷积神经网络应用到图像分类任务上,在手写数字识别任务上取得了巨大成功。
  2. AlexNet:Alex Krizhevsky等人在2012年提出了AlexNet, 并应用在大尺寸图片数据集ImageNet上,获得了2012年ImageNet比赛冠军(ImageNet Large Scale Visual Recognition Challenge,ILSVRC)。
  3. VGG:Simonyan和Zisserman于2014年提出了VGG网络结构,是当前最流行的卷积神经网络之一,由于其结构简单、应用性极强而深受广大研究者欢迎。
  4. GoogLeNet:Christian Szegedy等人在2014提出了GoogLeNet,并取得了2014年ImageNet比赛冠军。
  5. ResNet:Kaiming He等人在2015年提出了ResNet,通过引入残差模块加深网络层数,在ImagNet数据集上的错误率降低到3.6%,超越了人眼识别水平。ResNet的设计思想深刻地影响了后来的深度神经网络的设计。

 

 训练过程图像分类综述 & basic trick summary_第1张图片

 模型展示

(一)AlexNet

图像分类综述 & basic trick summary_第2张图片

 (二)VGG&GoogLeNet

图像分类综述 & basic trick summary_第3张图片

 (三)ResNet

图像分类综述 & basic trick summary_第4张图片

 

ResNet演变 

(一)引入1*1卷积

图像分类综述 & basic trick summary_第5张图片

 (二)基于ResNet的模型改进

图像分类综述 & basic trick summary_第6张图片

 可分离卷积图像分类综述 & basic trick summary_第7张图片

分组卷积 图像分类综述 & basic trick summary_第8张图片

 神经网络训练全过程图像分类综述 & basic trick summary_第9张图片

 训练策略对模型的提升图像分类综述 & basic trick summary_第10张图片

  1.  在未过拟合的情况下,增加训练轮数。
  2. 带有动量的优化器使得训练时不容易停留在鞍点。
  3. warmup使模型在开始训练的时候更加稳定。
  4. 有合适的lr前提下,进行weight-decay的调优。
  5. 针对问题进行loss的优化。
  6. 合适的数据增强可以增强模型的泛化能力。
  7. 增加label smoothing & ema等trick。
  8. amp加速训练。(富哥勿扰【手动狗头】)

你可能感兴趣的:(深度学习,分类)