【OpenMMLab 实战营打卡 - 第2课】

图像分类与基础视觉模型

什么是图像分类?

从一种图片中识别物体种类。

机器学习的局限:ML算法善于处理低维、分布简单的数据,常规ML算法难以处理图片分类这种复杂数据分布。

卷积神经网络

AlexNet
VGG, GoogleNet
ResNet

更强的图像分类模型

NAS
Vision Transformer
ConvNext

轻量化卷积神经网络

googlenet使用不同大小的卷积核
ResNet使用1×1卷积压缩通道数
可分离卷积

提高泛化性能的方法

权重初始化
学习率退火、预热
自适应梯度算法
正则化与权重衰减
早停

你可能感兴趣的:(cnn)