AI实战营打卡笔记 第二天(图像分类算法基础)

AI实战营打卡笔记 第二天(图像分类算法基础)_第1张图片

什么是图像分类?

就是给图片,识别图片里的东西。

机器学习对于处理图像分类

局限于机器学习算法更易于处理低维度、分布相对简单的数据。

图像数据在几十万维的空间中以复杂的方式"缠绕"在一起常规的机器学习算法难以处理这种复杂数据分布。

深度学习处理图像

AI实战营打卡笔记 第二天(图像分类算法基础)_第2张图片

卷积神经网络

有AlexNet (2012)、GoingDeeper (2012~2014)和VGG (2014)等。

AlexNet (2012)

•在ImageNet 数据集上达到 ~85% 的 top-5 准确率

•5个卷积层,3 个全连接层,共有60M 个可学习参数

•使用ReLU 激活函数,大幅提高收敛速度

•实现并开源了cuda-convnet ,在GPU 上训练大规模神经网络在工程上成为可能

AI实战营打卡笔记 第二天(图像分类算法基础)_第3张图片

GoingDeeper (2012~2014)

AI实战营打卡笔记 第二天(图像分类算法基础)_第4张图片

VGG (2014)

AI实战营打卡笔记 第二天(图像分类算法基础)_第5张图片
AI实战营打卡笔记 第二天(图像分类算法基础)_第6张图片

GoogLeNet(Inception v1, 2014)

AI实战营打卡笔记 第二天(图像分类算法基础)_第7张图片

精度退化问题

模型层数增加到一定程度后,分类正确率不增反降

AI实战营打卡笔记 第二天(图像分类算法基础)_第8张图片

实验的反直觉

AI实战营打卡笔记 第二天(图像分类算法基础)_第9张图片

残差学习的基本思路

AI实战营打卡笔记 第二天(图像分类算法基础)_第10张图片

残差网络ResNet (2015)

AI实战营打卡笔记 第二天(图像分类算法基础)_第11张图片
AI实战营打卡笔记 第二天(图像分类算法基础)_第12张图片

ResNet 中的两种残差模块

AI实战营打卡笔记 第二天(图像分类算法基础)_第13张图片

ResNet 视觉领域影响力最大、使用最广泛的模型结构,获得CVPR 2016 最佳论文奖。

ResNet 是深浅模型的集成

AI实战营打卡笔记 第二天(图像分类算法基础)_第14张图片

残差链接让损失曲面更平滑

AI实战营打卡笔记 第二天(图像分类算法基础)_第15张图片
AI实战营打卡笔记 第二天(图像分类算法基础)_第16张图片

更强的图像分类模型

神经结构搜索Neural Architecture Search (2016+)

基本思路:借助强化学习等方法搜索表现最佳的网络

代表工作:NASNet (2017)、MnasNet(2018)、EfficientNet (2019)、RegNet (2020) 等

AI实战营打卡笔记 第二天(图像分类算法基础)_第17张图片

VisionTransformers (2020+)

使用Transformer 替代卷积网络实现图像分类,使用更大的数据集训练,达到超越卷积网络的精度

代表工作:Vision Transformer (2020),Swin-Transformer(2021ICCV 最佳论文)

AI实战营打卡笔记 第二天(图像分类算法基础)_第18张图片

ConvNeXt (2022)

将 Swin Transformer 的模型元素迁移到卷积网络中,性能反超Transformer

AI实战营打卡笔记 第二天(图像分类算法基础)_第19张图片
AI实战营打卡笔记 第二天(图像分类算法基础)_第20张图片

轻量化卷积神经网络

卷积的参数量

AI实战营打卡笔记 第二天(图像分类算法基础)_第21张图片

卷积的计算量(乘加次数)

AI实战营打卡笔记 第二天(图像分类算法基础)_第22张图片

降低模型参数量和计算量的方法

AI实战营打卡笔记 第二天(图像分类算法基础)_第23张图片

GoogLeNet 使用不同大小的卷积核

AI实战营打卡笔记 第二天(图像分类算法基础)_第24张图片

ResNet 使用1×1卷积压缩通道数

AI实战营打卡笔记 第二天(图像分类算法基础)_第25张图片

可分离卷积

AI实战营打卡笔记 第二天(图像分类算法基础)_第26张图片

MobileNetV1/V2/V3 (2017~2019)

AI实战营打卡笔记 第二天(图像分类算法基础)_第27张图片

ResNeXt 中的分组卷积

AI实战营打卡笔记 第二天(图像分类算法基础)_第28张图片

Vision Transformers

注意力机制Attention Mechanism

AI实战营打卡笔记 第二天(图像分类算法基础)_第29张图片
AI实战营打卡笔记 第二天(图像分类算法基础)_第30张图片

实现 Attention

AI实战营打卡笔记 第二天(图像分类算法基础)_第31张图片

多头注意力Multi-head (Self-)Attention

AI实战营打卡笔记 第二天(图像分类算法基础)_第32张图片

1D 数据上的 Attention

AI实战营打卡笔记 第二天(图像分类算法基础)_第33张图片

•将图像切分成若干16×16 的小块,当作一列"词向量",经多层Transformer Encoder 变换产生特征

•图块之外加入额外的token,用于 query 其他 patch 的特征并给出最后分类

•注意力模块基于全局感受野,复杂度为尺寸的4 次方

AI实战营打卡笔记 第二天(图像分类算法基础)_第34张图片

SwinTransformer (ICCV 2021 best paper)

AI实战营打卡笔记 第二天(图像分类算法基础)_第35张图片

•由于将Multi-Head Self-Attention 计算限制在窗口内,窗口与窗口之间无法进行信息传递。所以, Swin

Transformer 又提出了 Shifted Windows Multi-Head Self-Attention(SW-MSA)的概念,即第 ᵅ9 + 1 层的窗

口分别向右侧和下方各偏移了半个窗口的位置。那么,这就让信息能够跨窗口传递。

AI实战营打卡笔记 第二天(图像分类算法基础)_第36张图片
AI实战营打卡笔记 第二天(图像分类算法基础)_第37张图片

模型学习

模型学习的范式

AI实战营打卡笔记 第二天(图像分类算法基础)_第38张图片
AI实战营打卡笔记 第二天(图像分类算法基础)_第39张图片

监督学习

流程

AI实战营打卡笔记 第二天(图像分类算法基础)_第40张图片

交叉熵损失Cross-Entropy Loss

AI实战营打卡笔记 第二天(图像分类算法基础)_第41张图片

优化目标 & 随机梯度下降

AI实战营打卡笔记 第二天(图像分类算法基础)_第42张图片

动量Momentum SGD

AI实战营打卡笔记 第二天(图像分类算法基础)_第43张图片

基于梯度下降训练神经网络的整体流程

AI实战营打卡笔记 第二天(图像分类算法基础)_第44张图片

训练技巧的重要性

AI实战营打卡笔记 第二天(图像分类算法基础)_第45张图片

学习率与优化器策略

权重初始化

AI实战营打卡笔记 第二天(图像分类算法基础)_第46张图片

学习率对训练的影响

AI实战营打卡笔记 第二天(图像分类算法基础)_第47张图片

学习率策略:学习率退火 Annealing

AI实战营打卡笔记 第二天(图像分类算法基础)_第48张图片

学习率策略:学习率升温 Warmup

AI实战营打卡笔记 第二天(图像分类算法基础)_第49张图片

LinearScaling Rule

AI实战营打卡笔记 第二天(图像分类算法基础)_第50张图片

自适应梯度算法

AI实战营打卡笔记 第二天(图像分类算法基础)_第51张图片

正则化与权重衰减Weight Decay

AI实战营打卡笔记 第二天(图像分类算法基础)_第52张图片

早停 Early Stopping

AI实战营打卡笔记 第二天(图像分类算法基础)_第53张图片

模型权重平均 EMA

AI实战营打卡笔记 第二天(图像分类算法基础)_第54张图片

模型权重平均Stochastic Weight Averaging

AI实战营打卡笔记 第二天(图像分类算法基础)_第55张图片

数据增强

数据增强 Data Augmentation介绍

AI实战营打卡笔记 第二天(图像分类算法基础)_第56张图片

组合数据增强AutoAugment & RandAugment

AI实战营打卡笔记 第二天(图像分类算法基础)_第57张图片

组合图像Mixup & CutMix

AI实战营打卡笔记 第二天(图像分类算法基础)_第58张图片

标签平滑Label Smoothing

AI实战营打卡笔记 第二天(图像分类算法基础)_第59张图片

模型相关策略

丢弃层 Dropout

神经网络在训练时会出现共适应现象 (co-adaption),神经元之间产生高度关联,导致过拟合训练时随机丢弃一些连接,破坏神经元之间的关联,鼓励学习独立的特征

推理时使用全部连接

常用于全连接层,通常不与 BN 混用

AI实战营打卡笔记 第二天(图像分类算法基础)_第60张图片

随机深度Stochastic Depth

AI实战营打卡笔记 第二天(图像分类算法基础)_第61张图片

自监督学习

自监督学习的常见类型

AI实战营打卡笔记 第二天(图像分类算法基础)_第62张图片

Relative Location (ICCV 2015)

AI实战营打卡笔记 第二天(图像分类算法基础)_第63张图片

SimCLR(ICML 2020)

AI实战营打卡笔记 第二天(图像分类算法基础)_第64张图片

Maskedautoencoders (MAE, CVPR 2022)

总结

AI实战营打卡笔记 第二天(图像分类算法基础)_第65张图片

哇擦太牛逼了这个教程我吹爆!!!!!!!!

你可能感兴趣的:(人工智能)