计算机视觉与深度学习课程记录

**

课程出自 北邮的 鲁鹏老师 ,本文章用于个人记录课程,以便复习,不做其它用途。

**

计算机视觉与深度学习课程记录

  • 1. 图像分类 与 线性分类器
    • 1.1 线性分类器
    • 1.2 损失函数
    • 1.3 参数优化
    • 1.4 数据集
  • 2. 全连接神经网络
    • 2.1 多层感知器
    • 2.2 激活函数
    • 2.3 损失函数
    • 2.4 优化算法
    • 2.5 训练过程
  • 3. 卷积神经网络
    • 3.1 卷积层
    • 3.2 卷积步长
    • 3.3 边界填充
    • 3.4 池化
    • 3.5 损失函数&优化算法
  • 4.经典网络解释
    • 4.1 AlexNet
    • 4.2 ZFNet
    • 4.3 VGG
    • 4.4 GoogLeNet
    • 4.4 ResNet
  • 5.视觉识别任务
    • 5.1 分类
    • 5.2 语义分割
    • 5.3 目标检测
    • 5.4 实例分割
  • 6.可视化
  • 7.生成网络
    • 7.1 PixelRNN and PixelCNN
    • 7.2 Variational Autoencoders(VAE)
    • 7.3 Generative Adversarial Networks(GAN)

1. 图像分类 与 线性分类器

计算机视觉与深度学习课程记录_第1张图片
图像表示:
像素表示、全局特征表示(如GIST),
局部特征表示(如SIFT特征+词袋模型)

分类器:
近邻分类器、贝叶斯分类器、线性分类器、支撑向量机分类器、神经网络分类器、随机森林、Adaboost

损失函数:
0-1损失、多类支撑向量机损失、交叉熵损失、L1损失、L2损失

优化算法:
<一阶方法>:梯度下降、随机梯度下降、小批量随机梯度下降
<二阶方法>:牛顿法、BFGS、L-BFGS

计算机视觉与深度学习课程记录_第2张图片

评价指标:
正确率(accuracy)=分对的样本数 / 全部样本数
错误率(error rate)=1-正确率

计算机视觉与深度学习课程记录_第3张图片

图像类型:
Binary (二进制图像) Gray Scale(灰度图像) Color(彩色图像)

1.1 线性分类器

线性分类器体验 http://vision.stanford.edu/teaching/cs231n-demos/linear-classify/
在这里插入图片描述

计算机视觉与深度学习课程记录_第4张图片
计算机视觉与深度学习课程记录_第5张图片

1.2 损失函数

计算机视觉与深度学习课程记录_第6张图片

计算机视觉与深度学习课程记录_第7张图片

计算机视觉与深度学习课程记录_第8张图片

计算机视觉与深度学习课程记录_第9张图片

1.3 参数优化

计算机视觉与深度学习课程记录_第10张图片

梯度计算:数值化、解释法

计算机视觉与深度学习课程记录_第11张图片
计算机视觉与深度学习课程记录_第12张图片

1.4 数据集

计算机视觉与深度学习课程记录_第13张图片
计算机视觉与深度学习课程记录_第14张图片

在这里插入图片描述

计算机视觉与深度学习课程记录_第15张图片
计算机视觉与深度学习课程记录_第16张图片

2. 全连接神经网络

2.1 多层感知器

  • 全连接神经网络极联多个变换来实现输入到输出的隐射。

计算机视觉与深度学习课程记录_第17张图片

计算机视觉与深度学习课程记录_第18张图片
计算机视觉与深度学习课程记录_第19张图片

2.2 激活函数

计算机视觉与深度学习课程记录_第20张图片
计算机视觉与深度学习课程记录_第21张图片

2.3 损失函数

计算机视觉与深度学习课程记录_第22张图片
计算机视觉与深度学习课程记录_第23张图片
计算机视觉与深度学习课程记录_第24张图片
在这里插入图片描述
计算机视觉与深度学习课程记录_第25张图片

2.4 优化算法

在这里插入图片描述
计算机视觉与深度学习课程记录_第26张图片
计算机视觉与深度学习课程记录_第27张图片

2.5 训练过程

在这里插入图片描述
计算机视觉与深度学习课程记录_第28张图片
计算机视觉与深度学习课程记录_第29张图片
计算机视觉与深度学习课程记录_第30张图片

3. 卷积神经网络

计算机视觉与深度学习课程记录_第31张图片

3.1 卷积层

计算机视觉与深度学习课程记录_第32张图片

3.2 卷积步长

计算机视觉与深度学习课程记录_第33张图片

3.3 边界填充

计算机视觉与深度学习课程记录_第34张图片

3.4 池化

计算机视觉与深度学习课程记录_第35张图片

3.5 损失函数&优化算法

计算机视觉与深度学习课程记录_第36张图片

4.经典网络解释

计算机视觉与深度学习课程记录_第37张图片
计算机视觉与深度学习课程记录_第38张图片

4.1 AlexNet

计算机视觉与深度学习课程记录_第39张图片

计算机视觉与深度学习课程记录_第40张图片
计算机视觉与深度学习课程记录_第41张图片

4.2 ZFNet

计算机视觉与深度学习课程记录_第42张图片

4.3 VGG

计算机视觉与深度学习课程记录_第43张图片
计算机视觉与深度学习课程记录_第44张图片

4.4 GoogLeNet

计算机视觉与深度学习课程记录_第45张图片
计算机视觉与深度学习课程记录_第46张图片
计算机视觉与深度学习课程记录_第47张图片

4.4 ResNet

在这里插入图片描述
计算机视觉与深度学习课程记录_第48张图片
计算机视觉与深度学习课程记录_第49张图片
残差模块:(1)解决正向信息流的传递(2)解决反向梯度流的传递
(3)命名残差是因为该模块实际上是输入和输出的差异
在这里插入图片描述
计算机视觉与深度学习课程记录_第50张图片
计算机视觉与深度学习课程记录_第51张图片
计算机视觉与深度学习课程记录_第52张图片

5.视觉识别任务

计算机视觉与深度学习课程记录_第53张图片

5.1 分类

5.2 语义分割

5.3 目标检测

两阶段目标检测器
计算机视觉与深度学习课程记录_第54张图片
一阶段目标检测器
计算机视觉与深度学习课程记录_第55张图片

计算机视觉与深度学习课程记录_第56张图片

5.4 实例分割

计算机视觉与深度学习课程记录_第57张图片

6.可视化

计算机视觉与深度学习课程记录_第58张图片

7.生成网络

计算机视觉与深度学习课程记录_第59张图片
计算机视觉与深度学习课程记录_第60张图片

7.1 PixelRNN and PixelCNN

计算机视觉与深度学习课程记录_第61张图片

7.2 Variational Autoencoders(VAE)

7.3 Generative Adversarial Networks(GAN)

计算机视觉与深度学习课程记录_第62张图片
计算机视觉与深度学习课程记录_第63张图片

你可能感兴趣的:(深度学习基础,深度学习,计算机视觉,机器学习)