OpenMMLab第一课总结

前面花了太多时间介绍背景应用了,个人感觉没有必有,是很耽误时间又不讨好的工作。从中间开始才算进入正题,那笔记总结也从这时候开始。

首先是讲解的机器学习的基本流程。以分类问题为例,采用机器学习的方法解决实际问题通常分为三个步骤:

  • 训练
    我们需要采集一些数据,标注它们的类别,从中选取一部分用于训练分类器,得到一个可以用于分类的分类器
  • 验证
    从采集、标注的数据中另外选取一部分,测试所得分类器的分类精度
    验证所用的数据不能和训练重合,以保证分类器的泛化性能∶在一部分数据上训练的分类器可以在其余的数据上表现出足够的分类精度
  • 应用
    将经过验证的分类器集成到实际的业务系统中,实现对应的功能在应用阶段,分类器面对的数据都是在训练、验证阶段没有见过的

这里个人理解还有比较重要的要考虑的问题就是拟合问题,拟合分为过拟合和欠拟合,如下图所示。
OpenMMLab第一课总结_第1张图片
为此,我们将训练数据集划分为训练集和验证集,在训练集上训练,周期性在验证集上测试分类精度。当验证集的分类精度达到最值时,停止训练,防止过拟合。这个过程叫早停(Early Stopping),如下图所示
OpenMMLab第一课总结_第2张图片
后面还有讲的相对比较重点的是为什么在图像问题中使用的是CNN这样的网络结构,是因为深度神经网络在处理图片数据时存在问题:

  • 参数量巨大
  • 没有考虑图像本身的二维结构
    而我们知道,卷积神经网络有以下特性:
  • 局部连接:像素局部相关
  • 共享权重:位移不变性
    卷积层输入输出之间的连接仅存在于局部空间,且连接的权重在不同的输出单元之间时共享的。这两个特性可以大量节约参数,有效提取图像特征。

你可能感兴趣的:(深度学习,神经网络)