【04】深度学习——训练的常见问题 | 过拟合欠拟合应对策略 | 过拟合欠拟合示例 | 正则化 | Dropout方法 | Dropout的代码实现 | 梯度消失和爆炸 | 模型文件的读写

深度学习

  • 1.常见的分类问题
    • 1.1模型架构设计
    • 1.2万能近似定理
    • 1.3宽度or深度
    • 1.4过拟合问题
    • 1.5欠拟合问题
    • 1.6相互关系
  • 2.过拟合欠拟合应对策略
    • 2.1问题的本源
    • 2.2数据集大小的选择
    • 2.3数据增广
    • 2.4使用验证集
    • 2.5模型选择
    • 2.6K折交叉验证
    • 2.7提前终止
  • 3.过拟合欠拟合示例
    • 3.1导入库
    • 3.2数据生成
    • 3.3数据划分
    • 3.4模型定义
    • 3.5辅助函数
    • 3.6可视化
  • 4.正则化
    • 4.1深度学习中的正则化
    • 4.2没有免费午餐定理
    • 4.3L2正则化
      • 4.3.1L2正则化空间解释
    • 4.3L1正则化
      • 4.3L1正则化空间解释
    • 4.4L1和L2正则化异同对比
    • 4.5范数惩罚
    • 4.6权重衰减
  • 5.Dropout方法
    • 5.1工作原理
    • 5.2主要步骤
    • 5.3直观理解Dropout
    • 5.4Dropout在神经网络中的使用
    • 5.5Dropout为什么能减少过拟合
    • 5.5Dropout优缺点
  • 6.Dropout的代码实现
    • 6.1导入必要的库
    • 6.2生成数据
    • 6.3定义模型
    • 6.4训练模型
    • 6.5可视化
  • 7.梯度消失和梯度爆炸
    • 7.1梯度的重要性
    • 7.2反向传播的内在问题
    • 7.3梯度消失
    • 7.4梯度爆炸
    • 7.5解决方法
    • 7.5.1梯度裁剪
    • 7.5.2ReLU激活函数
    • 7.5.3Batch Normalization
    • 7.5.3残差结构
  • 8.模型文件的读写
    • 8.1单个张量的保存和加载
    • 8.2张量列表的保存和加载
    • 8.3张量字典的保存和加载
    • 8.4以多层感知机为例进行模型保存和加载
    • 8.1方式1:保存参数
    • 8.2方式2:保存整个模型
    • 8.3方式3:checkpoint

1.常见的分类问题

  学完了多层感知机,知道什么是前向传播、反向传播,其实就已经在开始窥探深度学习的精髓了。整个深度学习,都是在此基础上发展的,多层感知机更加复杂的版本,并没有离开此区域。
  往后学习 的而原因是,实际的情况千奇百怪,十分复杂,不是简单的多层感知机就能解决好的,因此需要明确要解决的问题是什么。

1.1模型架构设计

  架构设计包含网络深度、神经元个数、层类型、连接方式。
  架构设计(architecture design),指的是在解决特定的实际问题时,选择合适的网络结构。
  节点的数量也就是神经元的数量;网络层数、不同类型的层,到底是使用全连接层还是卷积层、循环层,或者注意力机制等不同类型的层。以及在层与层之间,如何连接。
【04】深度学习——训练的常见问题 | 过拟合欠拟合应对策略 | 过拟合欠拟合示例 | 正则化 | Dropout方法 | Dropout的代码实现 | 梯度消失和爆炸 | 模型文件的读写_第1张图片

1.2万能近似定理

  Universal Approximation Therem(

你可能感兴趣的:(#,深度学习,深度学习,人工智能,目标检测,神经网络,cnn)