深度强化学习(DRL)学习笔记(1 - 4章)

文章目录

  • 前言
  • 常用符号
    • 摘自课本
    • 概念、参数出处或者定义(方便理解和查阅)
  • 第一章 概率论基础与蒙特卡洛
    • 概率论基础(具体自己补)
    • 蒙特卡洛
  • 第二章 深度学习基础
    • 线性模型
      • 线性回归
      • 逻辑斯蒂回归
      • Softmax分类器
    • 神经网络
      • 全连接神经网络(多层感知层)
      • 卷积神经网络(CNN)
    • 反向传播和梯度下降
      • 梯度下降
      • 反向传播
  • 第三章 马尔可夫决策过程(MDP)
    • 基本概念(一定要牢记

你可能感兴趣的:(人工智能,人工智能,深度学习)