强化学习(1)基本概念与Q-learning模型的python简单实现

强化学习概念与python实现

  • 1. 强化学习简介
    • 1.1 强化学习的基本特点与优势
      • 1.1.1 特点
      • 1.1.2 优势
    • 1.2 强化学习的基本结构组成
    • 1.3 典型强化学习Q-learning的结构
      • 1.3.1 Q-value定义
      • 1.3.2 Q-table的定义与设置
      • 1.3.3 策略Policy函数和价值Value函数
      • 1.3.4 贝尔曼方程(Bellman function)
      • 1.3.4 Q-learning的流程(伪代码)
  • 2. Python实现
    • 2.1. 任务描述、包引用、参数初始化设置
    • 2.2 Q表初始化函数
    • 2.3. 动作选择函数--随机与贪婪两种叠加
    • 2.4. 环境反馈函数

你可能感兴趣的:(计算机视觉,-,Opencv,强化学习等的,趣味小实验,python,人工智能)