百面机器学习(11)强化学习

目录

01 强化学习基础

02 视觉游戏里的强化学习

03 策略梯度

04 探索与利用


涉及动态系统的决策学习过程:强化学习

01 强化学习基础

(1)强化学习中有哪些基本概念?

(2)价值迭代:最优路线

(3)策略迭代:最优路线

 

02 视觉游戏里的强化学习

深度强化学习?与传统强化学习区别?

 

03 策略梯度

策略梯度与Q-learning

 

04 探索与利用

探索与利用?如何平衡?

你可能感兴趣的:(百面机器学习(11)强化学习)