2020-02-24 强化学习

1.马尔可夫决策过程

2.免模型的强化学习model free

a.Monte carlo「First visit」,「Ever visit」

b.TD-learning

C.Q-learning 

D.Sarsa

E.DQN algorithm

2020-02-24 强化学习_第1张图片

你可能感兴趣的:(2020-02-24 强化学习)