深度增强学习(DRL)漫谈 - 从AC(Actor-Critic)到A3C(Asynchronous Advantage Actor-Critic)
原文地址:http://blog.csdn.net/jinzhuojun/article/details/72851548前言之前在文章《深度增强学习(DRL)漫谈-从DQN到AlphaGo》扯了一些关于DRL的内容,但因为是以DQN为主线,其中大部分谈的是value-based方法。我们知道传统增强学习(Reinforcementlearning,RL)中除了value-based方法,还有一大