policy gradient

最近看强化学习的文章,里面涉及到的一个概念就是 policy gradient, 在网上找到的资料,觉得写得非常棒,特意总结于此,以备时时查看。
https://blog.csdn.net/qq_30615903/article/details/80747380
https://www.jianshu.com/p/e9d47bb2dab2?utm_source=oschina-app
https://www.jianshu.com/p/2ccbab48414b

你可能感兴趣的:(Machine,Learning)