【组会论文记录】2021/3/31(episodic control RL)

  • 本系列文章意在记录组会上同学分享文章的idea,大部分我没有仔细读过,仅供参考
  • 本周三篇文章
    1. 《Model-Free Episodic Control》
    2. 《Episodic Memory Deep Q-Networks》
    3. 《Episodic Reinforcement Learning with Associative Memory》
  • 这几篇都是有关强化学习中 episodic control 的内容,利用非参数化的memory来保存一些好的经验进行学习,可以有效解决强化学习中价值传递太慢的问题。其实听这个报告前两天我自己也想到了很类似的方法,所以挺感慨的,好的idea果然都被做过了。
  • 因为毕设马上要中期答辩,又是RL相关的文章,和我研究方向一致,以后仔细读读再来更新。

你可能感兴趣的:(#,组会论文记录)