8/10/2019 PaperReading: Playing Atari with Deep Reinforcement Learning
PlayingAtariwithDeepReinforcementLearningAbstract使用强化学习直接从高维输入中成功学习控制策略。Q-learning的变种进行训练,输入是原始像素,输出是估计未来收益的值函数。应用于AtariLearningEnvironment中的7个游戏,6个优于之前的方法,3个中优于人类专家。Introduction传统RL是十分依赖特征表示的质量。深度学习进