强化学习-学习笔记11 | 解决高估问题

在实际应用中DQN会引起高估,进而影响动作的正确选择。本文介绍的高估问题解决办法为:Target Network & Double DQN.

你可能感兴趣的:(强化学习-学习笔记11 | 解决高估问题)