学习笔记(08):决胜AI-强化学习实战系列视频课程-DeepQnetwork原理

立即学习:https://edu.csdn.net/course/play/4916/88705?utm_source=blogtoedu

Deep Q-network

 

用4帧表示一个state.

84*84*4 当前state包含这么多像素 x(0-255) 

学习笔记(08):决胜AI-强化学习实战系列视频课程-DeepQnetwork原理_第1张图片

 

做不出这么大的Q-table用来训练。

 

用Q-table做不了,用Network来充当Q-table.

要维护的不再是Q-table, 而是一个network.

 

 

 

你可能感兴趣的:(研发管理,机器学习,深度学习,强化学习,tensorflow,人工智能)