第一篇:强化学习基本原理通俗介绍

第一篇:强化学习基本原理通俗介绍_第1张图片
第一篇:强化学习基本原理通俗介绍_第2张图片
第一篇:强化学习基本原理通俗介绍_第3张图片
简单来说,你走对了,我奖励你;走到障碍物那里,我惩罚你;找到出口我大大的奖励你,这就是一个简单明了的奖励机制。

你可能感兴趣的:(强化学习)