Latent model and Lantent space

1. Definition and Original

在partial observability的环境中,agent从environment中获取到的observation后,如果需要建模model,首先要处理得到的信息,需要学习observation model,也就是如何从observation中得到与decision相关的state,这个部分是一个高维到低维的映射。接着基于这个observation model进一步学习dynamics model,得到关于environment如何产生transition的过程,并同时学习reward model,得到关于reward的信息。

在上面的描述中,其实可以看出它的核心步骤是如何做从observation到state的mapping,这个也就是latent space model的名称由来,latent space就是表示state space。

参考:11.基于模型的强化学习 - 简书

你可能感兴趣的:(Deep,Learning,深度学习)