[增强学习][Reinforcement Learning]学习笔记与回顾-2-马尔可夫决策过程MDP
MarkovDecisionProcesses前言本文主要是视频学习的总结与回顾,想要了解更多内容请看视频或者学习专业课程。这一节主要是说马尔可夫决策过程-MarkovDecisionProcesses,也成MDP。在了解MDP之前,如果大家了解过马尔可夫链(markovchain),或者机器学习中的隐马尔可夫过程,那么对于马尔可夫性就会有一定了解,即无后效性。IntroductiontoMDPs