强化学习算法复现(五):对比Sarsa、Sarsa(λ)与Qlearning_机器人寻宝问题\

强化学习算法复现(五):对比Sarsa、Sarsa(λ)与Qlearning_机器人寻宝问题\_第1张图片
问题描述(使用了openAI_gym的接口):
机器人寻宝,红点为机器人,黑色为陷阱,黄色为宝藏。
强化学习算法复现(五):对比Sarsa、Sarsa(λ)与Qlearning_机器人寻宝问题\_第2张图片

import random
import gym
from gym.utils import seeding


class GridEnv(gym

你可能感兴趣的:(强化学习,强化学习)