torch DQN算法

强化学习

  • CartPole任务的设计使得代理的输入是4个实际值,表示环境状态(位置,速度等)。然而,神经网络可以纯粹通过观察场景来解决任务, 因此我们将使用以cart为中心的屏幕补丁作为输入。也因为如此,我们的结果与官方排行榜的结果无法直接比较 - 因为我们的任务 要困难得多。而且不幸的是,这确实减慢了训练速度,因为我们必须渲染所有帧。
  • 需要的环境包
    • 神经网络(torch.nn)
    • 优化(torch.optim)
    • 自动分化(torch.autograd)
    • 视觉任务的实用程序(torchvision)- 一个单独的包
  • 构建函数
    • torch DQN算法_第1张图片
# -*- coding:utf-8 -*-
# /usr/bin/python
'''
-------------------------------------------------
   File Name   :  DQN
   Description :  AIM: 强化学习
                  Functions: 1. 
                             2. 
   Envs        :  python == 
                  pip install  -i https://pypi.douban.com/simple 
   Author      :  errol
   Date        :  2020/5/7  08:43
   CodeStyle   :  规

你可能感兴趣的:(歌声合成从入门到实战,深度学习,强化学习)