2021-06-25 RL 算法总结

RL 算法总结

  • 常用算法介绍
    • 离散的动作空间 discrete action space的算法
      • 常用网络
        • 估计Q值期望
        • 估计Q值分布
    • 过渡:从离散到连续动作空间的跨越
    • 连续的动作空间 continuous action space
      • 确定策略
      • 随机策略
    • 混合的动作空间 hybrid action space
    • 调参
    • 算法比较

常用算法介绍

离散的动作空间 discrete action space的算法

动作是离散的,一般是判断简单的操作,怎么操作能使得分更高。

常用网络

估计Q值期望

  • DQN(Deep Q Network)Q网络代替Q表&#

你可能感兴趣的:(笔记,Robotik)