DL--常用增强学习实验环境 II (ViZDoom, Roboschool, TensorFlow Agents, ELF, Coach等)
原文链接:http://blog.csdn.net/jinzhuojun/article/details/78508203前段时间Nature上发表的升级版AlphaGo-AlphaGoZero再一次成为热点话题。作为其核心技术之一的Deepreinforcementlearning(深度增强学习,或深度强化学习)也再一次引发关注。AlphaZero最有意义的地方之一是它去除了从人类经验(棋谱)中