强化学习-学习笔记5 | AlphaGo

从强化学习的角度理解一下AlphaGo的实现思路,机器是如何在围棋这样高复杂度的情境下战胜人类的。通过这个实例加深对价值网络和策略网络的理解,并熟悉一下蒙特卡洛树搜索方法 MCTS。

你可能感兴趣的:(强化学习-学习笔记5 | AlphaGo)