MCTS and Alpha-Beta Search | 搜索算法对比 | 附Alpha Zero论文下载 | 解读技术

懒人阅读:DeepMind认为,MCTS是一种强大的具有领域独立性的搜索算法,可以让可能的搜索误差平均化,当评估一个很大的子树集时,由于倾向于抵消误差而达到一种平衡。相对而言,alpha-beta搜索计算了一个精确的极小极大值,反而向根节点的子树集传播了最大的近似误差


公众号回复:20171211,全文下载了解DeepMind实现AlphaZero的核心方法


MCTS and Alpha-Beta Search | 搜索算法对比 | 附Alpha Zero论文下载 | 解读技术_第1张图片




       关于蒙特卡洛搜索和阿尔法-贝塔搜索的特点对比,我们来听听DeepMind团队的观点。在最近发表的关于AlphaZero的文章《Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm》中,对于MCTS和Alpha-Beta两种搜索算法进行了评价。


MCTS and Alpha-Beta Search | 搜索算法对比 | 附Alpha Zero论文下载 | 解读技术_第2张图片




译文如下

       至少四十余年的时间里,最强大的国际象棋计算机程序使用的是alpha-beta搜索。AlphaZero使用了明显不同的方法,即在子树集内平均化位置的评估,而不是计算其的极小极大值。然而,在国际象棋程序中使用传统的MCTS明显弱于alpha-beta搜索程序,而基于神经网络的alpha-beta程序又无法与更加快速的人工设定评估函数相比。

       AlphaZero使用基于深度神经网络的非线性函数近对位置进行近似评估,而不是像典型国际象棋程序一样使用线性函数。传统方式有更强的表现性,但是也可能引入很大的近似误差。MCTS则让这种误差平均化,当评估一个很大的子树集时,由于倾向于抵消误差而达到一种平衡。相对而言,alpha-beta搜索计算了一个精确的极小极大值,反而向根节点的子树集传播了最大的近似误差。使用MCTS使得AlphaZero将神经网络的表现能力与一个强大的具有领域独立性的搜索算法进行了有效结合。





原文如下


MCTS and Alpha-Beta Search | 搜索算法对比 | 附Alpha Zero论文下载 | 解读技术_第3张图片




善用智能之道:行业动态、技术前沿、产业服务,欢迎关注联系:九三智能控


0?wx_fmt=jpeg

PS:可申请进入微信群交流,不定期分享资料,拓展行业人脉。添加微信:yan_kylin,注明名字+研究领域/专业/学校/公司,或在公众号留言。


你可能感兴趣的:(MCTS and Alpha-Beta Search | 搜索算法对比 | 附Alpha Zero论文下载 | 解读技术)