Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm
用一个泛化的强化学习算法掌握国际象棋和日本象棋摘要:国际象棋游戏在人工智能的历史中是最广泛研究的领域。最强的程序都基于复杂的搜索技术,特定领域的自适应和人类专家十几年来完善的手工评估函数的结合。相反,AlphaGoZero程序最近通过从自我对弈的白板状态的强化学习中,获得了在围棋游戏中超出常人的表现。在本文中,我们将这个方法推广到一个AlphaZero算法,它能够在很多有挑战的领域,从白纸状态,获