人工智能应用案例学习1

      为了更深入了解人工智能领域知识,开启相关案例学习,就从AlphaGo开始。

      AlphaGo(“Go”为日文“碁”字发音转写,是围棋的西方名称),直译为阿尔法围棋,是于2014年开始由英国伦敦Google DeepMind开发的人工智能围棋软件,并有对应的电影纪录片《AlphaGo世纪对决》。专业术语上来说,AlphaGo的做法是使用了蒙特卡洛树搜索与两个深度神经网络相结合的方法,其中一个是以估值网络来评估大量的选点,而以走棋网络来选择落子。在这种设计下,电脑可以结合树状图的长远推断,又可像人类的大脑一样自发学习进行直觉训练,以提高下棋实力。

      在AlphaGo出现之前,机器程序在与人类围棋对战中处于明显劣势:在1997年IBM的电脑“深蓝”击败俄籍世界国际象棋冠军加里·卡斯帕罗夫之后,经过18年的发展,棋力最高的人工智能围棋程序才大约达到业余5段围棋棋手的水准,且在不让子的情况下,仍无法击败职业棋手。2012年,在4台PC上运行的Zen程序在让5子和让4子的情况下两次击败日籍九段棋手武宫正树。2013年,Crazy Stone在让4子的情况下击败日籍九段棋手石田芳夫,这样偶尔出现的战果就已经是难得的结果了。

      在AlphaGo出现之后,从下面4个实例可看出AlphaGo战胜李世石之后类似下棋机器程序在与人对弈中都占据绝对胜算。

      1)Facebook也在开发一套围棋程序,名为Darkforest。这套程序也是基于机器学习和树搜索。在2016年3月举办的第9届UEC杯世界电脑围棋大会中获得亚军。尽管该程序在其他围棋程序面前表现强劲,但截至2016年年初,它尚未击败任何职业棋手。

      2)DeepZenGo是日本程序员尾岛阳儿、加藤英树等开发的围棋程序,是在旧版本的Zen围棋软件基础上加入了深度学习技术后开发的新版本,由日本DWANGO公司、东京大学、日本棋院提供支持,其基本原理和AlphaGo类似。在第二届围棋电王战中分先以1:2不敌赵治勋九段。在2017年3月18-19日在日本举办的第10届UEC杯世界电脑围棋大会上获得亚军。在2017年3月21-23日的世界最强棋手决定战上以一胜二负的成绩名列第三名。在2017年3月26日的第5届电圣战上分先战胜了日本的一力辽七段。目前在KGS、弈城、腾讯野狐等网络围棋对弈平台上公测。

      3)绝艺(英文名Fine Art)是中国腾讯公司的AI Lab(腾讯人工智能实验室)开发的围棋人工智能。在2017年3月18-19日的第10届UEC杯世界电脑围棋大会上夺得冠军,并在2017年3月26日的第5届电圣战上分先战胜了日本的一力辽七段。目前在腾讯野狐围棋网络对弈平台上公测。

      4)CGI是由国立交通大学CGI(Computer Games and Intelligence)实验室所开发的围棋人工智能。在2017首届世界智能围棋公开赛8月16日于蒙古鄂尔多斯开战,击败绝艺与DeepZenGo,初赛全胜;17日总决赛中夺得亚军。

      为了搞清楚为何AlphaGo是如何取得如此成绩,需要深入探寻所使用技术方法,得到下面程序算法定义:AlphaGo使用蒙特卡洛树搜索(Monte Carlo tree search),借助估值网络(value network)与走棋网络(policy network)这两种深度神经网络,通过估值网络来评估大量选点,并通过走棋网络选择落点。由于围棋无法仅通过寻找最佳棋步来解决,因为一盘游戏平均约有150步,每一步平均约有200种可选的下法,这意味着有太多需要解决的可能性。AlphaGo最初通过模仿人类玩家,尝试匹配职业棋手的过往棋局,其数据库中约含3000万步棋着,后来达到了一定的熟练程度,开始和自己对弈大量棋局,使用强化学习进一步改善策略。

   

你可能感兴趣的:(人工智能应用案例学习1)