本文来自AI新媒体量子位（QbitAI）

19岁的柯洁输了。

围棋人机大战2.0版的第一场，双方交锋至第286手棋，执黑的柯洁以约四分之一子的微弱劣势，败给围棋人工智能程序AlphaGo。

全程记录

10:30，柯洁和代为AlphaGo落子的黄士杰博士落座。

10:31，两位选手猜先，柯洁执黑先行。

随后，柯洁在右上角落下第一子，耗时13秒。

AlphaGo在右下角落下第一子，耗时45秒。

柯洁的第一步也被解读为尊重对手。柯洁第二步下出“三三”。这是AlphaGo的常用下法。随后双方开始你来我往。总体而言，AlphaGo落子速度比柯洁明显要快。

第21手，柯洁提掉白棋一子。而AlphaGo第30手，则让柯洁眉头一紧。此时，现场讲评的华以刚和徐莹表示，这盘棋场面好看，而且有不少没见过的下法出现。

比赛中，柯洁有时会突然发笑，有时也会默默摇头。

AlphaGo落下第50手，此时从盘面看，白棋暂时领先18.5目（仅供参考）。而这个时候，柯洁的思考时间已经比AlphaGo多用了将近40分钟。

第54手，白棋下出一个断。现场讲解的华以刚表示，AlphaGo下棋的效率令人心烦，并认为这将是这盘棋的焦点之一。而柯洁也再次皱起眉头，小长考了很久。

柯洁用时一个小时后，常昊、张璇夫妇代替华以刚、徐莹在现场上台讲解。常昊、张璇上台之后，也再次讲解第54手的断，认为是一个出乎意料的“后中先”。

在国内棋手中，柯洁以下棋速度快著称。而今天柯洁用时约80分钟思考后，AlphaGo才用时约20分钟。双方的差距正在越拉越大。

97手！柯洁下出天马行空的一招。创新工场人工智能工程院副院长王咏刚评价说：“这分明就是两个AI在下棋！讲输赢仍然悲观，但柯洁在人类里足以封神！”

柯洁用时还剩1小时07分的时候，现场讲解的常昊和张璇判断战斗可能要进入官子阶段，而整个盘面柯洁比较辛苦。此时AlphaGo用时还剩2小时20分，大约领先14.5目（仅供参考）。

148手的出现，让观战的网友一阵惊呼，纷纷大呼不理解。

随着比赛的进行，柯洁的表情逐渐严峻了起来。或者用手撑在面部，或者抓住自己的头发，或者悄悄的摇摇头。与此同时，柯洁的耗时逐渐流逝。

柯洁时间还剩大约半个小时的时候，AlphaGo还有两个小时。行至第173手，明显双方都已经进入官子阶段。从盘面上看，如果AlphaGo不出错的话，黑棋的局势要差一点。

“这时可能要靠电力局的同志们了”，有网友笑侃。

在收官阶段，柯洁和AlphaGo相互步步紧逼，屡屡祭出强硬下法。下午2点06分，柯洁又开始一个小长考。

现场讲解的徐莹表示，收官阶段非常重要，她举例说以前的李昌镐经常依靠官子阶段的发挥，半目逆转局面。

192手之后，盘面上似乎已经没有重要的官子了。AlphaGo已经能够“心态平和”的落子了，华以刚表示这说明AI已经对盘面有了相当的自信。

华以刚判断，结果马上出来了。此时，柯洁还剩不到18分钟。

此时徐莹粗略点出白棋目数为：65+8，而华以刚点完黑棋的目数，判断黑棋贴不出7.5目。柯洁应该输棋无疑。

第247手，尽管柯洁落子有点犹豫，但他心里早已明白一切。

在最后细小的收官阶段，柯洁下棋如飞，而AlphaGo在看似不用想的时候，反而落子仍然非常谨慎。

单官阶段，柯洁一直坚持走完，没有轻易认输。

哈萨比斯：这不是人机大战

首日比赛之前，现场还举行了一个简短的开幕式。桐乡市委书记，国家体育总局棋牌中心主任、Alphabet执行董事长施密特、DeepMind创始人兼CEO哈萨比斯等先后致辞。

以下是量子位整理节选的部分发言。

△ 施密特

施密特：

非常高兴回到中国，中国对我来说意义非凡。这是一个珍贵的机会，可以打造一个更美的世界。去年我在韩国就说，不管胜负如何，人性终将获胜。电脑有自己擅长的事情，人类有自己的专长。

我们处在人工智能的时代，我们相信这能打造更好的生活，我们所面临的各个领域都有很多未解之谜，科学家通过人工智能，可以做到更多的事情。

这是一个伟大的围棋赛事，天才的选手和团队与AlphaGo对战，可以认为是人机合作时代的开启。

非常感谢今天你们能允许我们来到这里。

△ 哈萨比斯

哈萨比斯：

我对未来几天的比赛充满期待。我们非常感激中国围棋协会、体育总局、桐乡政府等帮助我们如期举行人机大战。柯洁是一个真正的艺术家，天才式的围棋选手。这场对弈将开启围棋界的下法新天地。

这次峰会的宗旨，是在世界最深奥、美丽的棋盘上，探索新的下法。可能再过一万年，我们也无法穷尽围棋的下法和定式。围棋变化繁多，非常神秘。

三年前，我们想也许人工智能有足够的能力下围棋。AlphaGo不是一个预编程的围棋程序，而是采用人类相似的方式进行学习。

一年半前，我们与樊麾进行对弈，现在樊麾也加入了我们。AlphaGo以人类无法想象的方式下围棋。一年前我们和李世乭进行了对局，我们也为之感叹。今年一月，我们给他取名“Master”，并在网上取得60连胜的成就。

这不是人机大战，而是人使用电脑发现新的奥秘和知识。和哈勃望远镜一样，探索宇宙，AlphaGo就是新的哈勃望远镜。

AlphaGo可以用在其他领域。我们相信在制药、医疗领域，都可以借由人工智能解决，帮助专家取得更大领域的突破。

希望通过未来与人类专家的合作，找到各种创新的方式。希望探索有新的创新，也希望AlphaGo在其他领域有新的突破。

最后我们想对围棋界表达深深的谢意，这已经超过我们最初的想象。希望能探索新的下法，我们最终的目的不是谁赢，因为最终的胜利属于人类。

我们希望在座的各位能一起探索围棋的真谛。我祝柯洁好运。

9时40分，柯洁上台参与活动，然后离场准备稍后的比赛。

决战前夜：柯洁不眠

昨晚23:15:44，柯洁在微博上发出《最后的对决》一文，字里行间都透露着这位少年天才的焦虑和骄傲。以下是《最后的对决》全文：

决战前夕，感慨万千…

在这个特殊的时间，我有些话想和热爱围棋、关注围棋、关注我的朋友们说:

无论输赢，这都将是我与人工智能最后的三盘对局

很多人可能会问为什么？

其实私底下我已经与朋友家人说了很多次这样的想法，现在的AI进步之快远超我们的想象。像国产的绝艺、日产的ZEN虽然和AIphago还有着较大差距，但已经表现出超强的实力了…我相信未来是属于人工智能的。

可它始终都是冷冰冰的机器，与人类相比，我感觉不到它对围棋的热情和热爱。对它而言…它的热情——也只不过是运转速度过快导致CPU发热罢了。

我会我用所有的热情去与它做最后的对决，不管面对再强大的对手——我也绝不会后退！至少这…最后一次…

拼尽全力后，无论结果…管他口中是是非非，来一首《沧海一声笑》..岂不美哉、快意？我淡然笑到…

不眠夜，且看且珍惜，请大家欣赏我最后的三盘人机大战。

相比于柯洁的心情复杂，阿法狗这边似乎显得颇为轻松。

DeepMind创始人兼CEO哈萨比斯，昨晚才抵达乌镇。而对于第二天一早就要打响的比赛，他的态度是：“我都等不及了”。

AlphaGo简介

如何进行训练？

一直以来，围棋就被认为是传统游戏中对人工智能最具挑战性的项目。这不仅仅是因为围棋包含了庞大的搜索空间，更是因为对于落子位置的评估难度已远远超过了简单的启发式算法。

为了应对围棋的巨大复杂性，AlphaGo采用了一种新颖的机器学习技术，结合了监督学习和强化学习的优势。通过训练形成一个策略网络（policy network），将棋盘上的局势作为输入信息，并对所有可行的落子位置生成一个概率分布。

然后，训练出一个价值网络（value network）对自我对弈进行预测，以 -1（对手的绝对胜利）到1（AlphaGo的绝对胜利）的标准，预测所有可行落子位置的结果。

这两个网络自身都十分强大，而 AlphaGo将这两种网络整合进基于概率的蒙特卡罗树搜索（MCTS）中，实现了它真正的优势。最后，新版的AlphaGo产生大量自我对弈棋局，为下一代版本提供了训练数据，此过程循环往复。

如何决定落子？

在获取棋局信息后，AlphaGo会根据策略网络探索哪个位置同时具备高潜在价值和高可能性，进而决定最佳落子位置。

在分配的搜索时间结束时，模拟过程中被系统最频繁考察的位置将成为AlphaGo的最终选择。在经过先期的全盘探索和过程中对最佳落子的不断揣摩后，AlphaGo的搜索算法就能在其计算能力之上加入近似人类的直觉判断。

【完】

本文作者：唐旭若朴

原文发布时间： 2017-05-23

输了！柯洁首战告负AlphaGo，哈萨比斯：这不是人机大战