AlphaGo之父:除了下围棋,AI还要塑造人类未来

DeepMind两战两胜围棋大师李世乭,激起了人们对人工智能潜力的热烈讨论。然而DeepMind的产品远不止AlphaGo而已——连主打产品都算不上。正如公司联合创始人戴米斯·哈萨比斯在本周早先说过的,DeepMind想要“解决智能问题”。为了实现这一目标,他有很多想法。

AlphaGo之父:除了下围棋,AI还要塑造人类未来_第1张图片

哈萨比斯一贯不走寻常路,不过现在回顾起来却另类得不无道理。他是儿童国际象棋天才,曾5次获得脑力奥林匹克运动会全能脑力冠军,年纪轻轻就通过在游戏开发公司Bullfrog和Lionhead研发侧重于人工智能的游戏《主题公园》和《黑与白》名噪一时,后又成立了自己的工作室Elixir。2005年,哈萨比斯从游戏产业中抽身,转而读了个神经科学博士,随后在2010年成为了DeepMind的联合创始人。

在AlphaGo首战告捷后的上午,哈萨比斯接受了The Verge的采访。当谷歌一位负责人告诉他一夜之间韩国媒体发表了超过3300篇关于他的文章后,他难掩惊讶。“太难以置信了,不是吗?”他说道。“看到小众的东西变得这么流行还真是有趣。”

除了AlphaGo,我们的谈话还涉及了电玩、下一代智能手机助手、DeepMind在谷歌旗下扮演的角色、机器人、人工智能如何辅助科学研究等等。料很多,慢慢看

(以下内容酌情略有删减)

“ 围棋一向是人工智能研究的终极目标

对既不了解AI也不了解围棋的人,你要如何描述昨天发生的事所引起的文化共鸣?

我想就此说几点。围棋一直以来都是完美信息博弈的巅峰。在可能性上,它远比国际象棋复杂。因此在AI研究领域,尤其是继“深蓝”之后,围棋一直是大家的终极目标。正如你所知,尽管付出的努力不少,却收效甚微。

AlphaGo之父:除了下围棋,AI还要塑造人类未来_第2张图片

“蒙特卡罗树搜索”是十年前的重大创新,但我们将直觉层面引入了AlphaGo的神经网络,而顶级棋手之所以杰出正是因为他们的直觉力。连比赛现场解说员迈克尔·雷德蒙都无法算出胜负,这真令我震惊,他可是职业九段!这正显示出了围棋的估值函数写起来有多难。

比赛过程中,AlphaGo有没有哪几手棋是出乎你意料的?

有的。当AlphaGo向左下角李世乭的地盘猛攻时,我们相当震惊——从李世乭的表情来看,我想他也这么觉得。这是很出人意料的一招。

因为进攻太猛?

应该说一方面攻得太猛,一方面又太鲁莽了!并且它对李世乭将计就计。李世乭以富有创造力的进攻著称,他在比赛中也是这么做的,我们猜到他会这样。比赛开局,一切还没落定,他就全盘各处进攻。传统的围棋程序非常不善于应对这样的比赛,它们在局部计算上并不差,但需要大局观的时候就显出劣势了。

“ 为什么说谷歌围棋的胜利如此重要?

举办比赛的初衷之一就是为了考察AlphaGo的实力。你从昨晚的比赛看出了什么?

事情比我们希望的还要好。我们之前认为比赛的胜率是50:50。我现在还是这么认为;一切皆有可能,李世乭也会以不同的战术应战。因此能一探究竟是很有趣的。

继续你的第一个问题,人工智能的意义,你也听我说起了AlphaGo和“深蓝”的不同。“深蓝”是定制的程序,程序员从国际象棋大师那里将信息提炼为具体规则和启发式算法,而我们则赋予了AlphaGo学习的能力,让它自己从练习和培训中学习,这点更与人类更接近。

如果AlphaGo照这样赢下去,接下来是什么?未来会有其他的人工智能比赛吗?

对于完美信息博弈,围棋已经是顶点了。当然,还有其他的围棋大师可以与之对决。也还有其他的竞技项目——无限注扑克很难,多玩家的形式很有挑战性因为这是一种不完美信息博弈。当然,还有各种人类比计算机玩得好的电竞游戏,比如在韩国大受欢迎的《星际争霸》。策略游戏对非完美信息世界中的策略能力有很高的要求,是谓“部分观察”。但围棋中你可以看到整个棋盘,对计算机来说难度会小些。

你对称霸《星际争霸》有兴趣吗?

也许吧。我们的目标不是要横扫竞技项目。我爱游戏,也曾经编写过电脑游戏。但前提是游戏能作为测试我们编写的算法的平台,这样来测试算法效率较高而已。最终我们是想要将它应用于解决现实世界中的重大问题

能谈一下你现在从事的和之前从事的游戏业的区别吗?

像DeepMind这样的东西是我一直以来的终极理想。从某种意义上说,我已经为之计划了20多年。我之前所做的都是为了从事有朝一日投身到人工智能的领域。如果你熟悉我在Bullfrog等公司所做的事情,你就会知道,我所围绕和涉及的工作重心全是AI。

从16、7岁制作《主题公园》起,我就意识到了人工智能的巨大潜力。我们的游戏有数百万的销量,无数人沉浸其中,都是因为AI的功劳。在此基础上,我曾尝试在游戏制作生涯中更进一步,然后就转向了神经科学的学习,因为在2005年左右我觉得已经很难再打着制作游戏的旗号进行AI研究了。毕竟发行商想要的只是游戏,对吧?

所以截止到那时,AI最大的用武之地就是游戏咯?

我认为是这样的,而且当时我们做的还是前沿得不得了的AI。90年代,学术研究进度放缓,所有诸如神经网络、深度学习和强化学习这些新科技都还没得到普及。所以事实上最好的AI都是在游戏中出现的。那还不是我们今天搞的这种学习型AI,而是有限状态的机器,但是它们已经相当复杂并且可以自适应了。像《黑与白》这样的游戏就用到了强化学习——我至今仍然认为这是强化学习在游戏中最复杂的典范。但是到了04、05年,游戏产业已经发生了变化,不再像90年代那样既有趣又有创意,可以容你随意实现自己的想法了,而是充斥着与游戏画面、销售和FIFA游戏这些相关的东西,变得不再那么有趣。我在游戏领域中已经发挥到极致,是时候搜集不同的信息来准备创立DeepMind了。这就关系到了神经科学。我想从人脑解决问题的过程中得到启发,那么还有什么比读个神经科学PhD更好的方法呢?

IBM已经将“沃森”应用于癌症诊断中。DeepMind又能给我们带来什么呢?

现在谈这个还有点早。几周前我们宣布了和NHS的合作,而那只是为机器学习提供平台的开始。以我的理解,“沃森”跟我们所做的还是很不一样的。“沃森”更像个专家系统,是一种不同类型的AI。这类AI做的是对图像进行医学分析,纵向跟踪重要信号或随着时间自我积累,来帮助人们建立更健康的生活方式。这对强化学习来说是很适合的。

谈谈智能手机助手吧。你在开赛日的讲话中用到了电影《她》中的画面。所以未来就是那样的吗?

不,我的意思是《她》代表了对这类事物的主流观点。我认为人们想要的是智能、连贯且深刻理解你真正想表达的意思的智能手机助手。

AlphaGo之父:除了下围棋,AI还要塑造人类未来_第3张图片

现阶段这类系统还不堪一击——一旦涉及到程序没有的模板,它们就全无用处。因此关键是要让它们变得真正具有自适应力,更灵活稳健。

优化这些系统需要什么样的突破?为什么不能明天就开始着手进行?

能是能,我只是觉得要换个角度。这还是预编程序与学习程序的区别。目前基本所有智能手机助手都是特定预编的,这就意味着它们只能做预设好的事。然而现实世界混乱而复杂,手机用户会做出各种不可预判的行为。DeepMind的根本理念是,AI的唯一途径就是从根本上进行学习并且有通用性

AlphaGo是从学习大量棋谱起步的。然而对于智能手机来说输入数据要多样得多。

是的,学习正是通过海量的资料来完成的。事实上,我们打算在接下来的数月里尝试AlphaGo算法——我们想去掉一开始的督导学习部分,完全让他自学,彻底从零开始。这样需要花费的时间要更长,因为随机下棋需要花更多的时间来训练试错,或许得好几个月。但是我们认为让它纯自学成才是可能的。

你说的可能是因为现在的算法比过去先进?

不,之前的算法也可以。这样并不会让程序变强,只是让它自学,没有监督辅导的部分。我们认为这个算法不需要督导也可以。我们去年用雅达利游戏测试时就没有任何人类知识的引导,只是从在屏幕上随机行动开始的。

雅达利游戏比较容易吧,因为失败更显而易见?

比较容易是因为比分更有规律。在围棋中,无论结束时你是赢是输都只得1分。这就是信用赋值问题,关键之处在于围棋中你下了一百手棋,但是不确定哪几步导致了输赢,所以信号是很弱的。而在绝大部分雅达利游戏中,你做的绝大多数事都会让你得分,所以你得到的线索会更多。

对于人工智能改变手机,你能不能给出个时间范围?

我想,在接下来的2-3年内你就会看到苗头了。开始可能变化不大,只是有些方面进步了。或许在4-5年后功能上会有一大步飞跃。

谷歌有没有左右你们配合他们的产品方针或商业模型来行事?

没,我们可以自由掌控对研究进度的优化。我们的使命就是如此,我们就是为此才加入谷歌的,因为这样可以提升我们的研究进度。过去两年就是这么过来的。

AlphaGo之父:除了下围棋,AI还要塑造人类未来_第4张图片

当然,我们也在做许多谷歌内部产品,但那些还只初具雏形,不便公开。当然,智能手机助手是重中之重,桑达尔·皮查伊也多次谈到它是谷歌未来发展的核心。

“ 谷歌的支持对AlphaGo来说“非常重要” 你们和谷歌大脑有互动和交叉吗?

当然,我们其实非常有互补性。我们每周都要交流。谷歌大脑主要注重于深度学习,有杰夫·迪恩这样了不起的工程师,所以他们已经深入到了公司的每个角落,才有了像谷歌照片搜索这么棒的东西。他们做得出色极了。他们也位于Mountain View总部,所以离产品部更近,研究周期只有12-18个月。而我们做的是算法开发,周期要2-3年,一开始也并没有明确的产品指向。

谷歌对AlphaGo的支持有多重要?没有谷歌你们能成功吗?

非常重要。AlphaGo在比赛中并不需要用到很多硬件,但是训练中我们需要很多硬件支持,尝试不同版本,让它们在云端展开对战。要想高效实现这些就需要大量的硬件,如果没有这些资源我们是无法在这么短时间里完成的。

我在日本工作,现在机器人在日本有两种用途。一种是发那科这样的公司的工业机器人,还有一种是软银的Pepper这样的管家式机器人等等。从某些角度说都很厉害,但使用范围有限。你怎么看?

是的,正如你所说,发那科机器人的物理功能很强,但他们缺乏智力。管家机器人则有些类似智能手机助手——也是以模板响应来预编的。

如果你的行为超出这个范围,他们就傻眼了。

那么机器学习会如何提升机器人的能力呢?

这是完全不同的另一方面了。你要从头创造学习新事物的能力,还要具备应对意外的能力。对于任何机器人和软件来说,在现实世界中与现实用户互动,这些能力都是必须的,这样才能让它们派上用场。我相信学习的道路终归是对的。

眼下,学习型机器人最实际的用途是什么?

说实话我们没怎么考虑过这点。显然,无人驾驶车可算是机器人,但目前为止还是狭义人工智能——尽管在计算机视觉方面用到了学习型AI。特斯拉用的是几乎现成的基于深度学习的计算机视觉技术。我确信日本在考虑研发老年护理机器人,我觉得家务机器人对社会也是极有用的,尤其是考虑到人口老龄化这个严峻问题。

学习型机器人为什么会在这些领域尤为出众呢?

你应该先想想“为什么我们还没有这些东西呢?”为什么没有能包揽家务的机器人?原因就在于每人的家在布局和家具等方面都完全不同。即使在室内,情况每一天也不尽相同——有时会变得凌乱,有时会变得整洁。所以你没法给机器人预编程序来打扫房间,对吧?更不用说人们在如何叠衣服上都有不同的偏好。这正是问题的复杂之处。这些对人类来说很简单,但事实上在做这些事的时候,我们是在处理异常复杂的情况

我问一句:你用扫地机器人吗?

呃……我们的确有一台,但不太好用……(笑)

从长远看,你对人类、机器人及人工智能在未来的互动有何期待?

我个人并没太多考虑过机器人。真正令我对运用这种AI感到激动的领域是科学我期待能由AI研究助手来完成一些枯燥的工作,挖掘有趣的文章,在数量庞大的数据中摸索出结构并呈现给人类专家和科学家,使他们能够更快地取得突破。几个月前我在CERN进行了一次演讲。

显然,他们产生的数据比地球上任何其他人都多,也许在他们庞大硬盘的某处就藏着新粒子,只是因为数据太多而没人来分析发现。所以,要是有一天AI能参与发现新粒子,就太酷了

真是精彩的结语。

​来源:The Verge作者:Sam Byford编译:未来论坛 商白

文章转载请注明出处为 “未来论坛”微信账号(ID:futureforum)

未来论坛官网:www.futureforum.org.cn

你可能感兴趣的:(AlphaGo之父:除了下围棋,AI还要塑造人类未来)