记者:卢鸫翔([email protected])
本文为《程序员》原创文章,未经允许不得转载,更多精彩文章请订阅2017年《程序员》
“虽然没人确切知道恐龙是怎么灭绝的,与之相关的理论却很多——关于大脑则完全相反。”
作为工程师,Jeff Hawkins创立了两家便携式计算机公司,Palm和Handspring,开发了风靡一时的PalmPilot和Treo智能电话。然而作为科学家,理解大脑运作方式、原理,并按同样原理制造智能机器才是他一生的追求。日前,Jeff Hawkins接受了《程序员》采访。
1979年,从康奈尔大学工程学院毕业的Jeff Hawkins选择在Intel开启他的计算机行业生涯,然而三个月后,他就发现自己入错了行——那年9月出版的《科学美国人》是大脑研究专刊,专题最后一篇文章中,Francis Crick(DNA结构发现人之一)写道,“尽管人们积累了大量有关大脑研究的详尽数据,但其工作原理仍是难解之谜。神经科学只是一堆没有任何理论的数据,最明显的是缺乏概念框架”。Crick甚至没用“理论”这个词,他说,我们根本不知道怎么去想,因为连基本框架都没有——Crick的话像号角,唤醒了Hawkins长久以来研究大脑,制造智能机器的梦想。
Hawkins那些认为“大脑无法理解自身”的说法除了似有禅意,实则毫无用处,“人们常怀有根深蒂固但错误的假设,正是这种偏见阻止我们探寻答案。翻开科学史,你就会发现,哥白尼的天体运行说,达尔文的进化论和魏格纳的大陆漂移学说都跟大脑理论有诸多相似,都曾有许多无法解析的数据,而一旦拥有理论框架,一切就都变得有意义了。”
然而将这一计划付诸实施尚需时日。在Intel展开研究自然是最便捷的渠道,Hawkins致信当时的公司主席Gordon Moore,建议成立研究小组,专攻大脑工作原理:“该工作可从一个人,即本人开始,随后进一步拓展。本人有信心承担该工作。相信有一天它会给我们带来无限商机。”不过随后的讨论中,公司并未支持他的想法,因为没人相信在可预见的未来能研究出大脑的工作原理。
此路不通,只得另辟蹊径。他首先向当时的人工智能研究“航母”MIT人工智能研究院发出申请:
“我想设计和制作智能机器,但我的想法是先研究大脑怎么运作。”
“你不需要这样做,我们只需要为计算机编程。”
“不,应该先研究大脑。 ”
“你错了。”
“不,你们错了。”
他们直截了当地告诉Hawkins,要认识智力和建造机器,没必要研究真正的大脑,“他们认为研究大脑会限制思维,对大脑如何工作毫无兴趣。采取‘只求结果,不问手段’的方式开展研究,甚至有人还为自己跳开了生物学这一阶段而沾沾自喜。”MIT拒绝了他的申请。
Hawkins无所适从,但仍一心渴望研究大脑,他参加了人体生理学函授课程——因为函授学校不会拒绝任何人。他努力学习,准备考试,几年后被UC Berkeley接收为生物物理学研究生。欣喜若狂之余,意味着原本打算买房生子的计划搁浅,他需要甘心变成一个不能挣钱养家的人。
他原以为这次可以终于可以研究大脑理论了,但学校告诉他,他选择的研究方向,得不到经费。Hawkins很沮丧,只能回到原点——他熟悉的计算机行业。“我计划干4年,挣点钱,组织自己的家庭,那时自己可能会成熟点,神经系统科学可能也会成熟点。结果比4年长多了,已经大概16年,但我终于做到了。”Hawkins在这段时间创立了Palm Computing(也许值得一提的是,Palm商标目前归中国公司TCL所有)和Handspring,推出了一系列风靡一时的掌上手写电脑。
Palm使用的手写识别系统Graffiti灵感来自Hawkins曾学习的一种与大脑有关的数学——1987年夏天,一家名为Nestor的公司展示了一种能识别手写文字的神经网络,要价100万美元,“他们在神经网络规则上大作文章,将它吹嘘成一项重大突破,但我觉得手写识别问题可以通过另一种更简单、传统的方法解决。两天后,我设计出一种速度更快,体积更小,使用更灵活的手写识别器。”
终于“挣到点钱”的Hawkins将自己的研究方向全面转向神经科学,2002年他建立了非盈利的科学研究机构Redwood Center for Theoretical Neuroscience,2005年建立了Numenta继续他的研究。此前一年,他出版了《On Intelligence》,向大众介绍大脑和智能理论。书中他提出了“记忆-预测”框架(Memory-prediction framework)——大脑的新皮质、海马体和丘脑联合匹配感官输入,存储记忆模式,并将这个过程如何用于预测。进而根据这一生物学框架发展出了HTM(Hierarchical Temporal Memory)机器学习模型。Hawkins将其称为“生物神经网络”(Biological Neural Network),与之对应的,他将Deep Learning为代表的神经网络称为“简单神经网络”(Simple Neural Network)。
“大脑以稀疏分布表示(sparse distributed representations,SDR)表征信息,我相信未来所有智能机器都将基于SDR。而现有机器学习技术却无法将SDR加入其中,因为SDR是构建其他一切的基础。生物神经也远比‘简单神经网络’复杂得多。而作为生物神经网络的一种,HTM已能从数据流中学习结构,做出预测和发现异常,还能从未标记的数据中连续学习。”Hawkins这样解释“生物神经网络”的独特之处,他还觉得目前人工智能对认知功能被分割了——分为语音,视觉,自然语言等领域,而人脑是具有综合性的认知系统。目前的图像识别需要上千万张照片的收集归类,才能让机器“认出”猫,但人脑善于捕捉和认知流动的信息,也不需要大数据的支持。
Hawkins认为,大多数神经网络和人工智能都有个共同缺陷——只注重行为。研究者们都认为智能存在于行为中——执行一个输入后,由另一个程序或神经网络产生行为。电脑程序和神经网络最重要的属性,就是能否进行正确的、令人满意的输出,将智能等同于行为。
而Hawkins则说:“智能并不是动作,也不是某种聪明的行为。行为只是智能的一种表现,绝不是智能的主要特征。‘思考’就是有力的证明:当你躺在黑暗中思考时,你就是智能的。如果忽略了头脑中的活动而只关心行为,将对理解智能和发明智能机器造成障碍。”
他认为“只求结果,不问手段”的功能主义解释会将人工智能研究者引入歧途,虽然人工智能的倡导者经常用会举出工程学上的解决方法与自然之道截然不同的例子——飞行器并非模仿鸟类扇动翅膀,轮子比猎豹更快。但他认为智能是大脑内部的特征,因此必须通过研究大脑内部来探究,“神经回路中一定潜藏着巨大的能量等待我们去发觉,而这种能量将超过任何现金的计算机”。
《程序员》:你目前专注哪些研究,终极目标是什么?
Hawkins:我的终极兴趣是尽可能了解宇宙,理解大脑原理是其中的一部分。我相信,建立与大脑原理相同的智能机器将帮助我们发现宇宙的奥秘。
目前我完全专注于大脑新皮层的逆向工程。在Numenta,我们试图理解大脑是如何对周围世界建模的,即人类智慧的本质是什么。了解大脑如何工作是最有趣的科学问题之一。了解大脑新皮层的原理也将帮助我们创造智能机器,这将对全人类大有裨益。
我们从两方面来解决大脑新皮层逆向工程的问题。一方面从理论出发,我们推断出大脑必须执行的一个或多个要求。另一方面来自经验,我们学习有关脑组织的解剖学和生理学全部知识。然后,我们试图来解决这两组约束。解决方案必须足够详细,这样才能用软件构造,并且进行生物测试。举个例子,我们知道大脑可以学习模式的序列,基于序列预测下一次事件。于是,我们仔细分析神经元的解剖结构和连接模式,探究它们是如何从序列中学习并作出预测的。我们用理论和实验预测证实了自己的理论。实际的过程比我说的复杂多了,但是基本原理就是这样。
《程序员》:Richard Hamming曾说:“若你对所做之事了如指掌,就不该做科学;而若相反,则不该做工程。” 你将自己视为工程师还是科学家?对于快速进入不同领域,你有哪些诀窍?
Hawkins:我职业生涯的早期阶段,主要身份是工程师,现在我主要的身份是科学家。但是每个方向的技能都有帮助。比如,在Numenta,我们需要测试自己的理论来探究不同的脑回路的功能。尽管可用软件实现,但是快速实现仿真并验证预期效果需要大量的工程技术支持。
当需要快速切入一个新领域时,我会一边精读相关资料,一边请教领域内的专家。不要害怕问问题,不管问题多么基础,要刨根问底。我非常享受这个过程。
《程序员》:那么作为科学家,如何在科研和商业间找到平衡?
Hawkins:的确,很难同时兼顾科研目标和商业发展。我们的当务之急是完成科研使命,目前在脑科学领域取得了很好的进展,不想分散注意力影响科研。从商业的角度来看,我们已将知识产权授权给了其他人。今后,也许会往商业化方向投入更多资源,但科研优先级仍旧是第一位。
《程序员》:哪些书对你影响最大,为什么?
Hawkins:我喜欢阅读那些克服障碍去完成伟大事情的故事。最近读的几本这类书包括David McCullough的《莱特兄弟》,Jennet Conant写的《燕尾服的公园:华尔街的大亨和改变二战的秘密科学宫》,Ron Chernow的《亚历山大•汉密尔顿》。任何努力的成功都在于克服永无止境的一系列障碍。我觉得学习别人面对挑战和坚持的方式颇受鼓舞。
《程序员》:Roy Amara说,“我们倾向于高估科技的短期影响力,而又低估其长期影响力。”在你看来,对于AI的前景,人们是否过于乐观?
Hawkins:我很喜欢这句话,无论是在我从事移动计算,还是做AI研究,一直铭记于心。我担心人们夸大了人工智能的发展速度。纵使现在的AI技术看上去很强大,但距离真正创建智能机器还有许多事情要做。在智能机器真正腾飞前,可能还会经历一个失望的低谷。
《程序员》:《On Intelligence》已出版十年,你有哪些新发现,如果有机会重写,会有何不同?
Hawkins:在智能领域,有些事情我想去改变,但更多的是想添砖加瓦。自从这本书问世以来,我们理解了概念背后的神经机制,更重要的是,我们发现了几个重要的新原理。
我正在考虑写一本关于大脑和人工智能的新书。我想谈谈很多关于智能机器的误解。另外,我还想说明为什么真正的智能机器是人类长期生存所必需的。
《程序员》:当今的硬件架构是否是实现智能机器的最好选择?还存在哪些限制?
Hawkins:目前的计算机体系结构和半导体器件不是真正智能机的理想选择。智能机器需要大量的分布式内存,但幸运的是智能系统能够容忍许多故障。而学习主要是,通过重新连线(re-wiring)来实现的。实现这些特性的最佳方法仍在争论中。
《程序员》:在你看来,对人脑机制理解的缺乏是我们开发智能机器的最大限制之一,在这个存在许多假设和未知的前沿领域进行研究,怎样判断自己研究的方向和做出的各种选择是否正确?
Hawkins:面临的挑战主要来自确定大脑的哪部分是信息处理必不可少的,哪部分又是生物生存依赖的。确定这一点的方法是首先发展一个全面的脑功能理论。这是一个反复更迭的过程,但在缺乏理论的情况下不可能完成。
《程序员》:HTM完备了吗,难点在哪儿?
Hawkins: HTM离完成还有很远!我们知道还有一系列的内容必须加入HTM理论,正在逐个解决这些问题。现在正在研究的大问题是如何使用行为来学习。移动身体、手和眼睛是学习的最重要机制。很少有人工智能系统尝试这种方法。去年,在这方面我们有一个重大发现,现在正在测试阶段。
《程序员》:除了生物神经网络,要制造智能系统,还需要哪些技术?
Hawkins:每个真正的智能系统需要某种形式的体现。这包括一组传感器和移动这些传感器的手段。传感器可以与我们在生物学中看到的任何东西都不同,这个化身可以是虚拟的,比如在万维网上“移动”。传感器的形式在基础理论之外可以有千变万化的形式。
《程序员》:生物神经网络与ANNs/Deep Learning最大的不同是什么?
Hawkins:真正的智能系统通过运动和操作来建立世界的模型。大脑新皮层随着感官数据的变化建立一个真实环境的模型。这就解释了为什么大脑学习比ANNs学会更丰富的模型,为什么大脑学习新事物的速度要快得多。总的来说,我相信随着时间的推移AI研究和大脑理论会变得更紧密。
《程序员》:你肯定也听到过同行对基于人脑理论研究AI方式的质疑,例如Yann LeCun曾说这些理论实例化的难度被严重低估,缺乏数学支撑,也缺少像MNIST或ImageNet这样的客观检验。
Hawkins:我们不该忘记,AI已经包含了大脑的原理,如分布式编码与Hebbian学习,这些想法已经存在了很长时间。近年来,我的团队在大脑理论方面取得了重大进展。我们的压力在于要证明它们是相关的,这是一项有挑战的任务。
《程序员》:有些人担忧智能机器在未来会对人类构成威胁,你怎么看?
Hawkins:我不同意这些担忧,这些想法基于三个错觉。
我们对威胁的反应该基于这种威胁离我们有多远。比如说地球将在1.5亿年后因为太阳变热而无法居住。几乎没人因为这个问题感到恐惧——实在太遥远。机器智能的进化过程中存在某些危险趋势,但这些危险有近有远。目前尚未发现已知的威胁。而对于遥远的未来,我们也能容易地改变那些可能会出现的问题。
【AI创新者】专栏精彩文章:
IBM宋煜:Watson之外的第二条AI通路
驭势吴甘沙:做无人驾驶的赋能者
CNN之父Yann LeCun:预测学习才是AI的未来
小蚁首架张骏峰:让图像AI人尽可用
Twitter施闻哲:图像质量的评判标准是超分辨率的下一个关键
云知声梁家恩:当 AI 遇见 IoT——云知声的 AI 之路
TensorFlow贡献者黄文坚:解读对比13个深度学习框架后的选择
TensorFlow 贡献者唐源:掌握 Google 深度学习框架的正确姿势
订阅程序员(含iOS、Android及印刷版)请访问 http://dingyue.programmer.com.cn