有一句话形容现在的人工智能特别合适:“我们往往高估了目前,而低估了未来”。如果要以其提出到现在60余年为一个周期来看,它真正席卷人类社会,才刚刚开始。
从这样的历史长河来看、从通用人工智能的未来回溯看,这个时代占据舞台中央的这些开拓者,都是手握着“深度学习”、“神经网络”等最原始的工具,在这块荒野上蹒跚前行。走在寻找人工智能基础工具这条路上,陈天石不比其他人多什么先决条件。
幸运的是,从他创造的石器中,人们逐渐发现并保留了火种。
寒武纪,这家背靠中科院计算所的创业公司刚亮相市场,就踏入了“独角兽”领域。
打磨“石器”
AI是一场革命。它和互联网一样,会席卷一切,会从无到有、再从有到无(无处不在)。普通人甚至不需要前行,它会主动过来拥抱你,甚至裹挟你。用罗振宇的话说:“你不必着急出发,因为你终将被抵达”。
在这场基础设施重新定义的革命中,陈天石无疑是一个提前出发者。16岁考入中国科学技术大学少年班;2014年论文在美国召开的国际顶级学术会议上获得最佳论文奖;创办的公司寒武纪科技,A轮估值超过10亿美元,成为全球首个人工智能芯片“独角兽”、全球最大的AI芯片初创公司。
基于深度学习这一底层算法,计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域取得了长足的进展。但传统的处理器例如CPU等,虽然是目前主流的AI计算平台,但是其基本框架结构毕竟不是为了AI所设计的,效率受到很多限制,包括GPU也有耗电量大等缺陷。
如果要用通用处理器搭建一个人脑规模突触的神经网络,可能需要建一个电站来给它供电。阿尔法狗刚亮相时,下一盘棋动用了1000个CPU和200个GPU,每分钟的电费就高达300美元,而网络规模只有人脑的千分之一。
陈天石认为,理想中的AI芯片应当是一种新型的处理器,能具有广阔的应用面(包括语音、语义、图像、视频、自然语言多模态处理能力),同时具备远超CPU和GPU的效率。要想达到这一目标,必须要有一套新的AI指令集,利用指令进行灵活处理,才有可能在AI芯片上把各种算法应用都能支持得又快又好。
打个简单的比方,把摩托车(PC、手机等)的发动机(CPU)装到了汽车(深度学习平台)上,汽车自然开不快;现在,需要为汽车专门设计一款发动机(深度学习专用处理器)。
“DianNao”这一深度学习处理器架构,平均仿真性能超过主流CPU核的100倍,但是面积和功耗仅为1/10,效能提升可达三个数量级。2014年,他和哥哥陈云霁以及法国信息技术研究院(Inria)的Olivier Temam教授合作的这篇论文,成为顶尖国际会议的最佳论文。
2014年-2016年间,他们俩和国际学术合作者一道几乎横扫了处理器架构学术圈,在顶级学术会议上教老外说中文的Diannao系列:Diannao(电脑)、DaDiannao(大电脑)、PuDiannao(普电脑)、ShiDiannao(视电脑)、Cambricon(寒武纪指令集)等一系列创新,针对不同的目的,将目前深度学习的效率提高数百倍。
有院士这样分析,“寒武纪”在深度学习处理器指令集上的开创性进展,为我国占据智能产业生态的领导性地位提供了技术支撑。自2014年中科院计算所和Inria联合团队提出首个深度学习处理器架构DianNao之后,深度学习处理器已经成为计算机体系结构国际会议ISCA最关注的研究方向之一。ISCA 2016上有近1/6的论文引用“寒武纪”的工作来进行深度学习处理器探索。
“目前,像阿尔法狗这样的软件算法是在GPU上执行的,将来如果使用了‘寒武纪’处理器,深度学习(神经网络)的运算速度会得到明显提升。”陈天石说。
他用“瑞士军刀和菜刀”来比喻通用处理器和深度学习处理器的关系:瑞士军刀虽然功能多,但是做菜的时候,还是菜刀更合适。在智能处理方面,“寒武纪”就是这把更合适的菜刀。
寒武纪指令集直接面对大规模神经元和突触的处理,一条指令即可完成一组神经元的处理,并对神经元和突触数据在芯片上的传输提供了一系列专门的支持。模拟实验表明,采用寒武纪指令集的深度学习处理器相对于x86指令集的中央处理器有两个数量级的性能提升。
如今,通过在计算机中模拟神经元和突触的计算,寒武纪的AI芯片对信息进行智能处理,借助专门设计的存储结构和指令集,每秒可以处理160亿个神经元和超过2万亿个突触,功耗却只有原来的十分之一,未来甚至有希望把类似阿尔法狗的系统装进手机。
埋头“重工业”
芯片是信息产业的“尖刀连”,更是“重工业”,其所需要的投入是巨大的,远远超过AI的其他领域。
2017年8月,寒武纪科技获得了价值1亿美元的A轮融资,该轮投资由国投创业领投,阿里巴巴创投、联想创投、国科投资、中科图灵、元禾原点(天使轮领投方)、涌铧投资(天使轮投资方)联合投资。
这家背靠中科院计算所的创业公司刚亮相,就进入市场,就踏入了“独角兽”领域。
华为的旗舰手机Mate10采用了寒武纪1A处理器,这是寒武纪AI产业化的第一步。这款2016年发布的全球首款商用深度学习专用处理器IP,入选了第三届世界互联网大会评选的十五项“世界互联网领先科技成果”。
它不仅具有完全自主知识产权,而且在计算机视觉、语音识别、自然语言处理等关键人工智能任务上具备出类拔萃的通用性和效能比,达到了传统的四核通用CPU25倍以上的性能和50倍以上的能效。
“我们的产品寒武纪1A处理器,可以跟苹果产品一较高下,结果我们很轻松打赢了这场战斗。我们并不是靠着蛮力去堆运算器,而是依靠最先进的、稀疏化的技术,四两拨千斤,让华为Mate10的智能处理速度打败了强大的苹果iphoneX。”陈天石说。
在将AI普惠化这一终极方向的指引下,他制定了自己的小目标。“我们现在与国外同行都是在同一个起跑线上的,希望寒武纪能在3年后占据中国高性能智能芯片市场30%的份额;在3年后,让全球有10亿台设备集成寒武纪处理器的智能终端。”
他给出了实现的路径。关于寒武纪芯片的市场商业化推进:“一是终端,二是云端。终端产品就是智能手机、智能眼镜、无人机、自动驾驶汽车等,需要芯片去识别图像、影音和文字。而在云端,像科大讯飞、中科曙光等这样知名的云端客户,都已经是寒武纪的客户。”
为了这个小目标,他说自己“除了休息的时间,都在工作”,拼了命地往前跑。在智能整个行业里面最上面是应用层,利用人脸识别、语义理解等,去系统集成自动驾驶、智能手机等产品。而“冰山”看不见的地方是技术层。
而芯片是技术层的“地基”。“芯片就是像建房子或者修路这样的事,如果没有房子没有路事情没办法往后走,希望我们未来能够继续承担好智能时代的基础设施提供商的角色。”陈天石说。
技术一定会带来人与人之间的鸿沟,而降低技术的门槛、创造尽可能的公平是消除这一鸿沟的几乎唯一可行的途径。
“从个人角度出发,我们主要从事人工智能加速芯片的研发,可以让开发者获得更加廉价、高效的芯片,支持上层应用的开发。”陈天石说,只有整个计算系统更加廉价,才有希望推动人工智能的普惠化。因此在底层,降低功耗、提高效率是关键。
至于上层应用,群众的智慧是无穷的。陈天石很乐观,他抱着乐见其成的态度来支持人工智能的发展,相信会在基础层之上,长出更多的应用。
保留“火种”
2017年底,一篇名为《芯片战国时代》的稿件在AI界很火,文章里说,“据CB Insights估算,进入新兴芯片初创公司投资总额从2015年的8亿美元增长到了2017年的16亿美元;创投库里,AI芯片公司从零星几家增长到20多家。光2017年下半年,台积电的生产线上就有超过30款AI芯片排队等着流片。”
时也势也。能不能到达终点,不仅取决于奔跑的速度,更取决于所在的赛道。
不只有初创公司在跑,实际上巨人们觉醒得比谁都快。就在前两天,芯片巨头英伟达在美国消费电子展召开发布会,宣布了一系列关于无人车机器学习芯片Xavier的相关内容。鉴于在AI芯片领域的表现,其股票2017年上涨接近100%,堪称“年度最佳理财产品”。
更别说英特尔、谷歌、Facebook、微软等巨头也在为此倾尽全力。咨询公司Tractica的预测数据显示,到2025年,与人工智能相关的深度学习芯片组市场收入,将由此前的5亿美元飙升至122亿美元的规模,复合年均增长率超过40%。
生死搏杀,千亿市场在一战胜负。
“芯片的成败,除了本身的效率之外,生态是非常关键的环节。没有配套的应用和软件,很难在市场上获得成功”。陈天石说,只要国产AI 指令集立住了,中国主导世界AI产业的机会可能就到来了。
在寒武纪科技的第一场发布会上,他用了很长的时间去介绍自己的合作伙伴。他说,过去我们国内企业起步晚,一直是国际生态的跟随者。我们融入这个生态,享受这个红利,但我们并不能有多大的力量去改变这个生态。但是在智能时代,大家都在同样的起跑线上,要敢为天下先,敢于提出并共同构建全新的智能生态。“光有寒武纪是不够的,我们大家需要共同在硬件的指令集和软件的开发平台上下功夫,在端云结合上下功夫,在商业协作上下功夫”。
2017年10月16日,陈天石发了一条朋友圈,“一事平生无齮(Yi)齕(He),但开风气不为师”。这句出自龚自珍的诗词,后来被很多教育界名士所引用。
事后他回想,这大概是因为他的执拗。18年前,陈天石考入中国科技大学,随后师从陈国良院士和姚新教授,读人工智能方向的博士。将近20年,他只做这一件事,把最底层的生态基石也就是芯片要做好。“技术一定要是最好的。”
过去是,现在是,将来无论公司走到哪一步,技术永远被摆在第一位。