2010 年,美国航天航空局 NASA 敲响了一家创业公司的大门,希望他们参与火星探测器“大脑”的研发项目。这家公司就是 Neurala,一家专注于深度学习技术的波士顿初创公司。
NASA 的要求是一个艰难的挑战,因为火星探测器自身计算能力非常限制。然而 6 年之后,Neurala 成功完成了任务,让 NASA 的火星探测器可以利用传感器快速识别周围物体,并且只需基础的本地计算环境就能运行。
Neurala 这家公司的 4 名创始成员均来自波士顿大学,他们成功的秘诀,则是独有的 Lifelong-DNN(简称 L-DNN) 技术。
什么是 L-DNN?顾名思义,一次训练后实时学习。它是 Neurala 研究并获得专利的一套算法,模拟生物大脑看待世界的方式并从中不断学习。
根据官方信息,和传统的 DNN(基于反向传播的深度神经网络)相比,L-DNN 的学习速度要快 250 倍,而且在单核 ARM 芯片上就可以训练。如果该资料属实,那么 L-DNN 算得上是重大突破。
对于未来,Neurala 创始人兼 CEO Massimiliano Versace 曾撰文表示,2027 年的人工智能将像人类和动物的大脑一样运行,其能力将远超今天的人工智能,从而能为我们人类完成更复杂的任务。而这也代表了 Neurala 未来的技术发展方向。
迄今为止,Neurala 已经获得了近 1600 万美元的融资,投资方包括 Pelion Ventures,Sherpa Capital,摩托罗拉,360 Capital Partners,Draper Associates Investments,SK Ventures,和 Idinvest Partners 等。
当然,最终支撑 Neurala 还是商业化项目。目前,与 Neurala 合作最多的是商业无人机公司,主要用于电池塔、电力线和太阳能电池板的检查巡视工作。
此外,Neurala 也与摩托罗拉系统达成了合作。Neurala 将把自己人工智能技术与摩托罗拉系统的软件及相机,例如 Si500 随身相机结合起来,让相机能自动搜寻目标人物或物件,大幅降低警察在挤拥及混乱的环境下寻找失踪儿童和可疑物件的时间及精力。
如今,这家公司瞄准了中国的庞大市场,并已经开始与华为等中国公司进行合作,在物体检测等计算机视觉领域展开联合研发。
7 月,Neurala 正式上线 SaaS 平台 Brain Builder 的测试版,目前已经具备自动视频标注功能,并可以将数据直接导入到 TensorFlow、Caffe 等深度学习框架。此外,Neurala 也正在不断迭代和演进 Brain Builder,未来将具备更完善的功能,服务广大的企业用户和开发者。
近日,CSDN 有幸采访到了 Massimiliano Versace(以下简称 Max),一起聊了聊支撑 Neurala 的核心技术,以及 Neurala 未来的商业规划。
CSDN:能介绍下 Neurala 的发展历史?
Max:Neurala 成立于 2006 年。我和 Neurala 的创始人们结识于波士顿大学,在 PHD 期间,我们研究的是认知和神经网络,这是一门学习大脑如何工作,通过软件来建立大脑的数学模型,以此来模拟人类的感知、移动、思考等等。当时,我们使用了 GPU 来加速我们的算法,使得算法的执行速度大幅提升。于是我们申请了相关专利,并成立了 Neurala 来持有这个专利。不过,当时的产业界还远未成熟,GPU 的性能还非常弱,因此并没有很多 AI 应用,还处在早期阶段。于是我们还在学术界呆了一段时间,直到2013 年,我们加入了一个加速器,开始商业化这个技术。
CSDN:目前 Neurala 有多少员工?
Max:我们一开始只有 3 个人,现在已经发展到 41 人了。人员组成方面,我们有大约 10 名博士,20 名工程师,10 名市场、销售以及行政管理人员。因此我们的团队大部分都是技术工程人员。
CSDN:自 2013 年起,你们已经进行的两轮融资,你们现在的的主要收入来源是什么?
Max:Neurala 的营收主要分成两个部分。其中主要收入来源于我们和无人机、智能手机、摄像头等厂商的合作,将我们的 AI 技术植入到这些设备里,然后根据设备的销量来分成。
我们的另一条收入线来自 SaaS 平台。我们今年 7 月推出了 BrainBuilder 的 SaaS 平台,目前还是 beta 版本。通过这个平台,我们希望把我们和 OEM 厂商合作的技术提供给每一个人。
CSDN:你们目前已经和哪些中国公司有合作关系?
Max:我们正在和华为合作,关于具体的合作细节,暂时还不方便透露。不过我们已经和一些中国公司合作,包括智能手机、摄像头、或者神经芯片(处理器)等可以应用我们的技术的生产厂商。此外,我们也在与那些对我们的 SaaS 平台感兴趣的公司进行接触。我们希望扩大这个平台的使用范围。我们知道中国对 AI 工具有很大的需求,很多公司都希望在将 AI 部署到应用中去,我们也在思考如何为企业开发更有效的工作流。
CSDN:能解释下你们的核心技术 L-DNN 吗?
Max:和传统的神经网络并不相同,L-DNN 在部署后也可以实时学习。这是我们在和 NASA 合作时的成果。当时,我们需要创建一种新的 AI,让它能在控制器中自我学习,对处理器的性能是极大的考验。这类新 AI 无需很强的处理性能,也可以在不使用云端支持下进行学习。因此,我们需要在性能较弱的处理器上部署 AI,而且是可以持续学习的 AI。我们对基于反向传播的传统架构进行了重构。如果我们想把 AI 部署到这样的设备中,那么就必须把学习速度提升上千倍。
CSDN:为什么 L-DNN 比传统的深度神经网络更加先进?
Max:首先,罗马不是一天建成的,我们花费了 10 多年的时间来做这件事。12 年前我们就开始研究这一算法,它需要一种不同的思考方法。当时,没有人进行相关工作,这给了我们足够的时间来进行尝试。这种革命是可能的。虽然未来我们的优势可能会减少,但是今天我们享有很大的优势。
CSDN:您觉得反向传播过时了吗?
Max:反向传播在当时是一种很伟大的方法,当我刚进入 AI 领域时,反向传播处于统治地位,而且是使用范围最广泛的算法。然而问题是,自 80 年代诞生起,反向传播几乎没有任何改变。实际上改变的是计算力,所以算法的执行速度提升了很多倍,但是方法却没有什么改变。因此是算法一直在享受着摩尔定律的红利,但是算法本身并没有什么太大的变化。是的,反向传播确实简单易懂,而且广受欢迎。但是当涉及到实时处理时,反向传播这种方法就不太适用了。之前,NASA 付给我们数百万美元,让我们解决实时处理的问题,因此我们有这个机会做出现在的 L-DNN。否则,我们如今应该也在使用反向传播。
CSDN:请问你们是怎样预预训练你们的模型的?
Max:我们拥有的技术可以在特定的数据集上进行模型的预训练,然后你可以随时增加知识。当然,不管是反向传播还是 L-DNN 都可以用来预训练模型。但是问题在于,一个基于 DNN 的模型,在学习了 100 件事之后,如果想再学习第 101 件,那么就得把加入新数据后的数据全集重新训练一遍,但是 L-DNN 可以像人类学习知识一样学习,只需要学习新知识即可。
CSDN:目前你们的技术只能用在图像领域吗?未来有可能扩展到语音、语义等领域吗?
Max:当然可以。L-DNN 的原理是对任意矩阵的运算,现在运算的方阵由 RGB 的值组成。相同的原理同样也适用于语音或其他领域。不过我们现在主要关注视频领域,因为这个市场是最大的。
CSDN:Neurala 目前提供哪些产品?
Max:我们目前主要还是给设备厂商提供 AI 技术,比如把 AI 直接部署到终端设备上。举一个典型的例子,比如我想分析一段视频或者一些图片,传统上都是把数据传输到服务器端,然后让服务器来学习处理,但是我希望终端设备能够自己完成部分任务,那么使用我们的技术,就可以将这种能力部署到设备端。对于企业客户来说,如果他们想为用户提供个性化的服务,但是为了保护用户隐私,那么就需要在设备端处理用户数据,就可以选择我们的技术。而我们开发的 Brain Builder 这个 SaaS 平台既可以给企业用户使用,也适合开发者使用。
CSDN:相比之前的产品,你们取得了哪些进展?
Max:目前 Brain Builder 还是 1.0 版本,离 2.0 版本还很远。1.0 版本提供了自动视频标注功能,为用户节省大量数据标注的时间。
CSDN:你刚提到的视频数据标注工具背后的技术是什么?
Max:这是第一个在 SaaS 平台应用 L-DNN 技术的工具。这个案例就体现了如何运用 L-DNN 快速学习我们在视频流中所感兴趣的对象。用户只需要上传视频,然后在某一帧画面里手动标记几个物体,比如汽车、人、小狗这三个物体,然后我们的系统就会自动学习这三个物体,然后点击播放视频,就可以自动标记了。
目前我们的 Brain Builder 主要是针对企业客户。这些年来,我们发现很多企业的 AI 应用都非常具象。比如检查线缆是否生锈,皮革座椅上是否有裂缝,手机上是否有擦痕,甚至检查某栋大楼前是否停了某款汽车。
为什么要举这些例子?我其实想说明的是,如果你想开发一款 AI 应用,绝大多数时间,网络上都没有你需要的训练数据。这些非常场景化的数据只有企业自己拥有。因此,我们开发的工具可以让企业内部自行标注数据,而不需要将数据泄露出去。为此,我们开发了一系列的企业管理工具。
CSDN:既然你们要提供平台服务,那么你们会搭建自己的数据中心吗?
Max:我们不打算搭建自己的数据中心,而是跟第三方进行合作。数据中心不是我们的核心业务,我们有太多的事情要做。
CSDN:为什么你们从来没有公开发表过任何论文或者技术文章?
Max:我们申请了很多专利,每个专利其实就相当于技术,只是没有把技术细节公开。通常,那些倾向于公开发表论文的都是 Google 这样的大公司,因为这并不会影响他们的收入。比如 Google 的营收主要来自于广告,而不是这些专有技术授权,因此它有这样的底气公开自己的研究成果。Neurala 正好相反,我们需要通过这些专有技术来赚钱,因此策略不同。
CSDN:哪些公司是你们的竞争对手?
Max:在我看来,Neurala 的主要竞争对手是哪些提供平台服务的大公司,比如亚马逊、Google、微软。不过,这些大公司主要提供神经网络的训练工具,而不怎么关注数据准备工作。我认为这是我们独特的优势。
CSDN:能透露下和华为的合作进展吗?
Max:我们的合作很愉快,但是现在还不方便透露,应该很快就会有公开的消息发布。