撰文 | 吴欣
2017 年 10 月 31 日,中国人工智能创业公司旷视科技 Face++ (下简称旷视)宣布正式完成 C 轮 4.6 亿美金融资,本轮由中国国有资本风险投资基金(简称「国风投」)领投,蚂蚁金服、富士康集团联合领投。本轮融资由 C1、C2 两轮构成,同时引入包括中俄战略投资基金、阳光保险集团、SK 集团等新的重要投资者,腾达资本作为本轮融资独家财务顾问。
在宣传稿中提到,这一数字打破了国际范围内人工智能领域融资纪录。
4.6 亿美金,是继 5 月依图科技 3.8 亿人民币 C 轮融资、 7 月商汤科技 4.1 亿美元 B 轮融资之后,又一笔计算机视觉领域创业公司的大额融资。根据公开资料,在该轮融资前,成立于 2011 年的旷视,曾在2012年8月获得联想之星和联想创投天使投资,于 2013年获得创新工场 A 轮投资;2015 年获得来自创新工场、启明创投的 B 轮融资;2016 年,获得建银国际、富士康集团的 B+ 融资。
完成这次融资之后,旷视会进一步强化在金融安全、城市安防领域的投入,加快在城市综合大脑及手机智能领域的技术落地。「在业务方向,我们希望能够把以往各个单独领域的智能应用做到城市级别,因此,和很多中国重要的城市不仅签订了落户协议,还有智慧城市联合建设等合作,其中还包括一个机器人研发制造基地。」旷视市场副总裁谢忆楠对机器之心说。
在早前的采访中,去年 7 月加入旷视任首席科学家的孙剑也曾提到,公司已经向机器人行业提供硬件模组、内置算法。下一步会研究它的身体部分、手的部分、腿的部分,甚至是做完整的机器人。
作为中国最早一批投身人工智能的公司,旷视依托自主研发的深度学习引擎 MegBrain 实现了人工智能技术工程化、产品化和产业化。但商业化初见成果、融资额一路高涨、公司数量膨胀,并不足以验证风口上的人工智能已经走在整个产业的快车道。「人工智能的周期和路径也许是一个非常长期的革命。」旷视科技联合创始人兼 CEO 印奇曾在公开场合表达过对行业发展环境的看法,「我们判断如果行业能够从人脸(的识别)部分(推进)到决策部分,从 2011 年算起至少需要十年,现在是我们创业的第六年,而我们最大的感觉是真实进展情况比我们预估的延长了一到两年时间。」
寻找 AI 到达产业的「最后一公里」
事实上,从 2011 年公司起步,实现商业化的酝酿就已经开始。当时的旷视更多谈到的是算法,在去挖掘应用机会的时候,公司构建了一个免费的技术平台「 Face++ 」,并把它开放给开发者。
在印奇看来,这个平台还称不上是人工智能公司的重要形态,只是跨过了为行业应用方提供深度学习能力这一步,真正用 AI 驱动新行业的发展与行业深度结合,帮助这些应用方在同行业中形成差异化壁垒,比如新金融、新安防,才能真正发挥人工智能公司的价值。
在过去 2-3 年时间,旷视聚焦金融和安防两大应用场景,研究人工智能在其中的应用价值。由此,也实现了颇多商业化成果转化:
简单来说,旷视的商业化路径主要围绕「刷脸」,让人的「身份」与「行为」数据可以被感知和分析,从而实现从技术研发、产品化到商业化。覆盖线上支付到线下的交通等安防场景,从地铁、飞机场、火车站都分布其动态识别系统。
在具体产品方面,「智能云」和「智能互联」是公司的核心。从实际应用数据来看,截至 2017 年 6 月底,旷视核心技术已经累计推动 5 亿台设备实现智能化,并为这些设备提供了超过 200 亿次的智能服务。
根据不同场景的业务需求,旷视提供的智能行业解决方案为全球 2.1 亿人实现了远程实名验证服务、并为 25 省公安系统提供了实时警情数据服务,其中直接协助警方破获案件达 1032 起,抓获、控制的在逃人员超 2000 人。
在移动端,旷视提供的解决方案应用广泛,从小米 Note 3 手机的人脸解锁、金融级别防风险,到 vivo V7+ 人脸解锁应用,以及支付宝金融级别的刷脸支付方案。
印奇曾反复谈到过,他的 「4 in 1」公式——算法、软件、硬件、数据,一个真正优秀的 AI+ 行业的公司不光要做硬件,还要一直做到数据层面,数据就包含行业解决方案。
从 2015 年,旷视开始涉足硬件推出了集成智能识别摄像头,完成软件到硬件的升级。截至目前,旷视共生产物联网智能感知摄像头 6 款,智能物流机器人 1 款,赋能 25 家商用服务机器人识别能力。并为中信银行、阿里巴巴集团、滴滴出行、东软集团、凯德集团、富士康集团、公安部第一研究所等在内 800 余家政企单位提供了智能化的产品和服务。
按照包含算法、软件、硬件和数据的「4 in 1」公式,印奇认为,人工智能公司要遵循的可能是一个非常重的产业互联网打法,「所以这里面我也并不觉得会有那么多如雨后春笋般的 AI 创业机会。」
不过, AI 进入垂直行业时间不长竞争却几近白热化,在包括安防、金融、医疗等可见的应用场景中,人工智能创业公司扎堆,不少传统产业公司也在不遗余力地投资 AI 技术。对于如何从中争夺足够的市场空间,谢忆楠认为,「AI 与行业的结合属于新兴领域,所以做研究、算法、底层数据的人都需要有产品精神和产品意识,并不是在学术领域提出更多可能和假设。技术的本质是解决行业问题,旷视不仅要做纯粹技术上的绝对领先,也要做在行业、技术、产品方面的绝对领先,对于 AI 公司来说,这很难,但是必须要做。」
以深度学习为研究核心
实现商业化落地的背后,需要对技术的深度积累与沉淀。在印奇看来,这波人工智能产业的本质仍由奋斗技术驱动,深度学习为代表的人工智能技术。而对旷视而言,技术的发展路径则始终要遵循「4+2+X」,所谓「4+2+X」就是:
机器视觉领域四个最重要、最有商业价值的垂直门类:人脸识别,行人识别,车辆识别,以及文字识别;
「2」代表的是视觉和广义机器人的两个核心:手和脚。脚是自动驾驶、导航,手是大方向但真正兴起还需要时间;
「X」是人工智能定制化,深度学习技术最有吸引力的就是它能够产生相对通用的算法,所以在很多的细分领域,比如工业界里面对材料的识别,都非常容易通过深度学习框架在较短时间对大量数据进行训练而实现。
目前,旷视拥有国内外在申专利超过 440 件,是中国拥有人工智能技术自主知识产权最多的企业之一。孙剑曾在接受机器之心采访时提到旷视作为一家创业公司的贪心——不管是前沿技术的研究还是工程化,「(旷视)都要,而这也是最好的方式,我们付出很大精力和资源来研究和提升本质方法,本质方法的提升会传导到产品上去,比如精度更高了、速度更快了。这方面不能短视,必须短期、中期、长期(目标)都有。」
孙剑表示,公司在研究方面主要在集中在四个视觉理解核心问题上:图像分类、物体检测、语义分割、和序列学习。研究的技术路线则一直是彻彻底底的深度学习:1)使用深度神经网络;2)尽最大可能使用端到端(end-to-end)学习。
和其他大部分人工智能创业公司一样,众多研究成果离不开一支能力完整的顶尖人才团队。旷视研究部门的第一批「战士」来自于信息学竞赛 ( NOI/IOI ) 和大学生程序设计竞赛 ( ACM/ICPC ) 的选手们,此外,团队背景方面也开始越来越多元化,「以前做视觉的,也有做机器学习的,既有研究基本问题的,也有专注特定应用的。」在孙剑看来,一个多样性的环境也能帮助团队看问题更全面。
由此,研究科学家和全栈人工智能工程师,成为公司最为核心的两个团队培养方向。孙剑解释说:「研究科学家主要聚焦在算法上,寻求对问题的本质解,我们的培养目标是成为能独挡一面领域专家;全栈人工智能工程师是我们内部的叫法,目的是培养即能上九天揽月(算法设计和训练),又能下五洋捉鳖(算法的工程化,研究问题和方式系统化)的全能战士,他们既能做 research , 又懂 system,能建系统、造轮子。」据官方描述,旷视团队累计获得国际人工智能技术评测冠军 10 余项;获得国家、国际级信息学金奖人员超过 70 人次。
「我们知道人工智能最终的结局可能很诱人,但是在到达终点之前人工智能的发展还会有非常多次的迭代。所以本质上人工智能创业和投资还是需要回归到技术本身。」印奇在今年 6 月的一次行业大会上谈到。