出走的门徒之五—云知声 黄伟:AI热终会冷,要跑的比任何风口快

 在阿西莫夫的代表作《基地》中,除了先知谢顿贯穿全线,其他主角都是门徒。他们内在为直觉所驱动,外在被时代所推动。他们在历史上的出场毫无征兆,却在潮流中游刃有余。你会惊叹,为什么是他?

    离开谷歌、微软、IBM、Facebook、阿里、百度,告别自己过去的所有荣耀,重新走上创业之路,崇尚技术的护城河。为什么是他?新华网开辟“出走的门徒”系列,讲述这样一群科技界理想主义者的现实路径。

129467982_14863489353281n.jpg

    新华社上海2月4日电(记者周琳)2004年黄伟从中国科技大学毕业时,正好赶上第二次人工智能浪潮临近破灭的尾巴,却同时又是语音识别行业第一个风口到来不久的时候。2005年,全球领先的语音识别公司Nuance上市,市值最高突破90亿美元。3年后,黄伟所在公司的语音识别部门被Nuance收购。

    这个本是实现计算机听觉为强人工智能服务的领域,却在AI趋冷的时候大热,更说明了技术的不可预见性。

    近15年过去,这种戏剧化的变化再一次出现。尽管出现了AlphaGo横扫围棋界等标志性事件,让AI这一行业在2016年开始红得发紫,尽管2016年老罗在发布会上show了一把计算机听觉的精准性,亚马逊的语音助手Echo Alexa销量狂飙了三倍,我们却已经很难得出,语音识别已经站在了AI创业风口浪尖这个结论。

    当年和黄伟一起学习或共事的人,很多人都离开了这一行业。固守判断、等待爆发是一件很考虑耐心和实力的事情。

    谁也不知道下一个风口会什么时候流行;技术也并非是唯一的护城河;但是,语音识别正确率的不断提高,解放人类双手是大势所趋。这恐怕是黄伟在经历过摩托罗拉、Nuance、盛大、创办云知声之后,能最坚定的信念。

    逆风反击:AI领域“模仿者必死”

    云知声于2012年成立,也是在那一年,Siri开始支持中文。

    语音识别领域的厮杀在这些年显得非常激烈。国外,谷歌、亚马逊、微软都通过技术积累和收购初创公司,杀入战局;国内,百度凭借着在AI领域的提前布局独自拼夺,和黄伟师出同门的科大讯飞更是成立十多年,属于行业当之无愧的老大。

    2012年前后,正处在AI第三次兴起的交替期。那时候,科大讯飞还没有成为网红、AlphaGo还没有惊艳亮相,市场对人工智能最火热的讨论仍然来自于科幻电影。

    后发却想要先至,信心是最重要的催化剂。在那时,极少有创业公司敢把所有身家赌在“深度学习”这件事情上。

    云知声做的第一件事,就是把深度学习应用到了语音识别里,而且把它开放出来提供给了第三方。

    2012年9月,云知声发布了基于传统统计模型的第一代引擎,准确率上升到了85%,比当时的讯飞高出5个百分点。但想要再优化,就必须要有迅速获得大量、免费的数据。于是,云知声开放了自己的平台,任何人、任何组织只要在平台上注册,就可以免费使用公司的SDK(软件开发工具包);在APP里接入这一SDK,就可以免费调用云知声的语音服务。

    凭借着免费这一法宝,到2013年底平台上接入的企业客户数量达到接近一万家。现在,企业客户数达到了3万家。快速的数据积累,让云知声进行了一系列数据迭代和算法优化,将识别的准确率提升到了97%。

    但再好的技术,只有当它变成对用户有价值的产品时,它才有商业价值。既便技术过硬,留给后来者的机会仍已不多了。

    第二步到底应该怎么走?做APP?流量的导入掌握在BAT手里,你不可能再用那么低的价格去实现基础设施(用户)的积累;做与科大讯飞雷同的业务?也很难从成熟的大公司手中去抢蛋糕吃,更何况在教育等领域,讯飞的优势地位几乎是无法撼动的。

    “有行业第一,并不可怕。”黄伟意识到,任何一个公司,有它的沉淀,就有它的包袱。大公司受制于股权等因素,对很多新领域很难快速反映。必须找出一条和行业老大不一样的路,而且向投资人证明这条路在商业上是可行的。

    2012年底的很多科技新闻中都曾展望:苹果会开发一种语音的方法解锁pad,而非现有的按键。最后我们发现这一功能在家电上更早出现。“我们根据用户场景倒推,未来用户的形态应该是,比如,在客厅的沙发上,自然与空调对话,而不需要凑上去和它交流。”黄伟说。

    随后,在乐视TV上、美的空调、抽油烟机上,语音助手迅速落地。回过头去看,其实只用了2年的时间,云知声就将自己的基础语音识别引擎落地并步入正轨,再用数据反哺算法,不断将其客户从家电拓展到医疗、汽车等其他领域。

    对于黄伟而言,产品想要复制到任何需要文字录入的行业,司法、传媒等,就没有太多不确定性了。“我们最后证明了:一,BAT之下确实还有别的路。二,行业老大之外这条路确实是可行的。”黄伟说。

    顺风快行:手机不会是语音识别“主战场”

    2014年,黄伟第一次提出了自己的“云端芯”概念,将公司定位于“一个IoT(物联网)时代的语音AI服务商”。为了做物联网,云知声在2014年引入高通成为战略投资方;同时进行内部架构的调整,成立了IoT事业部,占当时总人数的一半以上。在2016年AlphaGo还未火起来的2月,云知声又成立了AI Lab。

    黄伟介绍,公司云端芯的服务分三种:1)有芯片级技术,比如说冷唤醒和打断等;2)有终端软件的交互层面,比如开车时万一网络不好,我们还有纯离线的方案;3)还有一些复杂的请求走云端。最后的解决方案是考虑了有网络、无网络等所有环境,并不是只卖一个芯片或者云端 SDK 。

    有了这样的安排,芯片不仅可以收集信息,还可以承担一部分智能的功能,解决基本的需求。

    这看起来并不是技术的颠覆。然而对于一个创业公司而言,如何确定你的商业模式和产品模式,如何建造你自己的壁垒,恐怕是技术之外更重要的考量。

    对于这些模式的确立,黄伟的思考模式值得探究。传统而言,大家的思维模式是“做什么”;而笔者接触过的人中,有两个人并不是这样。一个是喜马拉雅的余建军,他的说法是“踩过了所有的坑才成功了”;另一个就是黄伟,他给人的感觉是“先考虑什么坚决不能做”。这种归纳和排除的出发点,和旁人不同。

    2012年-2014年,黄伟坚持的是“不做APP”。到了2014年确立了“云端芯”战略,他又有两个排除:不能只做联网方案、不能只做手机方案。

    很早黄伟就认为,手机从来就不是语音识别的主战场。你肯对着音箱、冰箱、马桶、抽油烟机说话,即便这些用品没有屏幕。但手机还是基于屏幕的,它更常用到的交互方式是“触碰”而非声音。

    市面上很多在做智能家居的公司还是基于APP和手机的,例如将家电联网,在用手机来控制操作。而横扫欧美、被称为亚马逊“翻身之作”的Echo Alexa则是一个用音箱来连接的中控平台。

    “智能家居人机交互的正确做法恐怕最后不会是APP。”黄伟说,它可能会是一个全新的增强设备,甚至最终取代手机。不过与亚马逊从中控开始做的方法不同,云知声还是希望先从终端渗透率不断增加着手,培育用户的习惯。

    作为语音助手,Alexa看起来似乎是所有语音识别公司的竞争对手。黄伟则认为并不是。

    “亚马逊肯定不是我们的竞争对手,合作机会是大于竞争的。”黄伟说,从智能层面,国外的云服务商在国内落地是很难的,而在亚马逊本土化的落地方案等方面,都是有合作机会的;在云端服务上,很多技术都可以由云知声来提供。

    一个成功的企业,始于技术,兴于商业,却久于管理。“当时间到了2016年时,AI公司还在讲算法、讲评测,只会非常不成熟”。黄伟说,没有纯粹的AI公司。只有技术和行业结合,将技术、数据和商业闭环打通的公司,才是一个健康的公司。在人脸识别、云服务等任何一个细分领域,最后都只会有少数几家公司能胜出。

    摆脱风口:技术并非唯一护城河

    在《乌镇指数:全球人工智能发展报告(2016)》中,云知声以6000多万美元的融资规模,排名在全球AI企业融资额榜单第19、中国第三(另外两家分别是碳云智能和出门问问)。

    但即便融资了这么多钱,此时你如果打开云知声的官方网站,却依然很难体会出“艺术感”。文字放得很大,有的时候一个屏幕上只剩下了导航栏和标题图;首页可以拖动很长,画了很多展示技术的概念图,每张图片连箭头都需要横平竖直。

    这大概已经是理工男对艺术最佳的理解。

    黄伟所毕业的中国科技大学,是国内知名的理工类学校,其最盛产的有三类人:理工男、穿着大裤衩的理工男以及穿着大裤衩、趿着黄拖鞋的理工男。在那里,谈恋爱略等于一起上自习;很厉害略等于可以一学期刷光全套吉米多维奇;优秀毕业论文略等于一篇Nature或Science。

    然而,对技术的极致崇拜,有时候在商业上并不见得是优势。在这个故事满天飞的时代,你的巷子深了,资本还没走到,就会醉倒在半路。曾经在一个科大创业类的群中,“技术和Pr哪个更重要”的话题,几乎百分百都把票投给了前者。

    时间回到2006年。彼时还在摩托罗拉语音识别部门的黄伟,为MOTO最具盛名的“明”系列手机开山之作A1200提供语音技术支持。如今你在百度中搜A1200,还有很多人人网的评测说,“教你怎么语音打电话”。

    在当时识别准确率还不高的情况下,愿意去做这样尝试的人,简直是在刀尖上舞蹈,这得对自己的技术多有信心。

    作为纯正的理工男,黄伟也曾有过“将技术作为唯一评价标准”的时代,但创业数年,他正在不断修正自己的判断。这种管理上的改变和平衡,并非是大学教他的,而是在盛大研究院管理期间体悟出来的。

    从摩托罗拉语音识别部门被Nuance收编,到不愿意只做本土化,前往盛大创办研究院,再到自己创业,黄伟每一段经历,似乎都在刻意补齐了技能树上的短板:在摩托罗拉,潜心做了几年的研发和算法;在盛大,升级了自己管理的技能树。

    “不是说技术不重要,但如果别人技术98分、我96分,这2份的差距不足以决定商业上的生死;而如果其他方面别人做的很好,做到了80分,你只做到了60分,你必死啊。”黄伟说。

    最后创业时,你的资源永远是有限的,不可能每个岗位都招到最合适的人。能够把不同价值观、不同追求的人,集合在一起,将技术和管理结合,最后平衡、平衡、平衡,最重要的事情说三遍。

    黄伟认为,技术在一个公司最终的比重只占到20%。尤其在中国这个市场环境中,光有技术是不够的,要补足很多其他的能力。单一人群创造力是有限的。无论是技术很牛的人,或者没有好的教育背景,但对产品特别有感觉的人,都特别值得学习。

    “过去我们在人工智能领域耕耘,缺少经费和机会。于当时,我们是不幸。而今天人工智能成为科技领域的新热点,对于在人工智能领域坚守多年的我们来说,我们又是如此幸运。”黄伟说。(完)

转载于:https://my.oschina.net/ZZKAJ23/blog/885248

你可能感兴趣的:(出走的门徒之五—云知声 黄伟:AI热终会冷,要跑的比任何风口快)