讯飞语音输入法一夜爆红,除了其本身数十年来的低调努力,或许还是第三次AI浪潮的一个缩影。
讯飞:典型创业成长史
1998年,科大讯飞创始人刘庆锋在“国家863 ”比赛中拿到了第一名,与导师王仁华一起决定创业。然而,路程是漫长而艰难的,从最初的中国科大中银天音智能多媒体实验室,到成立安徽硅谷天音科技信息有限公司,为了省钱,他们甚至连一个电脑显示器都舍不得换。
经历了一年的高额亏损后,1999年底公司正式更名为科大讯飞。拿到了3000 万融资,刘庆锋开始跟中科院声学所、社科院语言所、清华等研究机构都成立联合实验室。这一步,讯飞整合了做语音的源头资源,为后来的发展打下了基础。
小编炮:国家高技术研究发展计划(863计划)是中华人民共和国的一项高技术发展计划。这个计划是以政府为主导,以一些有限的领域为研究目标的一个基础研究的国家性计划。
讯飞商业模式第一次形成叫“iFly inside”,模式基于科大讯飞为联想“天禧”电脑提供语音合成技术支持,此后科大又先后接受了来自复兴集团、英特尔等公司的早期投资。
2004年科大讯飞进一步在IT市场发力,签约华为后,这个团队面临了许多在实验室时不曾有的问题:实验室状态的产品,在稳定性、工程化上面,如何满足真正大规模商用的要求。而华为几近苛刻的标准,让他们把这个过程形容为“脱了一层皮”。但是正这一层皮脱掉了以后,之后再有谁测系统,讯飞从来没倒过。
2002 年到 2005 年,讯飞将它叫做“弯曲的直线”,因为犯过无数的错误,走了无数的弯路。做过电话访问的“有声Email”、解决老师和家长之间的沟通问题“老师家长一线通”、语音选彩铃的“声动彩铃”、在线K歌的平台“爱吼网”、把书本内容读出来的“会说话的书”……尽管有很多不完善与错误的存在,但如果没做当时那些疯狂的傻事,就没有讯飞今天的发展。
讯飞输入法诞生在2010年。iPhone4发布的那个晚上,因为思考到手机屏幕小不方便打字的问题,他们试着做了一个包含语音手写还有拼音功能的demo。后来通过对市场进行研究和分析,一个几人组建的小团队就在杭州封闭开发了三四个月,终于在10月28号对外发布了第一个版本。
小编炮:讯飞的团队,从最早的只有几个人的小团队,现在发展到包含完整职能的二百多人团队,就是一部典型的创业公司成长史。
什么样的优势能叫创新
这些年来讯飞语音输入技术的突破可以分为三个阶段:
第一个阶段,2010年刚推出的时候,识别率初步达到使用门槛,字正确率还不到80%;
第二个阶段,随着用户越来越多,积累了大量的数据,通过大数据的训练驱动,识别效果稳步提升,能够到达90%以上。
第三个阶段,2012-2013年,使用了深度学习算法,再结合大数据的训练,正确率有了更大的突破。
语音输入法一夜爆红并非偶然。
2006年,随着Hinton提出的深度学习的技术,以及在图像、语音识别以及其他领域内取得的一些成功,第三次人工智能的浪潮来袭。2016年,人工智能的概念更是快速火热起来。
“如果说,在50、60年代和70、80年代那两次(人工智能发展期),中国企业还没有办法和外国企业在技术上相比的话,那在这次(发展浪潮里),我们完全走在了前面。”科大讯飞的轮值总裁胡郁在接受采访时表示:相比于传统的高新技术,中国在人工智能领域是有优势的。
小编炮:因为地域语音的差异,语言之间的壁垒会有多高可想而知。960万平方公顷的中国,自然有它的本地优势……
不过,胡郁也承认,相对于美国很多人是真正从理论的角度进行非常深入的探讨,中国对人工智能更多的认识是落在应用特性和娱乐特性上。
美国所谓原创性的研究,是从理论的根基出发,建立一套完整的思维方式。而有许多理论研究的东西是不会产业化的,没有产业化价值的,它只是一种哲学化的思考。哲学会产生真正的创新,一种是在最原始的技术上创新。而这些东西,中国几乎没有关心过。
“现在学术界可能因为要和产业界对接,做了很多技术层面上,和应用相关的创新。而产业界还没有能力,来做整体性、系统性创新的工作,比较少。所以我觉得这就是我们和美国相比有差异的所在。”
巨头围城,AI大战开打
讯飞从语音这块具有本地化优势的市场切入AI形成了领先优势,但也面临着国际巨头的围城,国际层面的AI大战其实早在悄悄酝酿。自2011年以来,苹果、谷歌、微软、英特尔、IBM、雅虎、eBay、亚马逊、AOL、Facebook、Twitter、Salesforce和甲骨文等巨头一共收购了140家AI公司。
谷歌:
不管是早前一口气收购7家机器人公司——Schaft、Industrial Perception、Meka Robotics、Redwood Robotics、Bot & Dolly和Holomni,还是默默吞下围棋大战中一战成名的Deep Mind,又或今年再次收购了聊天机器人创业公司API.AI……谷歌在自家旗下的多项服务中投放了AI技术。
英特尔:
2015年10月,英特尔收购了AI初创公司Saffron。2016年5月,收购了专门从事计算机视觉(CV)算法的初创公司Itseez。
此外,英特尔还花费4亿美元收购深度学习初创公司Nervana Systems。作为芯片制造商,英特尔想要通过Nervana Systems在硅层实现机器学习,而不是在图形处理芯片上发展机器智能。
苹果:
尽管苹果很少讨论他们的收购案,但2016年,苹果先后收购了AI初创公司Emotient、专注于用于智能手机的AI技术的Perceptio和VocalIQ、西雅图初创公司Turi和其服务于开发者和数据科学家的机器学习平台。
近日,来自卡耐基梅隆大学的罗斯教授更在Twitter上公布了自己加入苹果的消息,未来他将组建并管理面向未来的苹果AI团队。
三星:
10月初,三星宣布收购 Viv Labs。这家致力于打造开放式人工智能助理平台的初创公司,创始成员正是曾帮助苹果推出语音助理 Siri 的幕后功臣——Dag Kittlaus、Adam Cheyer 和 Chris Brigham。
和谷歌助手一样,Viv也采用了机器学习技术。作为消费电子巨头,三星旗下有大量产品可以搭载Viv,加强其的个人数字助理领域的动作。
微软:
2016年,微软花费2.5亿美元收购了总部位于伦敦的初创公司Swift Key,其产品可以让键盘输入法学习记忆用户的输入习惯,并做出相应调整;6月末收购了自然语言信息平台Wand实验室,来让他们专注于微软产品;8月份收购了一个拥有AI技术的智能日程工具的初创公司Genee。
这些公司都将为微软带来他们的专业知识,但本身的产品项目被叫停,可能是为了更深度地集成其智能助手Cortana和Outlook等应用。
Twitter:
2014年,Twitter收购机器学习初创公司Madbits;2015年,Twitter收购Whetlab公司;2016年,Twitter更是花费令人瞠目结舌的1.5亿英镑收购了伦敦初创公司Magic Pony。
首席执行官Jack Dorsey在今年的收购声明中表示:Magic Pony团队研究创造出了可以识别图像特征的算法,其技术将用于提升我们在直播和视频的能力,并为Twitter打开了很多激动人心的创意可能。
Salesforce:
2015年6月,Salesforce收购了智能日历应用Tempo.ai,12月又收购了AI虚拟助理AILA的开发者Min Hash。今年还收购的开源机器学习服务器和开发者社区PredicitonIO以及致力于机器学习分析的初创公司Beyond Core。
首席技术官Adam Evans在接受英国的Computer world访问时说:Salesforce对AI技术非常感兴趣,我们已经从记录系统转变为参与系统,而现在我们正向智能系统进军。
小编炮:各大巨头的举措,都从侧面反映出AI时代到来。未来,以AI为基础的虚拟助手将大大改变人们使用电子设备的方式,一旦使用方式改变,人们手中的设备也会经历大的更新换代。在这巨大浪潮中,中国公司如何利用优势杀出一条血路,让我们拭目以待。