原帖地址:http://heamo.blog.sohu.com/161745443.html
昨天参加了一场科大飞讯举办的发布会,这是让我比较兴奋的一场发布会,甚至不亚于9月份见到乔布斯的激动。应该是我这两年来唯一感觉有意思,愿意听到最后的一场产品发布,原因正是技术的魅力。
发布的产品叫“云语音”,与现在很多人讨论虚无的云计算相比,科大讯飞的云语音是很实在的云计算例子,你可以现场就能体验到语音输入、语音合成、语音搜索带来的技术快感。
【安装这个输入法之后可以在所有输入的地方启用】
对科大讯飞这个公司,也许你和我一样,听着很陌生,就像我第一次听到他们PR人员邀请一样,还反复求证了一下是哪家公司。后来让我有去看看冲动的是他邀请的两位嘉宾,一位是中国科协名誉主席周光召老先生、在我之前就职于一家科技杂志社的时候,久仰过老科学家的大名、另一位则是联想董事局主席柳传志先生。
其实,对科大讯飞公司,我们很多人实际上是使用过他的技术的,比如我们在拨打中国移动、中国联通客服的时候,自动应答客服自动合成的语音技术就是来自这家公司,这是一家源自中国的世界级顶尖语音技术公司,占据国内80%的市场,有11年历史,已经上市。
即便这样,他还是提不起我更大的兴趣,但是他今天展示的一个核心应用让我不得不佩服,他们这次推出的“云语音”主要是定位在移动互联网应用的,也就是我们用手机上网的时候会用到,最典型的例子就是语音输入法,现在已经有支持Android和iPhone版本的Beta版输入法。
【座无虚席的会场中大部分人在探着头认真听 在国内产品发布中很少见此情景】
在科大讯飞董事长刘庆峰博士的发布演讲中,展示的几项应用让我非常佩服,特别是在输入方面,现场就是用一台Android手机演示,随便说出一些日常的话语,就可以很快地输入为文字,这些语音识别的方法是将手机接收到的语音信息发回到云服务器后发回出文字结果。直到发布会结束后,我都有这样的疑惑,刘董事长现场演示的内容肯定是事先准备好的,所以准确率是百分之百,后来回家亲自下载Android版的讯飞输入法在Nexus One上试用后,不得不佩服,想我这样发音不是很准的南方口音,识别率都是很惊人的,而且可以自动识别短句。
除了这一项,其实刘董事长介绍的另几项应用也非常具有实用性,比如:
一、语音搜索 只要搜索一个关键词,比如一个人名,他可以搜索到内容中含有这个人名的视频。
二、语音客服系统 我们以后拨打10086或者10010的客户号码不需要听一下然后拿开手机选择按键到下一个菜单,只要说话告诉客服系统,选择什么操作、返回上一级菜单等就可以了。
三、语音模拟 现场随机模拟一段中央电视台新闻联播播音员李瑞英的声音,惟妙惟肖
四、语音遥控器 这个应用最常用的地方是在IPTV电视,只要在遥控器上添加一个按键,就可以用这个按键来输入语音,操作电视,可以拿着遥控器直接说话寻找某个节目。
此外,还了解到科大讯飞有几项了不起的成绩:
一、用于普通话级别考试的自动打分系统就是他们做的,因为这个涉及到个人的就业,所以要大大实用的标准,是要求非常高的。
二、从2005年起,科大讯飞在国际上的多个语音技术竞赛中比欧美日本的公司还要牛,曾经多次获得冠军,竞争对手就包括Google、苹果、IBM这些国外的科技巨头。
在刘博士的介绍中,观众曾多次自发地多次响起掌声,而且知道最后都很少有人提前离开,我想大部分人是为这种出色的技术所迷住了的。
那科大讯飞这家公司到底是什么来头呢?后来了解原来是源于安徽中国科技大学,里面的大部分核心技术人员,包括前面提到的总裁刘庆峰董事长,都是来自安徽的中国科学技术大学,也就是大家所熟知的有少年班的那所知名学校。
【我们熟悉的这些3G应用实际上都渗透了中文语音技术】
语音识别方面,其实使用过Android或苹果手机的用户已经体验到苹果和Google提供的技术了,但实用性还不是很高,科大讯飞的语音输入法可以说完全达到了实用阶段,这也是为什么令我震惊的最大原因。
在中文计算机化方面国内还有一个出色的企业是汉王,汉王的长处是在手写方面,2009年当我第一次用到汉王的多字手写识别技术时,也是非常惊叹,现在看到科大讯飞的语音识别技术,深感技术发展之神速,也为这是我们国人开发的技术而自豪。
很难想像,有了这样易用的语音输入技术,有多少我们不能使用拼音、笔画甚至手写输入信息、上网的父辈们都可以享受到互联网带来的信息便利了。
如果你也像我一样对此感到十分惊艳,先来体验一下Android平台的讯飞输入法: