微信语音输入不仅仅是懒癌患者的福音

之前分析过微信里面的一个声音锁功能,在登录微信账号时可以用声纹密码替代字符密码,说说话就能登录。笔者从微信推出就开始使用,从塞班时代到安卓、iOS、PC时代,见证着这个APP的5年。

 

我特别想聊聊微信的语音输入(录音转为文字)功能,咱把语音输入、图片、小视频、红包等放置的位置称为功能面板。从前的版本你可以看到这个面板有个+号,这个面板可以拓展更多的功能,把其他APP加进来。慢慢地,你会看到有些功能没有了,+号也没有了,但上了红包、转账、小视频、卡券。语音输入,2013年3月份上线,至今将近2年仍占据功能面板的一席之地。这不禁让人想知道,它的价值在哪儿?

微信语音输入不仅仅是懒癌患者的福音_第1张图片

方便输入文字,补充微信使用场景

微信因为主打语音聊天而深入人心,但试想你正在陪同领导开会,虽然不需要发言但总要保持庄重,假如女朋友这时发来语音微信,你哪方便常常拿起手机来听呢。而女朋友正好在脸上敷黄瓜不方便长时间打字,那她就可以用语音输入。而你静静地看着屏幕就可以啦。尽管还不能识别粤语等方言,但普通话的识别率已经非常高了,这样聊天法,懒癌患者可该乐开花了。

 

语音聊天(也就是录音)需要手一直按住“按住说话”按钮,语音输入只需要点按一次就能输出文字,让你的双手更空闲。这也是智能语音带来操作次数减少的便利。

 

醉翁之意,剑指语音交互

现在国内许多应用都已经加了语音输入,例如:讯飞输入法,后面百度和搜狗也开始纷纷涉足语音助手产品。百度自主研发,而搜狗也开始自主探索,而微信推出该功能应该感受到这个市场前景,也开始尝试涉足这个领域。

 

现在我们得区分下两个“语音”:一个是录下声音传送给朋友听,一个则是把声音转成文字发给朋友看。虽然是呈现的结果很简单,就是一段录音、一段文字,实现起来却不容易。为了让用户能即时聊天,上传到服务器的录音大小就需要被压缩,并保证话质受到较小影响。而语音输入则牵涉到语音识别,需要此前收集大量的语音数据(包括不同人的、不同口音的、不同环境背景音的等等)来训练一个大型的数学模型(神经网络模型),为之设计更高效的算法,最终才能提高识别率。目前语音产业的普通话识别率普遍在90%以上,行业顶尖的科大讯飞、灵犀云则是95%。识别率越高需要微信用户自己修改文字的机会就越少,输入完请直接点发送,赞赞赞O(∩_∩)O哈!

微信语音输入不仅仅是懒癌患者的福音_第2张图片 

也许目前来看该功能并没有获得用户的青睐,毕竟市面有非常多优秀的输入法,但腾讯完全可以利用现有微信庞大的用户群积累语音数据,有助于提高语音识别率,这为涉足语音的腾讯,打好了语料积累的坚实基础。

 

腾讯是在为以后其他产品做准备,如腾讯语音助手,或者腾讯语音输入法等等,谷歌、苹果等国际巨头高度重视语音交互,腾讯及时跟进,这是大势所向。说到底,这是腾讯在布局未来语音交互,迎接无屏幕时代的核心交互方式!

微信语音输入不仅仅是懒癌患者的福音_第3张图片

这让我联想到2013年另一大事,中移动与语音交互巨头科大讯飞结成战略合作伙伴并入股讯飞。尔后共同建设灵犀云智能语音平台,为各色应用提供语音能力。运营商也加入其中!?【吃惊】

 

我想,语音交互将是下一个风口!正如雷布斯的飞猪理论:站在风口上

你可能感兴趣的:(微信语音输入不仅仅是懒癌患者的福音)