为了解决宇航员在空间站上吃饭的问题,科学家设计了微波炉,如今已成为了每个家庭必备家电。网上传得神乎其神的云计算技术,现在居然被搜狐公司用来开发搜狗云输入法,放在我的手边。
我记得电脑刚进入中国的时候,最大的障碍就是怎样把汉字输入到屏幕上。汉字不是简单的拼音文字,仅从造字法上来说,就有象形、指事、会意、形声、转注和假借这六种之多。一个成熟的汉字输入法要做到易学、低重码率、输入速度快和输入错误少。这么多年来,很难看到输入法的水平有太高提升。
再来回顾一下汉字输入法的发展史,可以把它们分为形码和声码这两大派系。形码最具代表性的是五笔输入法,这种输入法难以掌握,并且拆分汉字的方法没有严格遵循汉字构造原理。以拼音输入法为代表的声码在汉字输入法普及上做出了巨大贡献,不过高重码率影响了输入速度,输入错误也很多。
怎样去改变这种局面?行业内有人尝试用人工智能技术改进拼音输入法。虽然在技术方面并没有完全解决所有问题,但还是占据了大部分人的电脑。当时搜狐公司推出的搜狗输入法就是一种智能拼音输入法,上手快、速度快,并且输入错误少。
智能输入法是建立在海量词汇库和语义逻辑库基础上的,按照这种思路发展下去,每次提高意味着占据更多的硬盘空间和CPU资源。显然,搜狐的工程师们意识到还需要另辟一条新路,于是才有了以云计算为核心的搜狗云输入法。
搜狗云输入法也是一种拼音输入法,在降低重码率的方法上拥有和人工智能技术相近的解决方法,即三元模型和trigger模型。每当输入一个字或词汇的时候,电脑将根据语言的前后逻辑找到最匹配的词放在首选位置。使用该技术,则必须要庞大的语言库和语义逻辑库来支持,这时候云计算就能发挥其威力了。
简单地说,云计算是使用网络服务器上的数据存储和计算能力为本地计算机服务的一种体系。搜狗云输入法将大量数据存放在网络服务器上,使用WEB浏览器的插件作为客户端。用户的计算机在输入时通过客户端将请求送到服务器计算,服务器最后返回几乎完全正确的匹配结果。这种方法所带来的主要优势可以总结为下面几点:
(1) 输入的正确率高,语义正确率提高到90%,短句的覆盖率和首选率更是提高到了96%以上。
(2) 节约用户电脑的硬盘占有率和CPU占有率,仅需要安装浏览器插件,消耗少量网络带宽资源。
(3) 跨平台支持,同时为Windows、MAC、Linux等操作系统提供了汉字输入解决方案。
(4) 词库更新快,随时能将网络上最流行的词汇和短句纳入到服务器的词库中。
(5) 输入速度提高,普通人也能达到每分钟输入100~200字速度的水平。
五笔字型的出现创造了"打字员"、"速录员"等新职业,拼音输入法的出现创造了"美眉"、"大虾"等新词汇。那么搜狗云输入法又会来带什么,我们拭目以待。