初学者在使用拼音输入法时,因为缺乏指导、随意输入,使得不少人养成了不好的输入习惯,陷入了拼音输入的一些误区,比如整句误区、联想误区和简拼误区。现在将对这些误区进行逐一剖析,以求规避之道。
1. 整句误区
现在的拼音输入法常常被称为智能整句输入法。人们在描述输入法发展历史的时候,也常常说从字到词到句。从理论上来说,更大的语境更有利于提高音字转换的正确性。从算法上来说,通过长期的积累,已经有成熟的隐马尔科夫模型。从硬件上来说,CPU、内存、硬盘等性能大幅提升,价格大幅下降,已经不是问题。加上互联网的成熟,更可以利用大厂服务器的资源和大数据来提升智能整句输入法的能力。从用户的角度来说,使用整句输入可以没有分词的负担,还可以少按大量的空格,只需要练熟 400 来个音节拼式,只管一个劲地击键就行了。似乎一切都完美了!
然而,实际情况却让人大跌眼镜,绝大部分人并没有以整句为单位来输入,真正采用整句输入的人其输入的效率也并不高。最能称得上整句输入法的微软拼音整句模式,可以算是技术上的精品了,但是采用的人并不多。微软拼音在面对搜狗、百度等利用搜索引擎和网络词库的次整句输入法时,显得力不从心,用户数量越来越少。所谓次整句输入法是指它遇到空格和标点符号就会上屏默认转换结果,而并不是要等到一句话输入完成才确定转换结果,介于整句模式与字词模式之间。为什么会出现次整句输入法大行其道的局面?这难道不是一种倒退吗?难道用户都这么愚昧吗?整句输入的问题出在哪里?问题出在以下几个地方。
(1) 编码效率低
拼音作为编码来说,编码效率太低,导致平均码长过长,超过了三码。汉语拼音的设计初衷是用于注音识读,所以遵循了音素化和国际化的原则。在这些原则的指导下,由于普通话自身的特点,使得拼音字母的利用效率很低,存在大量冗余。从编码的角度来说,用 26 个字母表达 400 个音节,每个音节只需要不到 2 个字母,因为 26×26=676,可用的编码空间远远大于 400,而汉语拼音却用了超过 3 个字母,所以效率会低。
(2) 确认成本高
整句的转换结果在输入的过程中可能会不断地发生变化,所以不到输入结束是不能判断其正误的,能够判断正误的只有输入的拼音串,拼音串不会发生变化。然而拼音并不是文字,人们对它的识读能力是很弱的,最多只能快速找出刚才输入的一两个音节的错误。因此,在输入过程中,最多只能做到输入的拼音串尽量不要出错。在一句话输入完成后,用户不通读一遍转换结果,是无法知道对错的,即使结果完全正确,这一步都是少不了的,而且句子越长判别正误的成本越高。
(3) 回改成本高
如果在上屏前确认时发现了错误,就需要进行回改。错误可能发生在一句话的任何位置,可能是转换结果有错,也可能是输入的拼音串有错。发现错误的位置后,需要先定位才能修改,其定位方法一般是用左箭头键逐个音节向前移动,用右箭头键逐个字母向后移动。箭头键的位置远离本位键,操作跨度大,缓慢、费时。还有一个少用的方法是用 Ctrl 加字母键来定位,其特点是用键次数少,但是操作难度大。
(4) 残错概率大
不少人习惯于在输入过程中监视转换结果,在输入最后一个字词时就不再观察转换结果,然而可能会正是这最后一个字词又导致前面已有的结果发生变化,导致错误。这种错误,用户往往不容易发现,使得残错率升高,因为他不自觉地会认为,前面是正确的,最后一个选择也正确的话,就不会有错了。另一种情况是,明明知道还有错误,但是因为觉得修改太麻烦了,就不愿意修改而直接上屏了;这在打字比赛之类的紧急场合和聊天之类的不严肃场合是很常见的。
有鉴于以上原因,拼音输入应该以字词为单位而不是以句子为单位。实际上,除了极少数死心塌地的整句派,大多数人也是这么做的。先进行正确的分词,然后按字词进行输入,可以在一定程度上同时克服以上四个问题。在输入字词时可以适时地使用简拼,从而缩短码长,提高编码效率。字词的长度一般不会超过四个字,确认和回改的成本会大大降低,错误更容易发现和修改,残错率也会减小。
我们现在举两个例子来加以说明,使用的是搜狗输入法。都采用两种方式来输入,一种以整句为单位,另一种以字词为单位,后者不便于截图就没有附图了。在拼音串中,阿拉伯数字表示选择,_
表示空格,.
表示翻页。
例子 1(22 字):中文输入法是在信息社会必须使用的重要工具之一
整句(65 键):zhongwenshurufashizaixinxishehuibixushiyongdezhongyaogongjuzhiyi2
字词(55 键):zhongw_srf_s_z_xinx_sheh_bix_shiy_d_zhongy_gongj_zhiyi_
例子 2(16 字):声笔系列码是顶功输入法的典型代表
整句(64 键):shengbixiliemashidinggongshurufadedianxingdaibiao.2..32..4.3..23
字词(52 键):shengbi.43_xil_ma.2s_dinggong.42srf_d_dianxing_daib_
可以看出,即使在例子 1 完全输入和转换正确的情况下,整句方式的用键都更多;在例子 2 转换错误比较多的情况下,就更是如此了。如果例子 1 中【在】字的拼音误输成了 za,那么麻烦就大了。
这时,要么按 15 次左箭头键定位到 za 之后追加 i,要么先选中 za 之前正确的【中文】【输入法】【是】三个词再想法修改,此时显然后者划算一点,按此操作后的情况如下。
此时,按 Home 键先定位到 za 之前,再按两次右箭头键定位到 za 之后,追加 i 后,总算是修改正确了。
可见,定位修改过程之繁琐。更可悲的是,许多人还根本不知道这种定位修改法,搜狗的官网帮助都没有介绍。于是使用者往往是将错就错,或者是上屏后再来修改。如果是以字词为单位输入,那么在输入【在】字时一般只用声母加空格就行了,或者在输入 za 后立刻就可以发现错误、进行纠正了,绝不会变得如此积重难返。
搜狗、百度等输入法还都支持按住 Ctrl 键 + 字母来进行音节首字母定位,重复按加按同一个字母则定位下一个以此字母开头的音节。这样,上例只需要按 Ctrl+x 就可以定位在 za 的后面了,可以少许多次按键。
然而,对一般的人来说,加 Ctrl 的复合键操作难度是很大的,很容易按错键,也不是很实用,不能改变整句方式不好用的本质。
2. 联想误区
在使用默认开启联想的输入法(例如百度手机输入法)时,有的用户不自觉地会养成单字加联想的输入习惯。在没有指导的情况下,对于初学者来说,逐字输入,选择重码上屏后,根据联想来再次选择所需要的字词是最为轻松的路径。这种输入方式在不用分词这一点上与整句输入是类似的,是初学者喜欢的原因之一。
不少初学者觉得,汉字输入不就是输入汉字吗?于是,输入一个音节后就看看有没有自己要的字,没有的话翻页再找直到找到为止,然后选择上屏。上屏后发现输入法居然提示了自己想要的字词,心中大喜,毫不犹豫地再次选择上屏,就这样逐步对联想产生了依赖。由于依赖的缘故,即使在当前页没有提示出自己想要的字词,即使输入法没有收录,也会不自觉的翻页去查找,在尝试多次找不到以后,才会重新输入字的拼音。以上过程周而复始地进行,便陷入了联想的误区。
现在以百度手机输入法举例来说明一下单字加联想的输入方式。由于单字重码多,而且联想的内容也可能很多,所以需要大量费时的查找选择操作,输入效率很低。
例子:联想误区
操作:在输入 lian 后,首页找到了「联」字。
选择上屏后,在首页又找到了「想」字,再次选择上屏。
在输入了 wu 后,首页并没有「误」字,需要下拉翻页才能找到。
选择「误」上屏后,首页找不到「区」字,需要滑动翻页查看才能找到。
实际上,以上例子直接用词组来输入是非常简单快捷的。输入 lianx,在首页就出现了「联想」。
输入 wuqu,在首页就出现了「误区」。
可喜的是,大多数拼音输入法已经意识到了这种联想输入方式带来的问题,所以默认大都不会开启联想功能,有的甚至取消了这个功能。不过,一定要提醒用户,注意避开这个误区。
3. 简拼误区
有些比较聪明的初学者,特别是那些韵母掌握不太好的,会陷入简拼的误区。他们发现许多词组只要输入声母就可以出来,于是希望尽量利用这个 “窍门” 来节约用键,避免输入韵母,养成了只打声母,然后进行查找选择的习惯。
我们以百度 PC 端拼音输入法为例来说明。
在输入「我们」「他们」「可以」之类的词组时,一般都只需要输入两个字的声母就出来了,而且往往是首选。
但是,如果输入「简拼」,只输入声母的话,重码太多,在第 16 页上还是没有发现。
即使补全「拼」字的韵母后,也要在第 4 页上才会出现。
所以,虽然简拼有的时候能够大大节约用键,提高输入效率,但是运用不好的话,也可能适得其反,更不能教条化地无条件使用。至于如何正确使用,我们将在讲到拼音输入技巧时详细论述。