一、概述
自然码是中文输入历史上影响最大的双拼音形输入法,不少后来的双拼都或多或少地受到它的影响。但是,由于需要同时掌握双音和双形,学习难度还是相当大的。
有没有什么办法降低它的学习难度,同时提高它的效率,还增强它的功能呢?有这种好事吗?答案是肯定的。秘诀就是采用顶功编码技术!这样,可以让自然码用户也享受顶功技术带来的红利。声笔自然就是对自然码的顶功改造,并且取得了非常好的效果。
对于自然码用户来说,学习声笔自然的成本是非常低的,只需要了解一下双拼的变化并掌握笔画即可,其基本内容是:声母不分平翘舌,零声母用 v 表示,韵母没有变化;双形用顺序笔画代替,用 aeuio
分别表示折、横、撇、竖、点五种笔画;重码用 aeuio
兼作选择键;重码太多时,可以追加首字前两笔来快速筛选重码。
本文除了讲解声笔自然外,还将在章末介绍声笔自整。声笔自整是基于声笔自然的整句方案,在使用上比声笔自然还简单得多。理解了声笔自然就很容易理解它,所以仅仅花费少量篇幅介绍就行了。
有关软件的安装与卸载、笔画反查、翻页、标点、符号、词库同步、自定义词典、中英文混合输入、手机操作等声笔系列码共有的内容,请阅读《总体介绍》中的相关部分,这里就不再赘述。
二、优势
声笔自然相比自然码的优势可以总结为:更简单、更高效和更强大。
更简单是因为:首先,声笔自然用 v 表示零声母,简化了零声母音节的编码方式。其次,声笔自然不区分平翘舌;再次,词组没有强制性简码;最后,也是最重要的是,声笔自然用 aeuio 代表笔画,代替了复杂的辅助码。
更高效是因为:首先,单字三码起顶,码长更短;其次,字词四码时用 aeuio 选择重码,比原来的数字键好按,可以实现快速选重;最后,词组支持动态调频,可以减少击键次数。
更强大是因为:首先,声笔自然实现了字词分离,不再纠结是字优先还是词优先,可以支持 GBK 字符集超两万的汉字;其次,词组支持扩展编码,可以支持 48 万词组并快速离散重码;最后,具有自动词组功能,没有的词组拆开打过一次后就能自动造好。
三、快速入门
为了减轻初学者的记忆负担,在手机上提供了助记皮肤,可以长按 N
键打开或者关闭助记。在打开时,给出了韵母、笔画和零声母用键的提示,如下图所示。如果是在电脑上,则可以把该图并放在电脑桌面上,在打字的时候帮助记忆。
声笔自然的编码规则和示例如下。其中,s 表示声母,不区分平翘舌;y 表示韵母;b 表示笔画。b 为 aeuio
,s 为 b 之外的 21 个英文字母,数字表示第几字(其中 0 表示末字),_
表示空格。注意,您输入时,四码词组的候选顺序可能有变化,这是因为动态码长调整的缘故(后面在动态码长一节会专门讲这一点)。
- 单字:
sybb
,即声母加韵母前再加两个笔画。一码字的例子有就j_ 我w_ 没m_
,二码字的例子有从cs_ 此ci_ 起qi_ 来ll_
,三码字的例子有节jxe 未wze 凝nyo 管gru
,四码字的例子有觉jcoo 钱qmue 貌mkuo 缘yraa
。注意,三码字的第三码和四码字后两码都是采用的顺序单笔画,而不是自然码里复杂的双形,学习难度大大降低。 - 二字词:
s1y1s2y2
,即第一字的声母韵母加第二字的声母韵母。二字词的例子有关系grxi 参加cjjw 正确zgqt 模范mofj 答应dayy
。注意,这里的正zg
是没有区分平翘舌的,与自然码的正vg
不同。 - 三字词:
s1s2s3y3
,即前三字的声母加第三字的韵母。三字词的例子有示范区sfqu 想不到xbdk 处理器clqi 宪兵队xbdv
。注意,这里的示s 处c
是没有区分平翘舌的,与自然码的示u 处i
不同。 - 多字词:
s1s2s3s0
,即前三字的声母加末字的声母。多字词的例子有爱因斯坦vyst 有限公司yxgs 人民共和国rmgg 声东击西sdjx
。注意,这里的爱v
是零声母音,用 v 代表零声母,而自然码里「爱」的首码为 a。
我们再来看一个综合的例子:我们womf 大家dajw 都db_ 喜欢xihr 研究yjjq 中文zswf 输入法srfa
。
当一个字有多种不同的读音且声母不同时,则可以用多种方法输入该字。例如,「盛」对应的拼音有 cheng
和 sheng
,对应了 c 和 s 两个不同的声母,因而它在声笔自然中也会有两个编码,分别是 cgeu
和 sgeu
。
对于非成字偏旁部首,一般取其名称首字的声母作为它的声母进行编码。例如,「亻」的名称为单人旁,取「单」字的声母 d 作为「亻」的声母,可以用 djui
输入「亻」。不知道非成字偏旁部首的名称也没有关系,因始终可以用纯笔画的方式输入。比如,「亻」可以用 uiiii
输入。
另外,声笔自然利用了单字的空码位安排了一些词组,分为声笔词、声声词、声声笔词。声笔词只有 21 个,如日子ra 方面fe 记者je 其实qo 下来xe
,它们的编码方式是首字的声母 + 次字的首笔,在后接声母时可以被顶上屏幕,因此一般只需要两键。声声词有 166 个,如出现cx_ 完全wq_ 认为rw_ 结果jg_ 什么sm_
,它们的编码方式是首字的声母 + 次字的声母,在后接声母时无法被顶上屏幕,因此一般需要空格上屏。声声笔词有 928 个,如播放器bfi 分数线fsa 打电话ddo 更年期gne
,它们的编码方式是首字的声母 + 次字的声母 + 第三字的首笔,在后接声母时可以被顶上屏幕,因此一般只需要三键。为了减轻记忆负担,在输入第一码后,会提示出声笔词和声声词;在输入前两码后,会提示出声声笔词,如下图所示。
再有,声笔自然三码词组码位上设置了许多非强制的简码词,它们虽然一般需要空格上屏,用键数是一样的,但是当它与其它常见词组重码的时候,可以用来离散重码,避免选重,例如:实施sis 事实sisi
和制作ziz 执着zizo
等等。
在学习声笔自然之初,往往会遇到不会打的字。怎么办呢?系统提供了用笔画或拼音来反查编码的手段。在完全不知道读音的时候直接用 aeuio
按顺序输入笔画进行反查,在不知道笔画时用 a 引导拼音反查(注意零声母要用 v)。以下是几个反查的例子。
另外,通过 a 引导的拼音还支持用字海两分法来进行反查, 支持查找八万多汉字,一般用于难读而易于两分的字进行反查或者 GBK 以外字的输入。GBK 以外的字,声笔自然不提供正常编码,不能按正常方式输入,只能在两分查找到后选择输入。下面是字海两分法查找的例子。
四、连续顶屏
在自然码中,当单字的码长不足四码且后接下一字词的首码时,必须要用空格上屏。在声笔自然中,三码字在后接其它字词时,空格是可以省略的。
例如,自然码都是需要空格上屏的,而声笔自然的三码字如节jpe 未wwe 凝nko 管gru
,在连续输入时都不需要空格上屏。
由于声笔自然的三码字数量庞大,高达 1600 多个,而且不乏常见字,所以对单字输入效率的提升有很大帮助。这就是为什么声笔自然用极其简单的五个笔画代替自然码的大量辅助码后,单字的平均码长反而下降的原因。
五、字词分流
在自然码中,四码的字、词是混合编码的,它们共享同一个编码空间。在发生重码时,究竟把单字排在前面,还是把词组排在前面,面临艰难的决策。当收录的单字和词组数量增大时,这个问题会变得更加突出。
在声笔自然中,单字和词组各自有不同的编码格式,它们享有不同的编码空间,不会发生冲突,不存在单字和词组那个优先的问题。单字肯定是用 sybb
格式,其第三码是笔画,而词组的编码第三码肯定是声母,笔画和声母所用的编码字母集合是不相交的。
例如,单字觉jnoo 钱qmue 貌mcuo 缘yraa
,和词组关系grxi 参加cjjx 示范区sfqu 想不到xbdc 人民共和国rmgg 声东击西sdjx
,它们之间是不可能重码的。
六、字母选重
传统输入法通常都是用数字键来选择重码字词。由于击打数字键需要跨行进行,容易产生误击,一般人都无法盲打,所以会严重影响输入速度。
在声笔自然中,当输入的编码达到四码时,如果有重码字词,那么就用 aeuio
兼做重码选择键。这时,重码字前的 aeuio
并不代表笔画,仅仅表示出现的顺序,和传统输入法的数字选择键作用完全一样。不过,用户在击打 aeuio
时要比击打数字键方便、快速得多。
例如,搜狗拼音输入 jiao
时,会出现很多同音字供用数字键选择,可能的选项如下,因动态调频的原因,结果会有出入。
声笔自然则不一样,在输入 jcoo
时,出现的重码字则是用 aeuio
选择,非常方便。
对于词组来说,也是一样的,例如 yiyh
。
七、扩展编码
为了适应现今的信息社会,中文词汇的数量暴增,传统字词输入法的四码空间显得捉襟见肘。按照 26 个字母编码,满打满算,四码空间也只有 26×26×26×26 = 456,976
个码位。然而,实际的输入法空间利用率是很低的,编码分布很不均匀,所以随着词组数量的增加,重码的重灾区越来越多。
声笔自然的四码词组空间为 21×26×21×26 = 298,116
个码位,而收录的词组数量有 48 万多。所以,词组的重码重灾区是比较常见的。即使比较常用的词,都有可能需要翻页,甚至数次翻页来输入。翻页查找属于强交互的操作,每页都需要用眼睛扫瞄六个选项,是非常耗费时间的,会大大降低输入效率,而且容易看花眼而出错。
为了解决以上问题,声笔自然采用了扩展编码,利用编码的顶功特性,通过追加首字前两个笔画,迅速扩大了 25 倍的编码空间,在重码严重时,可以快速筛选出所需的重码词。结合后述动态码长的使用,完美地兼顾了编码空间与输入效率,既能享有巨大的编码空间,又能具有很短的平均码长,两全其美。如果追加两码后,仍然有重码,还是可以通过 aeuio
进行字母选重,始终可以避免使用低效的数字键。
例如,「质子」一词在第一次输入时,在输入 zizi
后需要按三次翻页键,即出现在第四页上,然后再用 o
选择,如下图所示。每一页,都需要用眼睛扫视 6 个选项,人机交互频繁,效率很低。
然而,如果再追加第一字前两个笔画的话,「质子」就出现在第一页上,如下图所示。
可见,在输入重码太多的二字词时,通过追加首字头两个笔画,会大大地提高输入效率。
三字词和多字词也可以类似地使用扩展编码。比如,「旧石器」一词在第一次输入时,在输入 jsqi
后需要按多次翻页键,然后再进行选择,效率比较低,但是在追加首字的前两笔 ii
后它就出现在第一页上了。再如,「结绳记事」在第一次输入时,输入 jsjs
后需要按多次翻页键才能找到,而在加上首字的前两笔 aa
后就出现在第一页上了。
八、动态码长
动态码长不仅是码长的调整,也包括重码顺序的调整,实际上都是因为对频率的调整而引起的。但是,声笔自然的单字是不参与调频的,即单字的重码位置是固定的,这有利于对单字进行快速盲打。
当四码词组有重码的时候,如果选择了某个非首位的词组,那么它的频率权重就会提高,在下次输入的时候,其排序就会提前。一般通过一、两次选择就可以提前到首位,从而就能利用顶屏来节约一次按键。
例如:第一次输入输送suss
时如果它是排在第二位,用 a
选择上屏后,下次输入就可能排在首位了,于是可以利用顶屏节约一次选择键。如果在输入的时候采用了扩展编码,比如用 zizioa
输入了「之志」,那么在下次输入的时候一般就只需要 zizi
就可以了,码长得到了缩短。
九、自动词组
声笔自然目前自带 48 万多词组,覆盖的面已经很广。但是,用户在使用过程中不可避免地还会遇到缺词的情况,需要添加新的词组,而且对于不满意的词组可能还想删除。
1. 自动造词
声笔自然的造词是在输入过程中自动进行的。例如:输入声sge 笔biu
后,下次输入 sgbi
时就会有该词了,只是如果有重码的话,新造的词会排在后面。如果重码太多,可以追加首字前两笔或者用 Tab 一次性地跳到最后,以避免多次翻页。自动造的词组是临时词组,带有太极标志,优先级别低,只有在选择使用一次以后,才会成为正式词组,并提高优先级别。
需要注意的是,在进行枚举自动造词的时候,是以编码对应的字、词为单位来进行组合的,并不是以单字为单位的。例如,在输入声笔sgbi 系列xilx 码mae
后,生成的词组为「声笔系列码」「声笔系列」「系列码」,而不会生成「声笔系」「笔系列」「列码」等。另外,如果之后马上使用了退格键,系统就会自动删除所造的词组;中间夹杂有非汉字的话,也会中断造词。
2. 词组删除
对于不需要的词组,可以先将光标移动到该词上面,再按 Control + Delete
键来删除。注意,如果是非临时词组,需要删除两次才能彻底删除。第一次删除时只是把它变成了临时词组。在安卓手机上,声笔自然的删除方法是:用左右滑动空格定位词组,再用删词键来删除。
十、数选简词
为了提高输入效率,声笔小鹤提供了数选简词。所谓数选简词,是指用数字键来选择的简码词组。为了减少记忆量,数字的使用并不是随机的,而是用 23789 来代替 aeuio 表示笔画,而且在输入声母后进行了提示。
为什么用 23789,而不用传统的 12345 呢?这一方面是因为 23789 比 12345 更加容易操作,另一方面是 23789 可以与 aeuio 在键盘上位子形成近乎完美的映射,除 2 外正好位于相应笔画字母上一排相同的位置,非常容易记住,如下图所示。
数选简词一共有 105 个,其编码格式为 s1n2
,即首字的声母加第二字的数字首笔,所以又称为 sn 词。如果记住它们可以大大提高输入效率,现在它们罗列如下。
b 不能2 不过3 必须7 不是8 北京9
c 才能2 出来3 查看7 此时8 成为9
d 到了2 第一3 当然7 但是8 地方9
f 发展2 发现3 发生7 非常8 方法9
g 更加2 过去3 工作7 共同8 国家9
h 孩子2 还有3 忽然7 还是8 会议9
j 继续2 今天3 进行7 就是8 经济9
k 可以2 看到3 看看7 可是8 科学9
l 领导2 离开3 老人7 历史8 立刻9
m 面对2 没有3 明白7 美国8 目前9
n 能力2 那样3 你们7 那些8 难道9
p 旁边2 朋友3 脾气7 贫困8 漂亮9
q 妻子2 起来3 其他7 企业8 情况9
r 人民2 然而3 如何7 如果8 认为9
s 所以2 市场3 什么7 世界8 说道9
t 提出2 通过3 他们7 同时8 提高9
v 儿子2 安排3 爱人7 而且8 欧洲9
w 为了2 完成3 我们7 问题8 无法9
x 系统2 现在3 先生7 心中8 希望9
y 已经2 一样3 一个7 一点8 因为9
z 自己2 这样3 这个7 中国8 知道9
十一、声笔自整
声笔自整是声笔自然的整句模式。它不需要考虑单字、二字词、三字词和多字词的不同编码规则,只需要知道单字的编码就可以进行中文输入了。但是,它的缺点是,在输入发生错误后回改的成本高,离散程度高的文本尤其如此。所以,声笔自整仅适合录入简单的连续文本,或者供声笔自然的初学者使用,熟练的用户应当使用声笔自然。
下面举例说明一下声笔自整的输入方法。
例 1:我们大家都喜欢研究输入法
这个例子按照规则输入后就完全正确了,不用任何回改,这时的输入过程是非常流畅和舒服的。但是,并不总是这么幸运的,如下例动画所示。
例 2:声笔系列码的顶功特色
对于这类转换不正确的情况,声笔自整提供了一种快速定位的手段,可以利用数字 1234
将光标一次性地定位到待定的第 1 至 4 个音节之前,用 5
将光标定位到最后,而 TAB 可以快速从当前位置向前逐个音节移动。在定位后,还可以追加一至两个笔画来筛选重码,提高转换的准确率,尽量避免翻页。在追加两个笔画后,还可以用 aeuio
代替 67890
进行重码选择,在操作上更加便捷。
附录:声笔自然的编码格式
为了便于用户总结和记忆声笔自然的基本内容,现将其字词的编码格式以浓缩的表达式方式总结如下。
- 单字
syb^b
- 二字词
s1y1s2y2^'b1b1
- 三字词
s1s2s3y3^'b1b1
- 多字词
s1s2s3s0^'b1b1
其中,s 表示声母,不区分平翘舌,b 表示笔画。b 用元音 aeuio
,s 用剩余的 21 个英文字母,数字表示第几字(其中 0 表示末字),^ 表示起始顶屏码位,’表示起始码长调整位。