本章先回顾中文输入所经历的艰难历程和近年来取得的成就,指出中文输入仍然面临的一些问题,然后介绍声笔系列码怎么样革命性地解决这些问题。接下来,介绍如何选择和学习声笔系列码的具体方案和如何获取、安装与卸载声笔系列码。本篇最后「声笔系列码基础知识」一节,论述了一些跨输入方案的共同内容,如反查、翻页、标点、符号、词库同步、自定义词典、中英文混合输入、手机上的一般操作,在具体方案的介绍中可能就没有重复这些内容了。
一、中文输入的艰难与辉煌历程
在英文机械打字机普及以前,中文和英文的输入是没有什么差别的,都是手写。而且,在钢笔出现以前,中国的文房四宝比西方的书写工具先进。
早在 1714 年,就开始相继有英、美、法、意、瑞士等国家的人发明了各种形式的打字机,技术一直不成熟,无法普及。直到 1868 年,美国人 Christopher Latham Sholes 设计出现代打字机的实用形式,规范了 QWERT
键盘,1873 年使用此布局的第一台商用打字机成功投放市场,并为大众所使用,为西方文化的普及做出了巨大贡献。
由于汉字的数量太多,一直阻碍着中文输入的机械化。1915 年在美国留学的祁暄发明了第一台中文打字机,并获得了美国专利。后来这打字机又获得了北洋政府农商部的嘉奖。这种中文打字机结构复杂,外形笨重,体积庞大,操作复杂,需要打字员有足够的记忆和反应速度,虽然在电子打字机出现以前有少量的商用,但是打字员必须经过专业的训练才能胜任工作。一般机构和学校还是愿意用手抄或油印,实际上,配有中文打字机的学校、机关、企业很少。
因为中文的复杂性和技术的局限,中文的快速输入问题在电脑普及以前一直没有得到解决,中国痛失了一个机械打字时代!损失是非常惨重的。正因为如此,在历史上,从民间到政府,都曾试图从改变中文的角度来解决这个问题。一个方向是汉字简化,另一个方向是汉字拼音化,两个方向都在同时进行。并且,在汉字的去留和改革的方向上发生了激烈的争论。今天我们使用的简化汉字和汉语拼音,就是这种历史发展的结果。
电子工业部第六所于 1983 年正式公布了我国第一个中文磁盘操作系统 CC-DOS,这在我国中文信息处理历史上具有划时代的意义。CC-DOS 是在 PC-DOS 的基础上扩充、修改而成。在广泛使用的 CC-DOS 2.1 版中,就有简拼、首尾码、快速码和区位码输入法,已经涵盖了包括音码、形码、音形码和数字码这些主要类型的输入法,对我国计算机应用的普及起到了开路先锋的作用。简拼是纯音码,使用的是介于全拼和双拼之间的一种拼音方法,对三个及三个字母以上的韵母进行了压缩,对后来的自然码双拼产生了影响。首尾码是一种纯形码,包含 97 个部件,分为 52 类;部件到键盘字母的映射没有太多的规律可循,记忆量很大;编码时只取字首和字尾各一个部件,对于未列出的变形部件需要输入者自己去猜测其应归属的键位。受限于当时的软硬件条件,这两种方法都不支持联想,也不支持词组,更不支持智能整句,都有很多重码。因此,在输入时选择、翻页操作很频繁,眼睛需要不断地扫描提示行,以便在众多的重码中找寻所需的字,输得又累又慢。快速码是通过压缩拼音加码方法实现的,可以在一定的程度上离散重码。由于快速码的加码方法没有规律可循,因此没有得到真正的应用。
1986 年,四通公司与日本三井物业合作,推出了四通 MS-2400 中文电子打字机,宣告了中国专业电子打字时代的到来。随着四通打字机的广泛使用,首先捆绑在四通打字机上的五笔字型输入法流传开来。五笔字型以非常复杂的编码规则换来了在 GB2312-80 字符集内较低的重码率。当采用强制简码时,还可进一步将低重码率。词组编码被放进全码字的剩余编码空间中,实现了字词混合编码。只要收录的词组量不大,发生重码的可能性是比较小的。五笔字型拥有的这些特点,正好适应了职业打字的需要,成为它在职业打字时代非常流行的重要原因之一。虽然五笔字型在市场上取得了巨大的成功,但它存在的问题也是不容忽视的。首先,五笔字型是非常难学的,而且容易遗忘。它除了有非常复杂的编码规则而外,还有很多例外需要记忆。五笔字型打字员在打字时对一些常见字出现 “卡壳” 的现象是很普遍的事情。这时就需要临时换用拼音输入法。
到了九十年代末,随着计算机价格的进一步降低、存储处理能力的进一步增强、Windows 图形操作系统的流行和国际互联网的兴起,用户界面变得非常友好,计算机进入了中国的普通百姓家庭,进入了中小学教育中,真正实现了计算机在中国的大普及。这样便造就了一个庞大的非职业打字员用户群体,他们的输入方式是 “想打” 而不是 “看打”,他们没有精力花费大量的时间学习五笔字型,而 Windows 内置了智能 ABC 和微软拼音输入法,利用学校学到的拼音知识就可以打字。智能 ABC 与早期的拼音输入法相比,取得了长足的进步,以词组和短语为单位进行输入,拥有比较丰富的词库,支持智能的分词,支持全拼、简拼混合输入,比微软的整句输入更适合国情,逐步成为前互联网时代的主流输入法。
在 2006 年,出现了搜狗拼音,它通过搜索引擎技术,将互联网变成了一个巨大的活词库,使用户不仅仅只是词库的使用者,也是词库的生产者。这就进一步弥补了拼音输入法单字能力弱的短板,增强了它的可用性。再凭借搜狗公司强大的营销和推广能力,让搜狗拼音输入法迅速地占领了市场,成为了当今输入法的头部。
二、中文输入仍面临的问题
但是,利用互联网的庞大词库也不能完全解决问题,中文的词组是无穷无尽的,个性化的词组更不可能囊括,单字的输入始终不可避免。同时,拼音输入法码长太长、重码太多、效率低下的问题仍然困扰着人们。所以,搜狗、百度、讯飞这几大输入法都同时提供了五笔字型来满足追求高效的用户,甚至出现了拼音五笔混合模式来兼顾两者。然而,拼音和五笔在知识和技能上毫不相干,同时掌握这两种输入法既不经济也不现实。实际的情况是,绝大多数只使用拼音,少数人在使用双拼、五笔、自然码、二笔等各式各样的输入法。这种情况让大家都不满意。于是,人们一直在不断地研究和探索新的输入法。
声笔系列码开创了革命性的顶功输入方式,发明了一系列简单、高效的输入法,经过多年的反复优化、打磨,让中文输入彻底走出了 “简而不快、快而不简” 的困境,形成了完整的输入法体系,能够适应各种类型用户的不同需要,可以实现方案间平滑的迁移和升级。
三、声笔系列码的解决方案
声笔系列码是一系列具有共同基础和核心技术的输入法的统称,简称声笔系列或声笔。声笔系列码包括声笔简码、声笔快码、声笔飞码、声笔拼音、声笔自然、声笔小鹤,形成了一个严密的体系,如下图所示。
声母和笔画是声笔系列码的共同基础,用 v
表示零声母和用 aeuio
表示五个笔画,是声笔系列码走出的简单而关键的一步。声笔系列码是一个循序渐进的严密的输入法体系,在各个层次上全面地超越了传统输入法,可以满足各类用户在各种应用场景中的需要,用户可以根据需要决定是否花更大的精力来学习难度更大而专业性更强的输入法。
1. 核心技术
- 连续顶屏:是指利用顶功编码的双码元集(设起始码元集为 A,后续码元集为 B)特性,从字词编码的某一码位 N 开始,在后接 A 中码元时,可以自动将前面的特定候选字词顶上屏幕;同时,若后接的是 B 中的码元时,则可以延长编码,快速筛选出其它字词,筛选随着码长的延伸逐级进行;在每次筛选后,都可以采用前述的方法顶屏。这样,在输入中文的时候可以省略大量的空格键,从而大大地提高输入效率。
- 字词分流:是指单字和词组各自有不同的编码格式,甚至不同类型的词组也有不同的格式。将单字和词组的编码分开,具有很大的实用价值,否则单字和词组的重码排序会遇到两难的境地。将单字、二字词、三字词和多字词的编码分开,还可以分别为它们设定不同的长度,以便最有效地利用编码空间和字母选重。
- 字母选重:是指当输入的编码达到特定码型规定的长度时,如果有重码字词,那么就用后续码元集中的码元兼做重码选择键。传统输入法通常都是用数字键来选择重码字词。由于击打数字键需要跨行进行,容易产生误击,一般人都无法盲打,所以会严重影响输入速度。采用字母选重就能解决这个问题。搜狗拼音虽然可以用字母选择重码字词,但是必须先用空格键引导,效果大打折扣。声笔系列码的字母选重是无需引导键的。
- 扩展编码:是指在输入单字和二字词的基本编码后,在支持字母选重的基础上,还可以追加两码,并再次用 aeoiu 来选择重码字词。这用于对付重码字词的重灾区特别有效。一方面可以用短码输入常见字词,另一方面又可通过加码来快速输入重码多的字词。当然,扩展编码是可选的。对于初学者,总可以只采用基本编码,然后通过翻页来输入任何字词;但是,当重码很多时,需要多次翻页和扫视重码,输入效率很低。所以,熟练者应当尽量使用扩展编码来离散重码,而不要依赖翻页来查找字词。
- 动态码长:是指在第一次输入某字词时,如果其码长超过一定长度,那么就将其码长缩短,而且其它相关字词的码长也会做相应的调整。这样,在下次输入同一字词时就可以用较少的键数。搜狗拼音中的动态简码有类似的效果,但是占用了单字和二字词简码位,是不可取的,不利于用户对高频字词的输入形成条件反射;同时,搜狗拼音的码长调整也不兼具「顶功」。声笔系列码中,两码内的字词都是静态编码的,用户可以在使用中逐步形成条件反射。
- 自动词组:是指在输入的过程中,利用输入历史,自动组合为新的词组,并为其自动编码,此后就可以用此编码来输入新的词组,从而节约用键,提高输入效率。自动生成的新词组,作为临时词组保存,出现在重码字词的后面,再次被选择后成为正式的词组。造词过程全自动化,无需人为干预,非常快捷、方便。更为理想的是,对于用户几乎不使用的词组,还能自动进行清除,相当于人类的遗忘功能或程序语言的垃圾回收机制,可以避免废词的数量爆增,出现存储困难和重码选择困难等问题。
2. 输入法简介
声笔简码在声笔系列码中占有特别重要的地位,它通过巧妙地编码,在仅仅使用声母和笔画的前提下,取得了简单、高效的输入效果,具有最好的性价比,还有利于升级到声笔快码或声笔飞码。声笔简码默认是简单、高效的字词模式,同时也提供了更简单的整句模式 —— 声笔简整。
声笔快码在声笔简码的基础上增加韵母来编码,形成了一种特殊的双拼输入法。它比传统的双拼如自然码和小鹤音形更加简单和快捷。声笔快码是默认的方案,另外还有衍生的主单方案 —— 声笔快讯,以及整句型方案 —— 声笔快整。
声笔飞码在声笔简码的基础上增加偏旁部首来编码,增强了编码离散能力,使得它比五笔字型更加专业和稳健,无论是单字和词组的输入都有优异的表现。声笔飞码是默认方案,另外还有衍生的主单方案 —— 声笔飞讯,以及整句型方案 —— 声笔飞整。
声笔拼音是对传统拼音输入法的改良,它明确了音节界线,简化了拼写形式,能够直接笔画筛重,输入效率得到了提高。基于声笔拼音的顶功方案 —— 声笔顶拼,则利用顶功大大提高了拼音输入法的效率,是推荐的拼音输入方式。
声笔自然和声笔小鹤分别是对自然码和小鹤音形的顶功改良,所不同的是:1. 不分平翘舌;2. 零声母用 v 代替;3. 双形用前两笔代替,用 aeuio 代表折横撇竖捺。 顶功改造后的优势是:1. 更简单,因为不区分平翘舌,形只使用前两个单笔画;2. 更高效:因为单字三码起顶,重码用 aeuio 选择;3. 更强大,因为字词分流,可以容纳更大词库,并支持自动造词和调频。另外,衍生自声笔自然的整句型方案 —— 声笔自整和衍生自声笔小鹤的整句型方案 —— 声笔鹤整。
从编码所使用的汉字特征属性来说,声笔简码是最简单的,只用了声母和笔画。以声笔简码为基础,加上全拼韵母就是声笔拼音,加上偏旁部首就是声笔飞码,加上快码的双拼韵母就是声笔快码,加上自然码的双拼韵母就是声笔自然,加上小鹤的双拼韵母就是声笔小鹤。下图直观地说明了声笔系列码各输入法之间的关系。
更详细地来看,声笔系列码的六款输入法共包含了十四个输入方案,其特点如下图所示。其中,声笔简码和声笔拼音属于普及型,声笔小鹤和声笔自然属于中庸型,而声笔快码和声笔飞码属于专业型。
3. 如何选择
面对庞大的声笔系列码输入法体系,用户该如何选择呢?为了帮助用户在声笔系列码中正确地选择适合的输入法和输入方案,现以搜狗拼音和五笔字型作为参照,从简单性、平均码长和可盲打性三方面,对各款输入法做一个对比,决定选择的优先顺序。从简单性来讲,如果以绝对的记忆量为标准,则选择的优先顺序为:声笔简码 > 搜狗拼音 > 声笔拼音 > 声笔自然 = 声笔小鹤 > 声笔快码 > 声笔飞码 > 五笔字型。如果以动态平均码长为标准,则选择的优先顺序为:声笔简码 > 声笔拼音 > 声笔飞码 > 声笔快码 > 声笔自然 = 声笔小鹤 > 五笔字型 > 搜狗拼音。从可盲打性的角度来讲,则选择的优先顺序为:声笔飞码 > 五笔字型 > 声笔快码 > 声笔自然 = 声笔小鹤 > 声笔简码 > 声笔拼音 > 搜狗拼音。
不管您是什么背景,只要你不是已经掌握和习惯了五笔字型、自然码、小鹤音形和二笔之类的传统四码输入法,那么声笔简码都是首推的方案。如果您分不清平翘舌、搞不懂韵母,又想学习成本低且效率也不错,或者您弄不清学什么输入法好,那么它就是更适合您的。实际上,95% 以上的人一辈子只使用声笔简码就够了,因为他们一般的输入对象都是简单的连续文本,而这正是声笔简码的优势,甚至用起来比其它更复杂的输入法还高效。如果今后您输入的离散文本很多,觉得声笔简码不够用了,再升级到声笔快码、声笔飞码也不迟。升级的过程是非常容易的,因为您已经掌握了声母、笔画、字母选重等声笔系列码的共同特性,只需要学习快码的双拼韵母或者飞码的偏旁部首就行了。
如果您就是喜欢拼音输入法,那么就建议您换用声笔拼音。声笔拼音与传统拼音几乎一样,拼音用户不用学习就可以使用,而且效率有所提高,适合喜欢拼音的朋友提高输入效率。如果您觉得它的效率还不够,那么可以使用声笔顶拼。声笔顶拼简化和规范了拼音的字、词编码,强制用户使用最简单的拼式,利用顶功来节约大量的空格,通过附加笔画来区分重码,通过动态码长调整来进一步缩短平均码长,使拼音输入法又上了一个新的台阶。如果今后您输入的离散文本很多,觉得声笔顶拼不够用了,则只需要增加双拼韵母就可以升级到声笔快码,或者换用声笔飞码也行。
如果您是自然码或小鹤双拼的老用户,但是对它们的输入效率还不满意,您就可以换用声笔自然或声笔小鹤。这样,可以用最小的代价,换来最大的效率提升。如果您是五笔和二笔等传统四码输入法用户,对字形更为敏感,想通过顶功来提高效率,您就可以换用声笔飞码。
四、获取、安装与卸载
1. 获取
声笔系列码的获取方法是,在声笔系列码 QQ 群共享文件夹下载。今后也会在软件下载站点和应用市场发布。
2. 安装
声笔系列码目前的实现是建立在 RIME 输入法平台之上的。但是,为了支持声笔系列码的特殊功能,如连续顶屏、字母选重、扩展编码、自动码长等,对官方的 RIME 程序进行了特别的定制。不过,声笔定制程序可以兼容相同版本的官方程序,仍然可以在定制程序上使用其它的 RIME 输入法方案。
目前,声笔系列码只提供了 Windows 和 Android 的定制安装程序,Windows 版本至少要求 XP,Andoid 版本至少要求 8.0。
在发布形式上,声笔系列码包括主程序和扩展包。主程序内置声笔简码(含声笔简整),而声笔拼音(另含声笔顶拼)、声笔快码(含声笔快讯和声笔快整)、声笔飞码(含声笔飞讯和声笔飞整)、声笔自然(含声笔自整)和声笔小鹤(含声笔鹤整)分别采用扩展包发布。主程序必须首先安装,才能安装扩展包,不过扩展包是可选的。声笔系列码收词数量比较大,超过 48 万。
主程序的安装
在 Windows 上,把您下载的声笔系列 WIN 版压缩包解压,在解压后的文件夹中找到安装程序 Weasel4sbxlm,以管理员权限进行安装。点击「我接受」,然后按默认步骤安装即可,建议不要改变默认的安装路径,更不要使用含有中文的路径,以免出现不可预知的问题。
在 Android 手机上,则可以用声笔系列安卓版一键安装包进行安装。步骤如下:
- 运行安装程序后,出现以下安装界面。
- 点击上图的安装按钮,开始安装。
- 打开上图中所要求的存储和麦克风权限。
- 允许上图中的在其他应用上层显示。
- 依次执行上图中打红色圈的项目,就安装完成了。安装成功后,您会在手机上见到以下的声笔系列码 APP 图标。今后,在改变方案设置后,需要重新部署时,您就要用它。
扩展包的安装
要使用扩展包,首先确认已经安装好了主程序,然后将包解压,把相应输入方案复制到用户文件夹中,启用新的方案,或者直接编辑 default.custom.yaml 文件来加入新的方案,并重新部署一下即可。注意,Windows 上的用户文件夹名称为 Rime,而 Android 上的用户文件夹名称为 sbxlm。
3. 卸载
声笔系列码的卸载很简单。在 Windows 上,通过控制面板里的卸载程序
功能,找到小狼毫程序将其卸载就行了。在 Android 手机上,通过系统自身的应用程序管理功能就能方便地卸载。
五、声笔系列码基础知识
1. 笔画反查方法
在汉语拼音中,没有使用字母 v,且所有音节均不以 i 和 u 开头。当使用 v 来标识零声母后,所有的音节便都不以 aeuio
这五元音字母开头了,于是正好可以用 aeuio
来分别表示汉字的折横撇竖捺
五种笔画。这里在称呼这五个元音字母的时候,采用了 QWERT
键盘上从左到右的排列顺序,而不是传统的横竖撇捺折
笔画顺序,也不是英文字母的顺序,目的是让用户在记住后容易建立与键盘上对应按键之间的关系,便于形成操作上的条件反射。声笔系列码的重码在用 aeuio
选择时,也是按这个顺序排列的。
对于不知道读音的汉字,可以直接按笔顺输入笔画来反查汉字的编码。对于没有读音的偏旁部首,也可以直接用笔画来输入。笔画不足时,可以反复补充末笔。例如,若不知道「鬯」字的拼音,就可以直接输入它的前几笔 uooo
,代表撇点点点点
,它就会出现在首页,并在它的后面标注了读音 chang
,注意笔画点
是归到笔画捺
中的。再如,单人旁「亻」可以用 uiii
代表撇竖竖竖
来输入,这里补充了两个末笔。
另外,还要注意,笔画反查只能查单字,不能查词组。
2. 拼音反查方法
在使用声笔系列码的非拼音输入法声笔简码、声笔快码、声笔飞码、声笔自然和声笔小鹤时,如果不知道编码,可以用 a 引导拼音来进行编码反查。但是,有一点要特别注意,即以 a e o
开始的零声母音节需要用 v 作为其声母,如 a ao er ong
分别变为 va vao ver vong
。例如,要用零声母音节 en
进行反查,就需要输入 aven
,不能用 aen
。
拼音反查虽然也能查词组,但是因为技术原因,不会提示编码,只是方便用户知道读音而不知道字形时,通过拼音打出词组来得知字形,以便根据编码规则推出词组的编码。
另外,声笔系列码还支持通过 i 引导用字海两分法来进行反查, 支持查找八万多汉字,一般用于难读而易于两分的字进行反查或者 GBK 以外字的输入。不过,GBK 以外的字,声笔系列码不提供正常编码,不能按正常方式输入,只能在两分查找到后选择输入。
3. 翻页方法
重码字词超过一页时,可用 Enter 和 Tab 键进行翻页查找。Enter 为向下翻页,Tab 为向上翻页。而且,翻页操作在电脑上和手机上都是一样的。
在定位新造词的时候,可以在没有进行过翻页时,用 Tab 直接跳到最后一页,这在重码很多时特别有用。如果只用 Enter 的话,就需要按顺序多次翻页,因为新造的词都是排在重码词中尾部的位置。
注意,声笔系列码没有像一般输入法那样用逗号和句号来翻页,这是因为声笔系列码使用翻页键的情况是比较少或者很少的,无需占用常用的逗号键和句号键而使它们丧失顶屏的能力。
4. 中英文混合输入
许多用户不仅仅需要方便、快速地输入中文,而且需要混合输入大量的英文。由于键盘及其布局的差异,声笔中英文混输时,在电脑上和在手机上的操作方法是不一样,而且随各输入方案的设置而定。下面介绍的是声笔系列码默认设置情况下的使用方法,要特别注意在电脑上和在手机上的差异。
在电脑上,在中文状态下,按 CAPSLOCK
则可以锁定大写来输入英文,此前若编码窗口已有输入则会被清空。当编码窗口已经有输入时,若要直接上屏编码,则按 Shift + Enter
;若要上屏中文并同时切换到英文状态,则按右 Shift
键;若要保留编码并进入临时英文状态,则按左 Shift
键。在临时英文状态的可以接收空格和标点,完成后用回车或者右 Shift
上屏缓冲区的英文,并同时切换回中文状态。当编码窗口没有输入时,可以单击左或右 Shift
来切换中英文输入状态。当编码窗口没有输入且处于中文状态时,首码用大写字母则自动切换到临时英文状态。
在手机上,在中文状态下,没有输入编码时,按 Shift
可以锁定大写来输入英文;当前已经有编码输入时,Shift
会变为 Esc
,用于清除编码。若要直接上屏编码,则按上滑退格键;若要上屏编码并同时切换到英文状态,则上滑空格键;若要保留编码并进入临时英文状态,则上滑 Esc
键。在临时英文状态的可以接收空格和标点,完成后单击回车或者上滑退格键上屏缓冲区的英文,并保留在英文状态;若要同时切换到中文状态,则上滑空格键来上屏临时英文。当编码窗口没有输入时,可以长按空格键或上滑 Shift
来切换中英文输入状态。当编码窗口没有输入且处于中文状态时,首码上滑输入大写字母则自动切换到临时英文状态。当有重码时,左右滑动空格可以定位重码,然后用单击空格上屏。另外,长按 G 可以切换是否显示状态栏,下滑退格键可以收折键盘,上滑左下角的符号键可以切换输入法方案,长按则进行输入法设置;上滑 Enter 键可以切换主题,长按则可以选择配色等。其它的特殊操作,如全选、剪切、复制、粘贴、提示、助记、删词等,在键面上已经写得很明确,就不再赘述。
5. 标点符号
声笔系列码对标点符号的输入方法进行了统一和规范,以 RIME 的设计为基础,有少量修改,可以用 aeuio
来选择重码,更加方便、快捷。在半角状态下的定义如下:
按键 | 标点 | 按键 | 标点 | |||
---|---|---|---|---|---|---|
, | , | . | 。 | |||
< | 《, 〈, «, ‹, < | > | 》, 〉, », ›, > | |||
‘ | ‘, ’ | “ | “, ” | |||
/ | 、, /, /, ÷ | ~ | ~, ~, ˜, ≈, ≋, ≃, ≅, ≇, ∽, ⋍, ≌, ﹏, ﹋, ﹌ | |||
·, | , |, §, ¦, ‖,・ | ` | `, ′, ″, ‴, ‵, ‶, ‷, ⁗ | |||
@ | @, ©, ®, ℗ | # | #, № | |||
% | %, %, °, ℃, ‰, ‱, ℉ | $ | ¥, $, €, £, ¥, ¢, ¤, ₩ | |||
^ | ……, ^ | _ | ——, _ | |||
= | =, 々, 〃 | * | *, *, ·, ×, ※, ❂, ⁂, ☮, ☯, ☣, ・ | |||
[ | 「, 【, 〔, [ | ] | 」, 】, 〕, ] | |||
{ | 『, 〖, { | } | 』, 〗, } |
上表中没有列出按键和标点完全一致的,如# %
等。在全角状态下,标点符号的定义几乎与半角状态下相同,只是有的半角字符变成了对应的全角字符,如& @
等。
6. 特殊符号
另外,通过 \
引导,还可以输入各类特殊符号,输入习惯源自同文风,但是改 /
为 \
,同时将以非首码为 aeuio
的编码改为 v
或者省略,以便支持用 aeuio
选择重目,具体符号类别大致如下:
编码 | 类别 | 编码 | 类别 | |
---|---|---|---|---|
\fh | 符号 | \dn | 电脑 | |
\xq | 象棋 | \mj | 麻将 | |
\sz | 色子 | \pk | 扑克 | |
\bq | 表情 | \tq | 天气 | |
\yy | 音乐 | \lx | 两性 | |
\bg | 八卦 | \bgm | 八卦名 | |
\lssg | 六十四挂 | \lssgm | 六十四挂名 | |
\txj | 太玄经 | \tt | 天体 | |
\xz | 星座 | \xzm | 星座名 | |
\sg | 十二座 | \xh | 星号 | |
\fk | 方块 | \jh | 几何 | |
\jt | 箭头 | \sx | 数学 | |
\szq | 数字 + 圈 | \szh | 数字 + 弧 | |
\szd | 数字 + 点 | \zmq | 字母 + 圈 | |
\zmh | 字母 + 弧 | \0~10 | 数字 | |
\fs | 分数 | \szm | 苏州码 | |
\lm | 罗马数字小写 | \lmd | 罗马数字大写 | |
\sb | 上标 | \xb | 下标 | |
\xl | 希腊字母 | \ey | 俄语 | |
\yf | 月份 | \rq | 日期 | |
\yr | 曜日 | \sj | 时间 | |
\tg | 天干 | \dz | 地支 | |
\gz | 干支 | \jq | 节气 | |
\dw | 单位 | \hb | 货币 | |
\jg | 结构 | \pp | 偏旁 | |
\kx | 康熙部首 | \bh | 笔画 | |
\bd | 标点 | \bdz | 标点直行 | |
\py | 拼音 | \pyd | 拼音大写 | |
\sd | 声调 | \hzq | 汉字 + 圈 | |
\hzh | 汉字 + 弧 | \jm | 假名 | |
\pjm | 平假名 | \jmq | 假名 + 圈 | |
\jmbj | 假名半角 | \hw | 韩文 | |
\hwq | 韩文 + 圈 | \hwh | 韩文 + 弧 |
7. 词库同步
在用户同时使用多种设备,如台电脑、手机等时,新造的词组,码长调整和频率调整的结果都需要同步,才能避免重复的工作。RIME 提供了同步用户词组的功能,可以满足这种需求,具体方法参见 RIME 官方网站的用户资料同步一节。
8. 自定义词典
不少用户需要的一些特殊词组是方案本身不能或者不便于造出来的,比如带数字或 / 和字母的词组、特别长的词组等。声笔系列码提供了一个共享的自定义词典来满足这种需求。
由于声笔系列码在不少情况下是不允许重码的,所以用户自定义的词组不能放在系统词组的编码空间里,否则可能造成冲突而影响输入法的正常使用。经过仔细考量,决定采用 u
引导来解决用户自定义词组的输入问题,此处的 u
意为「用户」,因为它是英语的 user
的首字母,而声笔系列码的各种方案都不会使用 u
作为正常中文编码的首码,不会产生编码冲突。
自定义词典随声笔简码和声笔简整一道包含在为声笔系列码定制的小狼毫和同文主程序安装包里。它在里面体现为一个方案,但是独立使用的价值不大,只是为其它方案服务的。它是一个 dict
型而非 txt
型的词典,当收录的词条数量大时也具有很快的查找速度。
上图所示就是自定义词典文件。在该文件开始的注释部分,说明了编码格式和注意事项。需要特别注意的是,自定义词组不能以 aeuio
作为首码,非首码可以为小写字母和数字,最好不要有重码,因为重码字词需要通过移动光标来选择,很不方便。同时还要强调,词组和编码之间,编码和权重(如果有的话)之间,必须是以制表符 TAB 分隔,不能是空格,否则使自定义词典编译失败,所以最好要找一个支持制表符的编辑器来编辑自定义词典。
9. LUA 脚本
声笔定制程序能够支持 LUA 脚本,但是在方案中的用法与官方有所不同。在声笔的所有方案中,都是统一用 o 来引导的,其正则表达式为 o[qwrtsdfgzxcvbyphjklnm0-9][a-z0-9]*
,默认用 orq
来输入日期,用 osj
来输入时间,用 o[0-9]+
来输入中文数字。实现过滤器和其它功能的脚本,请自行添加。注意,如果有多个选项,o 引导的 LUA 脚本输入选项是不能用 aeuio
来选择的,在电脑上可以用箭头移动光标来选择,在手机上可以滑动空格键来选择,然后用空格上屏。
10. 增强的设置选项
(1) 停止调频与造词
声笔系列的所有字词方案默认都是开启自动调频与自动造词的,这适合大多数人的习惯。但是,仍然有些用户不喜欢词库的动态变化,或者喜欢在一段时间的动态调整后就不再变化。为此,声笔定制程序专门针对 Table Translator 提供了一个 stop_change 选项,用于停止或者开启自动调频与自动造词,停止为 true,开启为 false。用户修改 schema 中的这个选项后,需要重新部署才能生效。该选项的位置如下图所示。该选项也能用于非声笔系列的方案。
(2) 自动删词阈值
声笔系列的所有字词方案默认都能自动删除过时的临时词组。默认的删除规则是,若在输入时检索到某个临时词组的 tick 值与最新的全局 tick 值之差的绝对值大于等于 1000 时,则将该临时词组删除。这个绝对值称为 delete_threshold,可以在 Translator 中修改。当它小于等于 0 时,则不会删除临时词组,否则就按该值规定的 tick 差值来删除。该值的通俗含义就是,检索到某个临时词组前你输入了多少个字词。该选项也能用于非声笔系列的方案。
(3) 多字词过滤
声笔系列中的简码、飞讯和快讯有一个开启多字词过滤的选项 enable_filtering。这个选项默认的情况下为 false,即未开启。未开启多字词过滤时,简码的 sssb 编码、飞讯和快讯的 szsbb 编码会将多字词也查找出来,而开启(即将 enable_filtering 设置为 true)的时候则会过滤掉多字词,从而减少重码,这时多字词就只能采用 sssS 的形式来输入。
附录一:笔画的国家规范
声笔系列码对笔画的使用完全遵从国家的有关规范,这对纠正使用者的错误笔顺和识别正确的笔画类型是很有帮助的。
1. 笔顺规则
2. 笔画类型
附录二:笔画易错的汉字和部首
有个别汉字和偏旁部首的笔顺容易弄错,需要引起注意,下面把它们罗列出来。
匕:丿乙
冫:丶一
入:丿丶
刁:乙一
卩:乙丨
九:丿乙
乃:乙丿
力:乙丿
七:一乙
廴:乙丶
小:丨丿丶
义:丶丿丶
万:一乙丿
忄:丶丶丨
女:乙丿一
宀:丶丶乙
门:丶丨乙
犭:丿乙丿
山:丨乙丨
及:丿乙丶
叉:乙丶丶
与:一乙一
于:一一丨
之:丶乙丶
幺:乙乙丶
也:乙丨乙
夂:丿乙丶
丬:丶一丨
心:丶乙丶丶
尤:一丿乙丶
长:丿一乙丶
车:一乙一丨
比:一乙丿乙
巴:乙丨一乙
办:乙丿丶丶
方:丶一乙丿
灬:丶丶丶丶
丑:乙丨一一
火:丶丿丿丶
巨:一乙一乙
化:丿丨丿乙
戈:一乙丿丶
丹:丿乙丶一
片:丿丨一乙
区:一丿丶乙
凶:丿丶乙丨
五:一丨乙一
乌:丿乙乙一
互:一乙乙一
瓦:一乙乙丶
为:丶丿乙丶
世:一丨丨一乙
讯:丶乙乙一丨
民:乙一乙一乙
凸:丨一丨乙一
冉:丨乙丨一一
母:乙乙丶一丶
皮:乙丿丨乙丶
可:一丨乙一丨
鸟:丿乙丶乙一
凹:丨乙丨乙一
北:丨一一丿乙
必:丶乙丶丿丶
永:丶乙乙丿丶
兆:丿丶一乙丿丶
再:一丨乙丨一一
臣:一丨乙一丨乙
臼:丿丨一乙一一
过:一丨丶丶乙丶
共:一丨丨一丿丶
那:乙一一丿乙丨
卵:丿乙丶丿乙丨丶
肖:丨丶丿丨乙一一
巫:一丨丿丶丿丶一
里:丨乙一一丨一一
赤:一丨一丿丨丿丶
甫:一丨乙一一丨丶
垂:丿一丨一丨丨一一
贯:乙乙丨一丨乙丿丶
建:乙一一一一丨乙丶
或:一丨乙一一乙丿丶
学:丶丶丿丶乙乙丨一
重:丿一丨乙一一丨一一
幽:丨乙乙丶乙乙丶乙丨
脊:丶一丿丶丿丶丨乙一一
兜:丿丨乙一一丿乙乙一丿乙
雪:一丶乙丨丶丶丶丶乙一一
率:丶一乙乙丶丶一丿丶一丨
渊:丶丶一丿丶丿一丨丿丶丨