Ubuntu 10.04中修改fcitx输入法的词库

在Ubuntu中使用了较长时间的fcitx输入法,软件仓库中的版本是3.6.2,感觉不错。不过有个不足之处,就是词库量太少,很多常用词汇没有预置,这造成其输入体验远不及搜狗等知名输入法。其实,这是可以弥补的,下面将介绍如何修改fcitx预置的词库。
下面将演示如何在字库中添加“厑”,并在词库中添加“操作符”。步骤如下:


1.概述。
默认情况下,文本形式的字库文件(扩展名为.org)和二进制形式的字库文件(扩展名为.mb)都位于路径:/usr/share/fcitx/data。其实最终有效的文件是二进制形式的.mb文件,亦即修改文本形式的.org文件,并不会产生效果。如下是所牵涉到的所有文件:
gbkpy.org(文本形式拼音单字库):此文件中包含了fcitx所支持的所有汉字,包括简体和繁体。可用文本编辑器编辑此文件,以添加、修改不全或错误的汉字。因其字库已较全,故很少改动此文件。
pyPhrase.org(文本形式拼音词库):此文件中包含了fcitx预置的所有词汇,包括双字以及多字的词汇。可以编辑此文件,以添加新词汇。
pybase.mb(二进制形式拼音单字库):通过createPYMB将gbkpy.org转化为此二进制文件。
pyphrase.mb(二进制形式拼音词库):通过createPYMB将pyPhrase.org转化为此二进制文件。


2.修改文本形式的字库文件。
2.1 修改单字库文件。
    终端中输入命令:sudo gedit /usr/share/fcitx/data/gbkpy.org --encoding GB18030
    将会看到其格式为:拼音 汉字。因“厑”拼音为“a”,故将其加入到a系列的最后一行,如下所示:
    ...
    a 錒
    a 厑
    ai 爱
    ai 哀
    ...
2.2 修改词库文件。
    终端中输入命令:sudo gedit /usr/share/fcitx/data/pyPhrase.org --encoding GB18030
    将会看到其格式为:拼音 词汇。其中每个汉字的拼音之间用'进行分隔。将“操作符”一词添加到此文件中,例如添加到文件开头,如下所示:
    ...
    cao'zuo'fu 操作符
    ...


3.生成二进制形式的字库文件。
在安装fcitx输入法时,会同步安装一个createPYMB工具,用来将.org文件转化为.mb文件格式。此工具的路径为:/usr/bin/createPYMB。不过/usr/bin路径已存在于PATH定义中,故在任何目录下均可直接使用此命令,而不须写明完整路径。
在终端中依次输入命令:
#备份默认的.mb文件(安全起见最好先做好备份)
cd /usr/share/fcitx/data
sudo mv pybase.mb pybase-old.mb
sudo mv pyphrase.mb pyphrase-old.mb
#转到用户根目录
cd ~
#生成.mb文件
sudo createPYMB /usr/share/fcitx/data/gbkpy.org /usr/share/fcitx/data/pyPhrase.org
运行结果如下:
Groups: 412
Reading Phrase: 221370
221370 Phrases, 221370 Converted!
Writing Phrase file ...
OK!
注:运行此命令后,除了在当前目录下生成2个.mb文件外,还会生成pyERROR和pyPhrase.ok这2个文件。其中pyERROR中保存了命令执行过程中产生的错误,如果此文件为空,表示此操作正常。pyPhrase.ok文件则与pyPhrase.org文件内容相同。此2个文件在后续可以删除。
#将当前目录下生成的2个.mb文件移动到/usr/share/fcitx/data目录
sudo mv pybase.mb pyphrase.mb /usr/share/fcitx/data


4.注销系统。
完成上述步骤,可以注销系统,重新登录,看看是不是已经生效了?

你可能感兴趣的:(Linux相关)