简繁转换


注: 原来的linux-wiki突然当掉了,于是就粘贴过来:

http://www.linux-wiki.cn/index.php?title=%E7%AE%80%E7%B9%81%E8%BD%AC%E6%8D%A2&variant=zh-tw

漢字簡繁轉換的意義不言而喻,本文討論在Linux中實現簡繁轉換的幾種方法之優劣。


提示: 
本文所提供的方法都不完善,如果你有更好的方案,歡迎修改本文。
目錄
[隱藏]
1 OpenOffice.Org的轉換功能
2 google翻譯功能
3 使用iconv轉換
4 使用cconv轉換
5 不同方法比較
5.1 測試樣例
5.2 測試結果
OpenOffice.Org的轉換功能
OpenOffice.Org提供簡繁功能,使用很方便(在工具->語言->中文簡繁轉換)。


google翻譯功能
http://translate.google.com/ google翻譯也可以做簡繁轉換,效果分析見後面。




使用iconv轉換
iconv是用來轉換編碼的小工具。現在的iconv在執行編碼從gb2312到big5的轉化時,實現了簡繁轉換。


使用iconv進行簡繁轉換的方法為:


iconv -f gb2312 -t big5 gb_input.txt > big5_output.txt
如果原來的文件是UTF-8編碼的,則需要使用命令:


iconv -f utf8 -t gb2312 jian.txt | iconv -f gb2312 -t big5 | iconv -f big5 -t utf8 > fan.txt
注意一定要先轉化成gb2312,再由gb2312轉成big5。


繁簡轉換則類似:


iconv -f utf8 -t big5 fan.txt | iconv -f big5 -t gb2312 | iconv -f gb2312 -t utf8 > jian.txt
如果有zh-autoconvert,則可以用它代替中間的iconv,如


iconv -f utf8 -t big5 fan.txt | autogb | iconv -f gbk -t utf8 > jian.txt



iconv -f utf8 -t gbk jian.txt | autob5 | iconv -f big5 -t utf8 > fan.txt
使用cconv轉換
http://code.google.com/p/cconv/


ubuntu用戶可以用命令「sudo apt-get install cconv」安裝。


cconv是建立在iconv之上,增加了詞語轉換能力,效果分析見後面。


使用cconv進行簡繁轉換的方法為:


cconv -f UTF8-CN -t UTF8-HK jian.txt -o fan.txt



你可能感兴趣的:(简繁转换)