python实现简体中文转繁体中文

最近工作上的一个任务是将客户端的语言在简体中文和英文的基础上再增加繁体中文,同事推荐了一个python的库,名字叫zhconv,该库的优点是可以将文本中简体中文的部分翻译成繁体中文,比如,软件简体中文的翻译文件是个json格式的,我们就可以使用该库生成一个繁体中文的josn格式的翻译文件。

该库python2、3版本都支持。
 

首先安装zhconv

pip install zhconv

例子

命令行实现

    python -mzhconv [-w] {zh-cn|zh-tw|zh-hk|zh-sg|zh-hans|zh-hant|zh} < input > output

:实践中发现python2使用该命令行可以很好的支持,但python3不行,跟输入文件的编码有关系,原文件编码必须是utf-8的。因此,可以如下,写一个python的小程序,通过引入该库实现翻译。

代码实现

测试文件 zh_test.json

{
    "青花瓷":[
        "素胚勾勒出青花笔锋浓转淡",
        "瓶身描绘的牡丹一如你初妆",
        "冉冉檀香透过窗心事我了然",
        "宣纸上走笔至此搁一半"
    ]
}

通过程序输出文件 zhtw_test.json

{
        "青花瓷":[
                "素胚勾勒出青花筆鋒濃轉淡",
                "瓶身描繪的牡丹一如你初妝",
                "冉冉檀香透過窗心事我瞭然",
                "宣紙上走筆至此擱一半"
        ]
}

实现转换的代码

import zhconv
import sys
import os

def convertToZhtw(inputTsPath, outTsPath):
    with open(inputTsPath,'r', encoding='UTF-8') as f:
        content = f.read()
        with open(outTsPath,'w',encoding='UTF-8') as f1:
            f1.write(zhconv.convert(content, 'zh-tw'))

convertToZhtw('zh_test.json', 'zhtw_test.json')

你可能感兴趣的:(python)