开源一个高效获得汉子偏旁部首、拼音的python库

最近因为做命名实体识别,需要用到汉子偏旁部首作为一个输入特征,找了很多库都不太理想,决定动手实现一个。

github地址:https://github.com/wangchuan2008888/cn-radical

安装过程十分简单:

$git clone https://github.com/wangchuan2008888/cn-radical.git
$cd cn-radical
$python setup install

或者使用pip

pip install cnradical

使用也非常简单:

from cnradical import Radical, RunOption

radical = Radical(RunOption.Radical)
pinyin = Radical(RunOption.Pinyin)

input = '你好,今天早上吃饭了吗'
radical_out = [radical.trans_ch(ele) for ele in input]
pinyin_out = [pinyin.trans_ch(ele) for ele in input]
print(radical_out)
print(pinyin_out)

radical_out = radical.trans_str(input)
pinyin_out = pinyin.trans_str(input)
print(radical_out)
print(pinyin_out)
目前只在python3.5/python3.6上测试过,如果有需要再其他版本python上使用的,请留言,我会尽快适配。

你可能感兴趣的:(NLP,Python,python,NLP,汉语)