opencc

本来以为只需要pip install opencc就可以了,但是发现并不是这样,第一次提醒需要安装distribute的zip文件,安装解压放到对应的位置之后,还是继续报错:
后来又决定直接下载opencc的安装包然后使用setup.py来处理。下载之后已经可以正常导入了,但是根据下一步操作需要直接输入命令行:
opencc -i wiki.zh.text -o wiki.zh.text.simple -c zht2zhs.ini
但是输入之后电脑不识别这条命令,再次确认,以为是要将中文的繁体文件放入opencc的安装包下才可以,再次实验,仍然失败,查找各种案列,在这里, https://www.jianshu.com/p/af02db32fac2 发现需要下载的是opencc的压缩包,然后将需要运行的文件直接放在解压后的文件中再敲入命令行。
于是又重新下载了一个压缩包,将文本放入,
运行:opencc -i wiki.zh.text -o wiki.zh.jian.text -c t2s.json
这时,又爆出电脑没有c++的dll可以处理,所以又下载了一个c++的插件,等待简体数字的整合中。整个生成过程估计五分钟左右。生成了:wiki.zh.jian.text
之前使用的网上的写入转换的方式,跑了一下午也没跑完,估计是比较占内存,果断放弃。
python中warning的忽略:
import warningswarnings.filterwarnings( 'ignore' )







你可能感兴趣的:(opencc)