nlp分词之pkuseg

北大的分词工具
(1)多领域分词。新闻、科研、网络、医药、旅游、金融、工业。
(2)更高的分词准确率
(3)支持用户自训练模型,支持用户使用全新的标注数据进行训练。
如果PyPI官方源下载速度不理想建议使用镜像源,比如
初次安装:
pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple pkuseg
医药领域的模型下载地址:
https://github.com/lancopku/pkuseg-python/releases/download/v0.0.16/medicine.zip" to C:\Users\fangb/.pkuseg
手动下载zip文件 https://github.com/lancopku/pkuseg-python/releases

你可能感兴趣的:(nlp入门)