在Windows下离线安装pyhanlp

HanLP是一款优秀的中文自然语言处理工具,可以实现包括分词、词性标注、实体识别在内容诸多功能,详情见其项目主页。另外,该工具包还提供了python3的接口,在线安装很方便,但有时需要部署在内网机等没有网络环境的机器上,比较繁琐,整理步骤如下:

  1. 安装jpype1,这是pyhanlp的依赖包,可以下载编译好的.whl文件,地址在这,选择对应自己python版本和操作系统版本的后,用pip install *.whl进行安装即可。
  2. 安装java环境,由于HanLP是用java开发的,因此调用python的接口时机器上应该配置了java环境,可以在网上搜索安装。
  3. pyhanlp的项目主页下载完整的.zip压缩包,解压后进入文件夹执行python setup.py install
  4. 下载data-for-1.7.0.ziphanlp-1.7.0.-release.zip,解压后分别获得data文件夹和hanlp.propertieshanlp-1.7.0.jar文件。
  5. 进入python包的安装目录,以Anaconda为例,进入该安装目录下的./lib/site-packages/pyhanlp-0.1.44-py3.6.egg/pyhanlp文件夹,将4中得到的文件复制到本目录,保证目录的内部结构如下:
    hanlp
    |—static
    |  |—data
    |  |  |—dictionary
    |  |  |—model
    |  |  |—READ.html
    |  |  |—version.txt
    |  |—init.py
    |  |—hanlp.properties
    |  |—hanlp.properties.in
    |  |—hanlp-1.7.0.jar
    |  |—index.html
    |—init.py
    |—main.py
    |—server.py
    |—util.py
  6. 编辑hanlp.properties中的内容,更改其中root=行的内容,使其指向data文件夹的上一层,如root=D:/Anaconda/Lib/site-packages/pyhanlp-0.1.44-py3.6.egg/pyhanlp/static
  7. 打开命令行,输入hanlp -v,检查是否安装成功。正常应该返回jar包、data文件夹和hanlp.properties的位置。

你可能感兴趣的:(python包的安装)