Hanlp 在Python环境中安装、介绍及使用

标签:自定义mpat高效pathnlpsys文件prifrom

Hanlp

HanLP是由一系列模型与算法组成的Java工具包,目标是普及自然

语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构

清晰、语料时新、可自定义的特点。

功能:中文分词 词性标注 命名实体识别 依存句法分析 关键词提取

新词发现 短语提取 自动摘要 文本分类 拼音简繁


Hanlp环境安装

? 1、安装Java和Visual C++:我装的是Java 1.8和Visual C++ 2015。

? 2、安裝Jpype,conda install -c conda-forge jpype1

? 3、测试是否按照成功:

from jpype import *

startJVM(getDefaultJVMPath(), "-ea")

java.lang.System.out.println("Hello World")

shutdownJVM()


Hanlp安装

1、下载hanlp.jar包: https://github.com/hankcs/HanLP

2、下载data.zip:https://github.com/hankcs/HanLP/releases中

http://hanlp.linrunsoft.com/release/data-for-1.7.0.zip后解压数据

包。

3、配置文件

 示例配置文件:hanlp.properties

配置文件的作用是告诉HanLP数据包的位置,只需修改第一行:

root=usr/home/HanLP/

 比如data目录是/Users/hankcs/Documents/data,那么

root=/Users/hankcs/Documents/



文章来源于网络

你可能感兴趣的:(Hanlp 在Python环境中安装、介绍及使用)