网上找了好久各种好像,貌似都是到了关键点就含糊其辞的一笔带过,可能是博主能力太低无法理解吧,搞了好久终于算是搞定了,以此博文作为记录且供需要的各位小伙伴参考。
博主的操作环境是:
window10
anaconda3
pycharm
jdk1.8
此链接是博主获取的jpype写的一篇博文,具体获取jpype版本博文中都有告知。
jpype获取链接:https://blog.csdn.net/Jiajikang_jjk/article/details/83750758
获取hanlp jar包要和自己的python版本相一致,具体说明参考以下链接。
hanlp jar包获取链接:https://blog.csdn.net/Jiajikang_jjk/article/details/83756760
数据包获取:https://blog.csdn.net/Jiajikang_jjk/article/details/83756760
1:如下所示是博主创建的项目:NLP and actual combat—>chapter eight
2:如上图所示 data数据包,jar包,hanlp.properties配置文件 其中data数据包的路径是按照自己的意愿存放的。
3:hanpl.properties配置文件修改如下所示:
代码
"""
author:jjk
datetime:2018/11/5
coding:utf-8
project name:Pycharm_workstation
Program function: python调用HanLP分词(中文)
"""
import jpype
from jpype import *
# 调用HanLP的java包,如下路径下载并解压c盘即可:
# 启动JVM,Linux需替换分号;为冒号:
startJVM(getDefaultJVMPath(), "-Djava.class.path=F:/Pycharm/Pycharm_workstation/NLP and actual combat/chapter eight\hanlp-1.6.8.jar;"
"F:/Pycharm/Pycharm_workstation/NLP and actual combat/chapter eight", "-Xms1g", "-Xmx1g")
paraStr1='贾继康'
print("="*30+"HanLP分词"+"="*30)
HanLP = JClass('com.hankcs.hanlp.HanLP')
print(HanLP.segment(paraStr1))
jpype.shutdownJVM()
1、https://blog.csdn.net/xiaoyaozizai017/article/details/78783460
2、https://github.com/hankcs/pyhanlp/wiki/Windows
3、https://blog.csdn.net/weixin_36541072/article/details/78591690
4、https://www.cnblogs.com/ybf-yyj/p/7801429.html
5 、https://github.com/hankcs/pyhanlp/wiki/