基于JAVA的Hanlp配置

HanLP基于Java语言的'装配'

    • 吐槽
    • 需要的东西
    • 具体操作
      • HanLP.jar和data
      • hanlp.properties文件内容
    • 效果
    • 相关的学习网址

吐槽

网上翻了很多相关Hanlp配置的相关连接,大多都是说要什么,也有github的连接,但是没有具体指出位置。甚至还有hanlp.properties配置写jdbc的。我真的佩服。在翻了一天的网站后(大多重复一致的),终于给我弄出来了(应该是弄出来了吧 = =)。

需要的东西

需要的东西就大部分网上说的东西:
1.Hanlp的jar
2.data文件夹(分为简易,标准,完整,三个版本)
3.hanlp.properties文件

具体操作

HanLP.jar和data

https://global.v2ex.com/t/503247
这个连接里可以直接点击下载Hanlp的jar包和数据部分

还有许多的网站给出的是GitHub的官方连接:
https://github.com/hankcs/HanLP/releases

这里应该下载latest release里的内容,就是第二张图中的几个zip文件(下载第一个和第二个就行)。
基于JAVA的Hanlp配置_第1张图片
基于JAVA的Hanlp配置_第2张图片
其中hanlp-1.7.6-release.zip里面就是相关的jar包。
hanlp-1.7.6.zip解压后有一个data文件可以直接拿来用(不知道怎么回事,我在没加入data文件是,运行词义拆分也是可以执行的,我暂时就是直接用的这个data)。

如果是Maven框架的话可以直接去官网的库中搜相关的JAR
https://mvnrepository.com/
在该网页中直接搜索需要的jar
基于JAVA的Hanlp配置_第3张图片
选择版本后,直接粘贴复制到pom.xml就行。

hanlp.properties文件内容

https://blog.csdn.net/baidu_15113429/article/details/76549319
这里面有相关的文件内容,直接创建一个空文件改下后缀就行。
同时,该连接也有目录的格式。可以照着去调整文件位置。如果用的是Maven框架,直接将文件放在resources的资源包里就可以了。

效果

package com.study.NatureSpilt;

import com.hankcs.hanlp.HanLP;

public class MainClass {

public static void main(String[] args) {

	    System.out.println(HanLP.segment("hanlp,自然语言处理!"));

    }

}

基于JAVA的Hanlp配置_第4张图片
如果出现报错,找不到文件之类的,去data文件夹里找相应的txt,然后到 hanlp.properties里去配置就行,照着样子写就OK。

相关的学习网址

https://www.hankcs.com/nlp/hanlp.html

这个是注码的解释:
https://www.hankcs.com/nlp/part-of-speech-tagging.html#h2-8

你可能感兴趣的:(自然语言处理,java)