自然语言学习笔记之——hanlp环境配置

 hanlp的环境配置还是比较简单的,这里我主要配置了两个环境,一个是java环境和python,具体如下:

目录

anaconda 安装hanLp

idea安装NLP


anaconda 安装hanLp

1 指定清华镜像,加速下载:

>pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pyhanlp

自然语言学习笔记之——hanlp环境配置_第1张图片

 2下载hanlp

自然语言学习笔记之——hanlp环境配置_第2张图片

 3 测试,如图所示安装成功:

自然语言学习笔记之——hanlp环境配置_第3张图片

代码测试:

from pyhanlp import *


def main():
    HanLP.Config.enableDebug()
    #  为了避免你等得无聊,开启调试模式说点什么:-)
    print(HanLP.segment("王国维和服务员"))


if __name__ == '__main__':
    main()

结果:

[王国维/nr, 和/cc, 服务员/nnt]

idea安装NLP

首先构建一个maven工程,然后在pom.xml文件中添加依赖如下,即可:

    
      com.hankcs
      hanlp
      portable-1.7.5
    

代码测试:

编写如下代码,测试正确安装

import com.hankcs.hanlp.HanLP;

public class NLPtext {
    public static void main(String[] args) {
        System.out.println(HanLP.segment("你好,欢迎使用HanLP汉语处理包!"));
    }
}

输出结果如下:

[你好/l, ,/w, 欢迎/v, 使用/v, HanLP/nx, 汉语/nz, 处理/v, 包/v, !/w]

为了方便在后续中使用分析中的数据。

需要将在anaconda中下载的数据拷贝到的idea项目中,该数据在

自然语言学习笔记之——hanlp环境配置_第4张图片

拷贝到:

自然语言学习笔记之——hanlp环境配置_第5张图片 

 代码测试:

package NLPLearn.chapter02;
import com.hankcs.hanlp.corpus.io.IOUtil;
import com.hankcs.hanlp.dictionary.CoreDictionary;


import java.util.TreeMap;

public class dictLoad {
    public static void main(String[] args) throws Exception{
        TreeMap dictionary = IOUtil.loadDictionary("data/dictionary/CoreNatureDictionary.mini.txt");

        System.out.println(dictionary.size());

        System.out.println(dictionary.keySet().iterator().next());

    }
}

结果:

85584
±

你可能感兴趣的:(自然语言处理NLP,自然语言处理)