NLPIR分词系统的使用

前身是2000年发布的ICTCLAS,2009年更为现名。张华平博士打造。

Java课设做自动问答系统,用到了,所以记录一下使用方法,网上方法可能有点老,所以自己发现没有那么复杂。

  1. https://github.com/NLPIR-team/NLPIR 上下载源码,结构如下:NLPIR分词系统的使用_第1张图片

  1. 特别注意,NLPIR分词系统中的证书,每一个月需更新一次。每个工程中的Data文件基本都是过期的,运行时,需用License中的最新的Data文件进行更新user用户权限。(License每一个月更新一次)
  2. 我只用到了NLPIR SDK中的projects里面的ICTCLAS__Java(Eclipse导入时,只导ICTCLAS__Java文件即可),NLPIR-ICTCLAS分词系统,也测试了KeyExtract关键词提取技术。(分词系统中有白名单和黑名单什么的,好像是一个txt文件,可以自定义词汇)
  3. 遇到的错误:

            (1) test不认识,是因为没有导juint包,在项目中下载build进去,注意不是导入外面的包;

            (2) 我的报错是这样的:java.lang.UnsatisfiedLinkError: Unable to load library 'win64/NLPIR.dll': Native library (win32-x86-               64/win64/NLPIR.dll) not found in resource path

              解决方法:在src文件夹下创建win64 package,将NLOIE.dll放入即可解决;遇到引用这个的工程时,也导入过

             (3) 还根据错误提示,在引用它的工程中导入过Data文件夹

你可能感兴趣的:(自然语言处理)