NLPIR(ICTCLAS2015) Linux 使用

中科院的这个分词软件貌似是目前未知最好的分词软件了,今天学习了一下,其中包括一些下载和使用中的弯路和经验。

ps我是突然看见这个经验贴才知道还有那么一个网站的:在linux下使用NLPIR(ICTCLAS2015)进行中文分词

还有个C++的:如何用C语言(VisualStudio)调用NLPIR进行中文分词

一、安装Linux下的分词软件

由于网上的大多数分词软件的教程都是基于windows的,之前按照那些教程都不对。

找到一个网站:http://ictclas.nlpir.org/downloads 中科院分析系统下载,里面找到适合linux的


二、使用分词软件

里面有一个文件Sample,里面找到JnaTest_NLPIR文件,把整个工程导入到java工程中,先进行一些测试。

其中注意:

1.把data文件夹导入

2.异常:Unable to load library 的解决思路 把lib文件夹里对应的系统信息文件夹里面的.SO文件路径复制进去。

3.异常:没办法打开错误日志文件,因为路径不对,需要把路径设置成那个.err文件在的文件夹。

这里有一个博客说了点东西:用ICTCLAS对复旦语料库分词

关于configure文件:Linux中的./configure

4.中科院分词ICTCLAS5.0 配置错误处理 

你可能感兴趣的:(Machine,Learning)