Mac下载安装nlp处理工具pyltp及其python实现

目录

一、操作环境

二、编译安装pyltp

三、填充pyltp中的空ltp文件夹

四、python处理NLP问题还需调用模型文件


pyltp 是哈工大出品的NLP处理工具,是 LTP 的 Python 封装。该工具提供了分词,词性标注,命名实体识别,依存句法分析,语义角色标注的功能,关于各个模块任务的介绍可以查阅 这里 的介绍。

一、操作环境

本文章是在我经历了许多心塞的报错后,总结出的安装方法,以下是我的操作环境:

  • 操作平台:Mac OS-10.13
  • python版本:python 3.6

二、编译安装pyltp

在mac终端下,网上说可以用pip安装,但是我执行后报错,于是我就从源代码编译安装。进入你想要放这个项目的目录,输入以下代码:

$ git clone https://github.com/HIT-SCIR/pyltp

之后ls一下,发现当前目录里多了这个pyltp的项目,然后执行以下代码:

$ git submodule init
$ git submodule update

之后进入这个pyltp文件夹,执行setup.py文件:

$ cd pyltp
$ python setup.py install

发现报错信息:error: $MACOSX_DEPLOYMENT_TARGET mismatch: now "10.12" but "10.13" during configure

1、进入到setup.py文件中,更改电脑版本号为10.13,大概在121行的位置

$ vim setup.py

如下图所示:

Mac下载安装nlp处理工具pyltp及其python实现_第1张图片

三、填充pyltp中的空ltp文件夹

pyltp文件夹中的ltp文件夹是一个link,所以,git clone下来之后,这个目录下面是空的。我们需要填充ltp文件夹,于是去 这里 把ltp这个源码下载下来,也就是下图第二个红框部分,解压后把里面的每个文件都复制到ltp文件夹中:

Mac下载安装nlp处理工具pyltp及其python实现_第2张图片

然后执行以下代码,再输入密码,等几分钟

$ sudo python setup.py install

下载好了,报如下信息:

看看能不能import进来,能:

四、python处理NLP问题还需调用模型文件

虽然以上步骤能够import进去,但是为了完成实际的NLP处理功能,还需要在 这里 下载模型文件以供完成不同任务时调用(如果需要历史版本的点击 这里 ),比如做依存句法分析时,需要调用parser.model,等。

Mac下载安装nlp处理工具pyltp及其python实现_第3张图片

关于这个下载好的模型文件夹放在什么路径,其实都行,主要是你用的时候知道它在哪里,写好路径就可以,以依存句法分析为例:

# 简单测试一下pyltp是否能正常使用
from pyltp import Parser              # 导入pyltp中的Parser
parser = Parser()                     # 把依存句法分析功能实例化
parser.load('ltp_model/parser.model') # 加载模型文件
a = ['莉莉','和','大家']        
b = ['n','v','d']
arc = parser.parse(a,b)               # 输入数据一个是分词后的字符串列表,一个是词性标注后的字符列表
arc[0].relation                       # 输出依存句法分析的标注关系

输出:'SBV'

意思是说,解析出来的第一个结果的relation是主谓关系,关于依存句法分析中的标注含义,见 这里 。

以上,搞定。
 

参考文章:https://www.cnblogs.com/herosoft/p/9787164.html

你可能感兴趣的:(Python,自然语言处理)