pyltp模块安装及使用

系统:win7
语言:python3.6

1.选择安装wheels方法

1. pip install pyltp #失败
2. 使用源码安装也未成功

参考文章https://www.jianshu.com/p/9518b5cf325a选择使用wheels方法安装

1.1.下载wheels

下面两个文件针对不同的python版本下载一个即可:

pyltp-0.2.1-cp35-cp35m-win_amd64.whl

pyltp-0.2.1-cp36-cp36m-win_amd64.whl

1.2.安装文件

下载好了以后, 在命令行下, cd到wheel文件所在的目录, 然后使用命令pip install wheel文件名安装.
pyltp模块安装及使用_第1张图片

1.3.测试

可以直接在命令窗口中测试,代码如下:
pyltp模块安装及使用_第2张图片
安装pyltp完成!!!!

1.4.模型下载

使用里面的预训练模型,需要先下载,然后指定相应目录 - 下载地址:ltp.ai/download.html
注意:
ltp3.4.0 版本 SRL模型 pisrl.model在windows系统下不可用 下载这个:pisrl_win.model

2.pyltp使用

2.1.分词

from pyltp import Segmentor
seg = Segmentor() #生成对象
seg.load("D:\myprojects\LTP\ltp_data_v3.4.0\cws.model") #加载分词预训练模型
seg_words = seg.segment("我爱自然语言处理技术!")
print(" ".join(seg_words))
seg.release() #释放资源

输出:我 爱 自然 语言 处理 技术 !

2.2词性标注(对分好的词进行标注)

from pyltp import Postagger
pos=Postagger()
#加载词性预训练模型
pos.load("D:\myprojects\LTP\ltp_data_v3.4.0\pos.model")
words_pos=pos.postag(seg_words)
for k,v in zip(seg_words, words_pos):
    print(k+'\t'+v)
pos.release()

输出:
我   r
爱   v
自然  n
语言  n
处理  v
技术  n
!   wp

2.3.命名体识别

from pyltp import NamedEntityRecognizer
ner = NamedEntityRecognizer()
#加载命名
# 实体识别预训练模型
ner.load("D:\\myprojects\\LTP\\ltp_data_v3.4.0\\ner.model")
netags=ner.recognize(seg_words,words_pos)
print(" ".join(netags))
ner.release()

输出:

2.4.依存句法分析

from pyltp import Parser
parser=Parser()
parser.load("D:\myprojects\LTP\ltp_data_v3.4.0\parser.model")
arcs=parser.parse(seg_words,words_pos)
print([(arc.head,arc.relation) for arc in arcs])
parser.release()

输出:
[(2, 'SBV'), (0, 'HED'), (4, 'ATT'), (5, 'FOB'), (2, 'VOB'), (5, 'VOB'), (2, 'WP')]

2.5.语义角色标注

from pyltp import SementicRoleLabeller
labeller = SementicRoleLabeller()
labeller.load("D:\myprojects\LTP\ltp_data_v3.4.0\pisrl_win.model")
roles = labeller.label(seg_words,words_pos,arcs)
for role in roles:
    print(role.index, "".join(["%s:(%d,%d)" % (arg.name, arg.range.start, arg.range.end) for arg in role.arguments]))
 
 输出:
1 A0:(0,0)A1:(2,5)
4 A1:(5,5)

参考:
1.https://www.jianshu.com/p/9518b5cf325a
2.https://zhuanlan.zhihu.com/p/51426918

你可能感兴趣的:(机器学习,NLP)