哈工大中文分词系统LTP(pyltp)学习笔记

一、LTP简介

介绍:语言技术平台(LTP) 提供包括中文分词、词性标注、命名实体识别、依存句法分析、语义角色标注等丰富、高效、精准的自然语言处理技术。经过 哈工大社会计算与信息检索研究中心 11 年的持续研发和推广,LTP已经成为国内外最具影响力的中文处理基础平台,曾获 CoNLL 2009七国语言句法语义分析评测总成绩第一名,中文信息学会钱伟长一等奖等重要成绩和荣誉。目前,LTP 已经被 500多家国内外研究机构和企业使用,多家大企业和科研机构付费使用。

来源:语言云。

其他不做过多讲解,直接上官网。

二、附录

1、分词标注集

标记 含义 举例
B 词首 __中__国
I 词中 哈__工__大
E 词尾 科__学__
S 单字成词

2、词性标注集哈工大中文分词系统LTP(pyltp)学习笔记_第1张图片

因为这里手动加入表格太繁琐,所以我直接上图片。这里给大家说声对不起啦!!!

3、命名实体识别标注集

标记 含义
O 这个词不是NE
S 这个词单独构成一个NE
B 这个词为一个NE的开始
I 这个词为一个NE的中间
E 这个词位一个NE的结尾

LTP中的NE 模块识别三种NE,分别如下:

标记 含义
Nh 人名
Ni 机构名
Ns 地名

4、依存句法关系

嗯???
老样子,上图。再次给各位读者道歉!!!!
哈工大中文分词系统LTP(pyltp)学习笔记_第2张图片

5、语义角色类型

嗯???
道???
歉???
哈工大中文分词系统LTP(pyltp)学习笔记_第3张图片

其他的内容,先挖个坑,等学到了在更新这部分内容。

你可能感兴趣的:(Python编程,小新的学习笔记,NLP)