jieba库里的字典常用的各词性

本文详细介绍了jieba库里的字典中常用的各词性

一常用词性介绍

1.名词 (n):
    用于指示人、事、物或抽象概念的词汇。
    1.1 人名(nr)
    在jieba库中,词性标注中的nr表示人名。
    当使用allowPOS参数时,包含nr的词汇将被允许出现在分词的结果中。
    人名通常是文本中具有特殊意义的词汇,包括个人的姓氏和名字。
    1.2 地名 (ns)
    在jieba库中,词性标注中的ns表示地名。
    1.3 机构团体(nt)
    在jieba库中,词性标注中的nt表示机构团体。
    1.4 其他专有名词(nz)
    在jieba库中,词性标注中的nz表示其他专有名词。
下面是代码:
import jieba
text = "张三和李四是好朋友。"
result = jieba.cut(text, allowPOS=('n', 'nr'))
print(" ".join(result))

下面的所有词性,需要的只需要添加到allowPOS中即可。

2.动词 (v):
    描述动作、状态、或发生的过程。
	2.1 vn–动名词
3.形容词 (a):
    用于描述名词的特征或性质。

4.副词 (ad):
    修饰动词、形容词或其他副词,表示程度、时间、地点等关系。

5.数词 (m):
    表示数量或顺序的词。

6.量词 (q):
    用于表示数量的词。

7.代词 (r):
    用于代替名词的词汇。

8.介词 (p):
    表示名词之间、名词与其他词之间的关系。

9.连词 (c):
    用于连接词语或句子成分。

10.助词 (u):
    用于表示语气、时态等辅助功能的词。

11.感叹词 (e):
    表示强烈感情或意愿的词。

12.方位词 (f):
    表示方向、位置关系的词。

13.成语 (i):
    四字以上的固定词组。

14.习惯用语 (l):
    习惯性使用的固定表达。

15.拟声词 (o):
    模拟声音的词汇。

16.前缀 (h):
    词语前缀部分。

17.后缀 (k):
    词语后缀部分。

18.未知词 (un):
    未知或无法识别的词。
19.时间(t)
20.标点(w)

当在jieba库中使用分词时,可以通过allowPOS参数来指定允许的词性。在你提供的例子中,allowPOS=(‘n’, ‘nz’, ‘v’, ‘vd’, ‘vn’, ‘l’, ‘a’, ‘d’)表示只允许分词结果中包含名词、专有名词、动词、副动词、名动词、习惯用语、形容词和副词这几种词性。

二.常用词性的基本介绍

以下是对这些词性的简要说明:

名词 (n):用于指示人、事、物或抽象概念的词汇。
专有名词 (nz):专有的名称、地名等。
动词 (v):描述动作、状态、或发生的过程。
副动词 (vd):表语动词,用于表示状态。
名动词 (vn):表示具有名词和动词性质的词。
习惯用语 (l):习惯性使用的固定表达。
形容词 (a):用于描述名词的特征或性质。
副词 (d):修饰动词、形容词或其他副词,表示程度、时间、地点等关系。

通过限定词性,你可以更精确地控制分词的结果,使其符合特定的需求或任务。在实际使用中,根据具体场景和目标,可以灵活调整allowPOS参数。

你可能感兴趣的:(python)