snownlp库各功能及用法

目录

1 中文分词

2 词性标注

3 情感分数

4 转换拼音

5 前n个关键词

6 前n个关键(中心)句

7 TF值

8 IDF值

9 繁简体转换


首先导入库

from snownlp import SnowNLP

s = SnowNLP('字太小,而且纸张也不好,有点黑,不过内容应该还不错。和预想的还是有点距离的...')

1 中文分词

print(s.words)

2 词性标注

print(list(s.tags))

snownlp库各功能及用法_第1张图片

3 情感分数

print(s.sentiments)

4 转换拼音

print(s.pinyin)

snownlp库各功能及用法_第2张图片

5 前n个关键词

print(s.keywords(4))

6 前n个关键(中心)句

print(s.summary(1))

7 TF值

print(s.tf)

snownlp库各功能及用法_第3张图片

8 IDF值

print(s.idf)

snownlp库各功能及用法_第4张图片

9 繁简体转换

print(s.han)

10 分割句子

print(s.sentences)

只能利用非英文语句分割符来将语句分割开,中英文分隔符混用时效果不好=^=

可以用re模块一次指定多个中英文分隔符

import re

t = '字太小,而且纸张也不好,有点黑,不过内容应该还不错。和预想的还是有点距离的...'

t_list = re.split('[,.;!,。;!]', t)

for i in range(t_list.count('')):    #去除空字符串元素
    t_list.remove('')

print(t_list)

 


 

Flag:我要成为一个日更选手:)

你可能感兴趣的:(python,python,nlp,中文分词)