目录
1 中文分词
2 词性标注
3 情感分数
4 转换拼音
5 前n个关键词
6 前n个关键(中心)句
7 TF值
8 IDF值
9 繁简体转换
首先导入库
from snownlp import SnowNLP
s = SnowNLP('字太小,而且纸张也不好,有点黑,不过内容应该还不错。和预想的还是有点距离的...')
print(s.words)
print(list(s.tags))
print(s.sentiments)
print(s.pinyin)
print(s.keywords(4))
print(s.summary(1))
print(s.tf)
print(s.idf)
print(s.han)
print(s.sentences)
只能利用非英文语句分割符来将语句分割开,中英文分隔符混用时效果不好=^=
可以用re模块一次指定多个中英文分隔符
import re
t = '字太小,而且纸张也不好,有点黑,不过内容应该还不错。和预想的还是有点距离的...'
t_list = re.split('[,.;!,。;!]', t)
for i in range(t_list.count('')): #去除空字符串元素
t_list.remove('')
print(t_list)
Flag:我要成为一个日更选手:)