SnowNLP 情感分析

# -*- coding:utf-8 -*-
import sys
from snownlp import SnowNLP
from jieba import analyse
from jieba import posseg


txt = u'''在文学的海洋中,有一部名为《薄雾》的小说,它犹如一颗闪耀的明珠,让人过目难忘。这部作品讲述了一段发生在上世纪初的跨越阶级的爱情故事。在这篇文学短评中,我们将探讨这部小说所展现的情感与人性,以及它在文学史上的地位。'''
 


# 1 分词(Tokenization):将长文本划分为单独的词汇。
s = SnowNLP(txt)
print(s)
# 2 词性标注(Part-of-Speech Tagging):标注文本中每个词汇的词性,如名词、动词等。
print('词性标注')
tags = [word for word in s.tags]
tagss = [(key, val) for key, val in posseg.cut(txt)]

print(tags)
print(tagss)
# 3 情感分析(Sentiment Analysis):判断文本的情感倾向是正面还是负面
print(s.sentiments)
# 4 文本转换(Text Conversion):实现简体和繁体中文之间的转换。
print(s.han)  # 繁体字转普通字
# 5 关键词提取(Keywords Extraction):提取文本中的关键词。
print(s.keywords(limit=5))
# 6 摘要生成(Summarization):从文本中提取关键句生成摘要。
print(s.summary(3))

# 字频统计 tf
print(s.tf)

你可能感兴趣的:(python,开发语言)