情感分析(Sentiment Analysis)是自然语言处理里面比较高阶的任务之一。维基百科上的定义是:
文本情感分析(也称为意见挖掘)是指用自然语言处理、文本挖掘以及计算机语言学等方法来识别和提取原素材中的主观信息。
听着很高大上,是吧?如果说得具体一点呢?给你一段文本,你就可以用情感分析的自动化方法获得这一段内容里包含的情感色彩是什么。神奇吧?情感分析不是炫技工具。它是闷声发大财的方法。早在2010年,就有学者指出,可以依靠Twitter公开信息的情感分析来预测股市的涨落,准确率高达87.6%!在这些学者看来,一旦你能够获得大量实时社交媒体文本数据,且利用情感分析的黑魔法,你就获得了一颗预测近期投资市场趋势的水晶球。看着实在是很,奈何自己太菜,又想体验一下,网上扒拉了一下,果然有相关的包。SnowNLP包直接对句子进行一个评分,分数越高,表示该局情绪越积极。废话不多说,直接po案例咯:
1. 首先导入包,先看一下这个包的划分句子的能力
from snownlp import SnowNLP
text=u"我今天很快乐。我今天很愤怒。"
s=SnowNLP(text)
for sentence in s.sentences:
print(sentence)
output:
我今天很快乐
我今天很愤怒
2.看一下情感分析结果吧
第一句:
s1=SnowNLP(s.sentences[0])
print(s1.sentiments)
output:
0.971889316039116
第二句:
s2=SnowNLP(s.sentences[1])
print(s2.sentiments)
output:
0.07763913772213482
Tips:
1.在对文本分句的时候其实只是按照标点符号分割,如果一句话是逗号隔开,也会分成两句。这个方法仅供娱乐,如果有更高的要求,还是要训练算法。
2.SnowNLP只是针对中文的,如果是英文,可以导入TextBlob包,用法是一样的。
参考 https://www.cnblogs.com/wangqingshuai/articles/8445508.html