几行代码绘制wordcloud词云

今天看了杨老师的博客,看到一篇关于制作词云的博文,他是参考另一位博主的。我也参考他们两试了试这个词云。
杨老师 http://blog.csdn.net/Eastmount/article/details/64438407
曹老师 http://blog.csdn.net/wireless_com/article/details/60571394


可以直接对一个文本做词云展示,也可以把你和你女朋友的聊天记录拿出来做,只要文本的,都可以!

对文本处理的话,若分词需要jieba分词,若提取关键词,可以用snownlp等等,相关python模块有很多,根据自己需要选择使用就行。

以上模块安装很简单,想必大家应该都pip过。

这里说一下wordcloud模块的装载。
直接 pip install WordCloud
在安装过程中可能会出错
几行代码绘制wordcloud词云_第1张图片

具体原因不太清楚,可以下载这个文件进行修正错误,我只能上传60M的文件,这个文件80M,大家还是在杨老师上传地下载 http://download.csdn.net/detail/eastmount/9788218,安装后就可以使用了。

直接上代码,我是对  海阔天空 歌词进行关键词提取的......然后提取30个关键词。
#coding=utf-8
from wordcloud import WordCloud
import matplotlib.pyplot as plt
import sys
from snownlp import SnowNLP
hktk='今天我寒夜里看雪飘过 怀著冷却了的心窝飘远方 风雨里追赶 雾里分不清影踪 天空海阔你与我 可会变(谁没在变) 多少次迎著冷眼与嘲笑 从没有放弃过心中的理想 一刹那恍惚 若有所失的感觉 不知不觉已变淡 心里爱(谁明白我) 原谅我这一生不羁放纵爱自由 也会怕有一天会跌倒 被弃了理想谁人都可以 那会怕有一天只你共我 今天我寒夜里看雪飘过 怀著冷却了的心窝飘远方 风雨里追赶 雾里分不清影踪 天空海阔你与我 可会变(谁没在变) 原谅我这一生不羁放纵爱自由 也会怕有一天会跌倒 被弃了理想谁人都可以 那会怕有一天只你共我 仍然自由自我 永远高唱我歌 走遍千里 原谅我这一生不羁放纵爱自由 也会怕有一天会跌倒 被弃了理想谁人都可以 那会怕有一天只你共我 被弃了理想谁人都可以 那会怕有一天只你共我 原谅我这一生不羁放纵爱自由 也会怕有一天会跌倒 被弃了理想谁人都可以 那会怕有一天只你共我'
hktk1=hktk.replace(' ',',')
#print hktk1
hktk=hktk1.decode('utf-8')
song=SnowNLP(hktk)

key=' '.join(song.keywords(30))
my_wordcloud = WordCloud().generate(key)

plt.imshow(my_wordcloud)

plt.axis('off')
plt.show()


注意,本代码在运行时,你的程序结果应该肯定会出错,显示的图片内容是乱码的,因为wordcloud的源码规定的字体对中文不支持,需要改正源代码。进入python包存放的目录下site-packages,修改wordcloud.py文件。
将29行代码的字体变量值改为图片中的字体值,并且下载一个对应字体文件,这样程序运行时,可以直接调用这个字体文件。
如图所示。一目了然。这个字体文件可以网上自己下载,也可以在我这里下载。 http://download.csdn.net/detail/accumulate_zhang/9793768
几行代码绘制wordcloud词云_第2张图片 几行代码绘制wordcloud词云_第3张图片

这样一路行来,可以自己绘制相关词云图了,不过更精彩的,或者更漂亮复杂的,大家自己研究吧。

展示一下我的 海阔天空
几行代码绘制wordcloud词云_第4张图片
这就当一个兴趣吧,可能会有用的。


你可能感兴趣的:(python)