关于《后浪》的B站弹幕分析总结(三)——怎么制作好看的交互式词云

目录

    • 一、对分词做词频统计
    • 二、使用wordcloud展示词云
    • 二、使用pyecharts绘制词云
    • 三、使用词云制作工具

与本文相关内容链接:

  • B站视频《[数说弹幕]我不小心看了后浪弹幕》
  • 关于《后浪》的B站弹幕分析总结(一)——爬取B站视频的上万条弹幕的方法
  • 关于《后浪》的B站弹幕分析总结(二)——分词常用的词典、颜文字处理以及格式统一

词云实现的前提是已经做过了分词,关于如何分词参考我前一篇文章,文章链接在上方,这里不再复述。

一、对分词做词频统计

import collections #词频统计库
word_counts=collections.Counter(object_list) #对分词做词频统计

二、使用wordcloud展示词云

import wordcloud #词云展示库
from PIL import Image,ImageDraw,ImageFont#图像处理库
import matplotlib.pyplot as plt
mask= plt.imread('彩色浪花3.jpg') #这个jpg文件就是你想要展示词云的背景图片
wc=wordcloud.WordCloud(
    scale=20,
    background_color='white',
    font_path='C:\Windows\Fonts\simhei.ttf', #设置字体格式以显示中文
    mask=mask,
    max_words=200, #设置所展示词组数量的最大值
    max_font_size=100, #设置字体的最大值
    random_state=30
)
wc.generate_from_frequencies(word_counts) #从字典生成词云
image_colors=wordcloud.ImageColorGenerator(mask) #获取背景图颜色信息
wc.recolor(color_func=image_colors) #将词云颜色设置为背景图颜色
plt.imshow(wc,interpolation='bilinear') #显示词云
plt.axis('off') #关闭坐标轴

效果如下:
关于《后浪》的B站弹幕分析总结(三)——怎么制作好看的交互式词云_第1张图片

二、使用pyecharts绘制词云

from pyecharts import options as opts
from pyecharts.charts import WordCloud
from pyecharts.globals import SymbolType
c = (
    WordCloud()
    .add("", words, word_size_range=[20, 100], shape=SymbolType.DIAMOND)
    .set_global_opts(title_opts=opts.TitleOpts(title="WordCloud-shape-diamond"))
    .render("wordcloud_diamond.html")
)

这种方法得到的图表以html格式存储,特点是可交互。

三、使用词云制作工具

https://wordart.com/,这个网址是个在线的图云生成工具,操作起来非常简单,只需要将词组和词组的频率输入表格中,再上传自己的背景图就可以了,也可以使用网站自带的背景图。需要注意的一点就是,因为网站是英文环境,不认中文字体,但是可要在fonts中上传你需要的中文字体就可以了。还有就是词组的颜色需要手动输入。
关于《后浪》的B站弹幕分析总结(三)——怎么制作好看的交互式词云_第2张图片
关于《后浪》的B站弹幕分析总结(三)——怎么制作好看的交互式词云_第3张图片
这个工具可以很自由的设置你需要的字体和背景样式,而且可以生成可交互的词云图。当然还有其他比较好用的工具可以评论交流。

在下一篇文章中我将介绍使用lda模型做主题挖掘,敬请期待

你可能感兴趣的:(文本分析实战)