wordcloud主要的使用就是下面三行代码
from wordcloud import WordCloud
wc = WordCloud(font_path=font_path, scale=1, collocations=False, background_color='white', width=400, height=300)
wc.generate_from_frequencies(count_dict) # 这里传入的是一个词频字典,也可以传入分好词的字符串
img = wc.to_image() # img是PIL的Image对象,可以通过.tobytes()生成图片的二进制数据
WordCloud
可以设置很多选项,当文本为中文会发现生成的词云图为框框,需要通过font_path
加载一个字体文件,通常windows自带字体文件,我们也可以从 git字体库下载,通过font_path
路径传入即可。
关于分词和生成词云图的代码,可以参考一下官网代码 用中文创建wordcloud