Python实例: wordcloud 政府工作报告词云

基本思路

  • 步骤1:读取文件、分词整理
  • 步骤2:设置并输出词云
  • 步骤3:观察结果,优化迭代
import jieba
import wordcloud
f = open(r"C:\Users\锦樽\Desktop\新时代中国特色社会主义.txt", "r", encoding="utf-8")
t = f.read()
f.close()
ls = jieba.lcut(t)
txt = " ".join(ls)
w = wordcloud.WordCloud( \
    width=1000, height=700, \
    background_color="white",
    font_path="msyh.ttc",
    max_words=40
)
w.generate(txt)
w.to_file("grwordcloud1.png")

Python实例: wordcloud 政府工作报告词云_第1张图片

#任意规则词云
import jieba
import wordcloud
from imageio import imread # 这个库 可以读取图片,并把图片变成图片文件表达的变量
mask = imread("per.jpeg") # 用mask 变量表达 per.jpeg 变量
f = open(r"C:\Users\锦樽\Desktop\新时代中国特色社会主义.txt", "r", encoding="utf-8")
t = f.read()
f.close()
ls = jieba.lcut(t)
txt = " ".join(ls)
w = wordcloud.WordCloud( font_path = "msyh.ttc",mask = mask,
width = 1000, height = 700, background_color = "white") # 添加maks参数
w.generate(txt)
w.to_file("grwordcloud2.png")

Python实例: wordcloud 政府工作报告词云_第2张图片
比较两个代码,只是修改了三个地方就可以表示任意图形的词云。
imread 方法 就是把图片容量作为词云的容量。
import jieba 、 import wordcloud 这两个库不太明白的 可以点击下方链接了解:
Python——有趣神奇的wordcloud 库,词云统计
Python—— jieba中文分词库 + 文本中文的名字词频统计,有意思没?

扩展能力

  • 了解wordcloud更多参数,扩展词云能力
  • 特色词云:设计一款属于自己的特色词云风格
  • 更多文件:用更多文件练习词云生成

你可能感兴趣的:(Python,实践题目)