一、1.0 简易版——简单理解词云
代码:
# Python Test1.py
import wordcloud #词云模块(属于第三方模块,需要事先下载)
w = wordcloud.WordCloud() #1.创建对象
txt = 'Anti Tracks is a complete solution ernet tracks'
w.generate(txt) #2.加载文本
w.to_file('cy1.png') #3.输出文件
运行后会在同一个文件夹里生成一个图片文件。
1.0 cy1.png的输出效果:
二、1.1 升级版——读取文件内容生成词云,并设置词云属性
代码:
#Python Word.py
import jieba #jieba中文分词
from wordcloud import WordCloud #导入wordcloud库中的wordcloud模块
import matplotlib.pyplot as plt #绘制图像的模块
#打开文件
path_txt='C://Users/pc/Desktop/国家民委2018年政府信息公开工作年度报告.txt' #文件位置
f = open(path_txt,'r',encoding='UTF-8').read()
# 使用jieba中文分词,生成字符串(wordcloud无法直接生成正确的中文词云)
cut_text = " ".join(jieba.cut(f)) #join() 方法用于将序列中的元素以指定的字符连接生成一个新的字符串。
#词云设置
wordcloud = WordCloud(
#设置字体,不然会出现口字乱码,文字的路径是电脑的字体一般路径,可以换成别的
font_path="C:/Windows/Fonts/simfang.ttf",
#设置了背景,宽高
background_color="white",width=1000,height=880).generate(cut_text)
plt.imshow(wordcloud, interpolation="bilinear") #plt.imshow()接收一张图像,只是画出该图,并不会立刻显示出来。
plt.axis("off") #off关闭坐标轴(axis:轴)
plt.show() #显示图像