python 绘制词云(四)(完整版)

准备工作

  • Jupyter
  • 第三方库:wordcloud (如何安装)
  • txt文件 (存至.py文件目录下)
  • 图片 (存至.py文件目录下)

绘制云图

jpg文件:
python 绘制词云(四)(完整版)_第1张图片

txt文件:
python 绘制词云(四)(完整版)_第2张图片
该文档内文字为淘宝搜索“智能”出现的第一页标题内容

(不建议大家爬虫,封号警告)

完整代码:

import wordcloud as wc
import matplotlib.pyplot as plt
import jieba
from PIL import Image
from numpy import array

path="test3.txt"
#从路径读取报告全文,存为data
data=open(path,"r",encoding="UTF-8").read()
#使用jieba分词
cutdata=jieba.cut(data)
alldata=""
for i in cutdata:
    alldata=alldata+" "+str(i)
#font=r"C:/Users/Windows/fonts/simkai.ttf"
#读图片
pic=Image.open("p3.jpg")
#图片转数组
picarray=array(pic)
#collocations=False表示是否归并词,传入字体路径,图片数组,设置背景颜色为白色,用alldata生成词云
mywc=wc.WordCloud(collocations=False, font_path='C:/Users/Windows/fonts/simkai.ttf',mask=picarray,background_color="white").generate(alldata)
#画布大小
fig = plt.figure(figsize=(10,10))
#展示图片
plt.imshow(mywc)
#去掉坐标轴
plt.axis('off')
plt.show()
mywc.to_file("zhineng.jpg")

词云绘制成功:
python 绘制词云(四)(完整版)_第3张图片该代码与前三节代码不同,前三节代码存在频率和字体大小不匹配问题,该代码可完美解决。

你可能感兴趣的:(Python)