python 第三方库 wordcloud 基本用法
wordcloud是一个词云展示的第三方库 ,需要安装使用。
以下演示在windows环境下进行。
演示版本为python3.7.4
1.安装
安装前在 pycharm中导入显示有问题
在windows联网下cmd窗口使用pip命令直接安装
pip install wordcloud
C:\WINDOWS\system32>pip install wordcloud
Collecting wordcloud
Downloading https://files.pythonhosted.org/packages/23/4e/1254d26ce5d36facdcbb5820e7e434328aed68e99938c75c9d4e2fee5efb/wordcloud-1.5.0-cp37-cp37m-win_amd64.whl (153kB)
100% |████████████████████████████████| 163kB 661kB/s
Collecting numpy>=1.6.1 (from wordcloud)
Downloading https://files.pythonhosted.org/packages/ce/61/be72eee50f042db3acf0b1fb86650ad36d6c0d9be9fc29f8505d3b9d6baa/numpy-1.16.4-cp37-cp37m-win_amd64.whl (11.9MB)
100% |████████████████████████████████| 11.9MB 340kB/s
Collecting pillow (from wordcloud)
Downloading https://files.pythonhosted.org/packages/40/f2/a424d4d5dd6aa8c26636969decbb3da1c01286d344e71429b1d648bccb64/Pillow-6.0.0-cp37-cp37m-win_amd64.whl (2.0MB)
100% |████████████████████████████████| 2.0MB 439kB/s
Installing collected packages: numpy, pillow, wordcloud
Successfully installed numpy-1.16.4 pillow-6.0.0 wordcloud-1.5.0
You are using pip version 19.0.3, however version 19.1.1 is available.
You should consider upgrading via the 'python -m pip install --upgrade pip' command.
自动对依赖的模块进行安装,安装后显示Successfully installed表示已经安装成功
再次查看pycharm中的import wordcloud没有红线,及表示可以正常使用
2.基本用法
import wordcloud
#wordcloud.WordCloud() 代表一个文本对应的词云,是词云对应的基础
w = wordcloud.WordCloud()#配置词云对象w
w.generate("python and wordcloud") #向对象w中输入加载文本(默认以空格进行区分)
w.to_file("outfile.jpg") #将词云生成为图像文件,命名为outfile.jpg
print(__file__)#查看当前文件路径
报错了
显示没有 matplotlib
在cmd中输入命令pip install matplotlib 即可
再次执行,会在当前脚本路径下生成对应的文件(默认为400*200像素)
3.对名著进行统计分析
import wordcloud
import jieba
import PIL.Image as image
import numpy
filename = 'E:/untitled/test/liyu.txt'
f = open(filename)
t = f.read()
f.close()
ls = jieba.lcut(t)#利于jieba库进行分词
txt = " ".join(ls)#将列表转换为空格分隔的字符串
mask = numpy.array(image.open("E:/untitled/test/peiqi.png"))#导入词云形状为小猪佩奇
w = wordcloud.WordCloud(font_path="msyh.ttc", #设置字体为微软雅黑
width=1000, #设置图片长度为1000
height=800, #设置图片宽度为800
min_font_size=4, # 最小字体为4号
max_font_size=100,# 最大字体为50号
max_words= 80,#设置词云单词数量
mask = mask,#改变词云形状
background_color="white"# 设置背景颜色为白色
)
w.generate(txt)
w.to_file("liyu.jpg")#默认和当前程序在同一目录
jieba 库主要是对中文进行以空格分词,最常用的为lcut方法
numpy,PIL是第三方库,我忘记了电脑什么时候安装的,这里就不再重新安装了,你们使用pip联网自己安装即可。
感谢“中国大学”提供思路
感谢宁老师带入门