(1)、wordcloud库概述
wordcloud是优秀的词云展示第三方库
- 词云以词语为基本单位,更加直观和艺术的展示文本
(2)、wordcloud库的安装
(cmd命令行) pip install wordcloud
(1)、wordcloud库基本使用
wordcloud库把词云当作一个WordCloud对象
- wordcloud.WordCloud()代表一个文本对应的词云
- 可以根据文本中词语出现的频率等参数绘制词云
- 绘制词云的形状、尺寸和颜色都可以设定
(2)、wordcloud库常规方法
w = wordcloud.WordCloud()
- 以WordCloud对象为基础
- 配置参数、加载文本、输出文件
方法 | 描述 |
w.generate(txt) | 向WordCloud对象w中加载文本txt, >>>w.generate("Python and WordCloud") |
w.to_file(filename) | 将词云输出为图像文件, .png或.jpg格式 >>>w.to_file("outfile.png") |
(3)、配置对象参数
w = wordcloud.WordCloud(<参数>)
参数 | 描述 |
width | 指定词云对象生成图片的宽度,默认400像素 >>>w=wordcloud.WordCloud(width=600) |
height | 指定词云对象生成图片的高度,默认200像素 >>>w=wordcloud.WordCloud(width=400) |
参数 | 描述 |
min_font_size | 指定词云中字体的最小字号,默认4号 >>>w=wordcloud.WordCloud(min_font_size=10) |
max_font_size | 指定词云中字体的最大字号,根据高度自动调节 >>>w=wordcloud.WordCloud(min_font_size=20) |
font_step | 指定词云中字体字号的步进间隔,默认为1 >>>w=wordcloud.WordCloud(font_step=2) |
参数 | 描述 |
font_path | 指定字体文件的路径,默认None >>>w=wordcloud.WordCloud(font_path="msyh.ttc") |
max_words | 指定词云显示的最大单词数量,默认200 >>>w=wordcloud.WordCloud(max_words=20) |
stop_words | 指定词云的排除词列表,即不显示的单词列表 >>>w=wordcloud.WordCloud(stop_words={"Python"}) |
参数 | 描述 |
mask | 指定词云形状,默认为长方形,需要引用imread()函数 >>>from scipy.misc import imread >>>mk=imread("pic.png") >>>w=wordcloud.WordCloud(mask=mk) |
background_color | 指定词云图片的背景颜色,默认为黑色 >>>w=wordcloud.WordCloud(background_color="white") |