python词云(含中文英文)

python词云

from os import path

import jieba
import matplotlib.pyplot as plt
import numpy as np
from PIL import Image
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator

d = path.dirname(__file__)

# f = open('nickname.txt', 'r', encoding='UTF-8').read()
f = open('test.txt', 'r', encoding='UTF-8').read()
# 中文字体需要分词
wordlist = " ".join(jieba.cut(f, cut_all=True));

# 背景图片
cloud_image = np.array(Image.open(path.join(d, "girl3.jpg")))

# 设置停用词
stopwords = set(STOPWORDS)
stopwords.add("said")

# 你可以通过 mask 参数 来设置词云形状
wordcloud = WordCloud(background_color="white",  # 设置背景颜色
                      #max_words=2000,  # 设置最大显示的字数
                      mask=cloud_image,  # 设置背景图片
                      #stopwords=stopwords,  # 设置停用词
                      font_path="仿宋_GB2312.ttf",  # 设置中文字体,使得词云可以显示(词云默认字体是“DroidSansMono.ttf字体库”,不支持中文)
                      max_font_size=20,  # 设置字体最大值
                      random_state=12  # 设置有多少种随机生成状态,即有多少种配色方案
                      )
# 设置文本
wordcloud.generate(wordlist)

image_colors = ImageColorGenerator(cloud_image)

# 在只设置mask的情况下,你将会得到一个拥有图片形状的词云
#plt.imshow(wordcloud, interpolation="bilinear")
# 我们还可以直接在构造函数中直接给颜色
# 通过这种方式词云将会按照给定的图片颜色布局生成字体颜色策略
plt.imshow(wordcloud.recolor(color_func=image_colors), interpolation="bilinear")
plt.axis("off")
plt.figure()
plt.show()

wordcloud.to_file('test.png')

了解更多请关注微信公众【摩登猪头】,和作者互动,答疑等。公众号上准备了大量的资源等你来领取。你的关注是作者创作的动力。
python词云(含中文英文)_第1张图片

你可能感兴趣的:(Python)