wordcloud库,与,橡皮泥

目录

壹:介绍

贰:安装

叁:准备

肆:代码

伍:最后


壹:介绍

        Python 第三方库 “wordcloud库” 的功能是创建词云;你可以将创建词云的过程想象成“捏橡皮泥”。是的,我们在此引入了“橡皮泥”的概念。( ´(00)`)

        通过词频统计,我们知道了文本中的高频词是哪些,但,是否有更好的方法来呈现我们统计出来的数据呢?“wordcloud库” 词云!


贰:安装

        推荐采用镜像法安装:pip install  -i https://pypi.tuna.tsinghua.edu.cn/simple wordcloud

        如果你遇到了安装失败的情况,请打开“wordcloud库”专栏的另一篇博文(限于篇幅,不在此赘述)。


叁:准备

        在正式开始创建词云前,我们需要一些准备,即,了解代码,与,准备文本文档

《基本知识》
       w = wordcloud.WordCloud()        创建词云对象(我们可以在括号里添加参数)
       w.generate("txt")        将 “txt文本” 加载到词云对象中
       w.to_file("P.png")        将词云输出为图片,格式为 “png”

        下面是我准备好的文本文档,大家可以复制后直接使用(可以考虑按住"Shift键"复制)。

《魔镜》

……
(嘿,听着,接下来我要讲个故事。对,真的只是一个故事。)
……
“魔镜啊魔镜,你说o,谁,是这个世界上最美丽的女人?”
呼噜——
”咳咳咳,魔镜?”
”啊,谁啊,莫吵吵,我睡着了。“
“镜酱,镜酱?”
呕吐——
“有啥快问,麻溜点,女人。”
“咳咳咳,魔镜啊魔镜,告诉我,谁,是世界上最美丽的女人?”(一双如玉的小手轻掩嘴唇,眼睫毛微微颤动,盖着黑黝黝的大眼睛,,,编不下去了,自行想象)
“啊——”
“嗯?”
“嗯——”
“嗯???”
“猴子,不是你。”
“啊?不是我(震怒)???!!!”非常生气。
“如果不是我,是谁?”
……
她是一个善良的女孩。
……


肆:代码

        那么,接下来,就让我们开始创建我们的第一个词云吧。(*'▽'*)♪

# -*- coding: utf-8 -*-
"""
Created on Fri Jan 14 19:01:59 2022

@author: will
"""

#%%
# 调用函数库。

import wordcloud

import jieba # 对中文进行分词。

#%%
# 获取文本。

txt = open("《魔镜》.txt","r").read()

words = jieba.lcut(txt)

#print(words)

#%%
# 处理获取的文本。

A = list()

for word in words:
    
    if len(word) == 1:
        
        pass
    
    else:
        
        A.append(word)
        
#print(A)

#%%
# 创建词云。

txt = " ".join(A)

stopwords = set() # 创建一个用来剔除的词语的集合。

w = wordcloud.WordCloud(font_path="simhei.ttf", background_color="white",width=600,\
                       height=400,stopwords=stopwords)

w.generate(txt)

w.to_file("mirror.png")

#%%
# 待优化。

        然后,这是运行结果图。

wordcloud库,与,橡皮泥_第1张图片


伍:最后

        “当然,细心的你已经发现,最后的运行结果图不太好看(一个字,丑),怎么美化我们的运行结果呢?当然是,在词云对象 "w" 中增加参数,或者,imageio库(当然别的库也行,如,PIL库)!”

        “ wordcloud库的扩展用法大家可以在社区的其他博文中发现,至于imageio库的用法我将在不久的将来更新。”

你可能感兴趣的:(不同的函数库,python)