登高壮观天地间,大江茫茫去不还。黄云万里动风色,白波九道流雪山。
jieba库用于处理汉字文章, wordcloud用于构成词云,imageio用于选择图片 。结巴先生和imageio库都可以直接在电脑终端中输入 pip install jieba /imageio安装,而词云小姐可以先下载适合自己python版本的安装包,在电脑终端输入 pip install ,再将安装包拖入 install 之后安装。
电脑终端,在鼠标右击开始处后,点击运行,输入cmd,黑框框既是也。
选文本,连接文本至python,处理文本 ,这是结巴的活;words=jieba.lcut(f) 把文本中高频词制成列表,words为列表,f为引用的文本, txt=' '.join(words)将列表words制成一句好长好长的字符串,这是词云要用的,此乃承上启下。
词云最重要的是处理参数,高宽几何,背景颜色几何,最大词语数量......高宽是为height,width;最大词语数量为max_words; 背景颜色是background_color;最小,最大字号为min/max_font_size; 字号之间进格为font_step; 字体为font_path; 若不想展示一些词语,用stop_words.
尔后,用generate() 选择词云对象,用to_file()形成词云.
用imread()选择图片,用词云参数处理中mask引入图片.
玄幻小说灵衍九域,当为矫龙之姿 !
import jieba
import wordcloud
import imageio
mk=imageio.imread('1114.jpg')
fc=open('灵衍九域词云.txt','r')
f=fc.read()
fc.close()
words=jieba.lcut(f)
txt=' '.join(words)
yun=wordcloud.WordCloud(width=800,height=800,mask=mk,\
font_path='msyh.ttc',max_words=50,\
background_color='white')
yun.generate(txt)
yun.to_file('玄幻小说灵衍九域词云.png')