jieba分词+绘制词云图

本文使用jieba分词进行分词,用wordcloud库绘制词云图。
需要注意的几点:

  • 对于中文句子我们需要首先进行分析,在使用空格间隔将字符串词拼接起来(wordcloud默认会以空格或标点 为分隔符对目标文本进行分词处理。)
  • 就是出来的结果,图片上没有汉字,都是各个颜色的方框,后来了解到是因为没有设置中文字体。因此对WordCloud函数添加参数font_path=‘msyh.ttc’(#微软雅黑字体(msyh.ttc))
import jieba
from wordcloud import WordCloud

txt='程序设计语言是计算机能够理解和识别用户操作意图的一种交互体系,它按 照特定规则组织计算机指令,使计算机能够自动进行各种运算处理。'
words=jieba.lcut(txt) #精确分词模式
nextxt=' '.join(words) #字符串拼接:空格分格
#词云生成
cloud=WordCloud(font_path='msyh.ttc').generate(nextxt)#微软雅黑字体(msyh.ttc)
cloud.to_file('cloud_chinexe.png')#保存图片

jieba分词+绘制词云图_第1张图片

你可能感兴趣的:(Python)