jieba分词

worldcloud

  • 生成词云时,wordcloud 默认会以空格或标点为分隔符对目标文本进行分词处理。
  • 对于中文文本,分词处理需要由用户来完成。
  • 一般步骤是先将文本分词处理,然后以空格拼接,再调用wordcloud库函数。
  • 处理中文时还需要指定中文字体。
    例如,选择了微软雅黑字体(msyh.ttf)作为显示效果,需要将该字体文件与代码存放在同一目录下或在字体文件名前增加完整路径

简单使用

1、打开自己电脑C:\Windows\Fonts
在这里插入图片描述

2、选择微软雅黑字体(msyh.ttf)作为显示效果(当然也可以选择自己喜欢的字体样式)
右键复制,并将该字体文件与代码存放在同一目录下(或在字体文件名前增加完整路径),
将此文字文件命名为"msyh.ttf"
jieba分词_第1张图片

3、完整代码如下,

import jieba
from wordcloud import WordClo

你可能感兴趣的:(数据分析,python)