Python 词云 【中/英】小白简单入门教程

1. 分析

构建词云需要具备:

原料即文章等内容

将内容进行分词

将分词后的内容利用构建词云的工具进行构建

保存成图片

2. 需要的主要模块

jieba 中文分词

wordcloud 构建词云

3. 模块原理

wordcloud的实现原理

文本预处理

词频统计 

将高频词以图片形式进行彩色渲染

jieba的实现原理

进行中文分词(有多种模式)

4. 英文词云

英文分词和构建词云只需要wordcloud模块

Python学习资料或者需要代码、视频加Python学习群:960410445

具体实现如下:

5. 中文分词

具体实现如下:

import jieba

cut = jieba.cut(text)  #text为你需要分词的字符串/句子

string = ' '.join(cut)  #将分开的词用空格连接

6. 中文词云

中文词云需要jieba和wordcloud模块

具体实现如下:

7. 实现效果

英文词云实现效果如下:


中文词云实现效果如下:

你可能感兴趣的:(Python 词云 【中/英】小白简单入门教程)