利用jieba库和wordcloud库绘制词云图像

目录

jieba库的使用

利用jieba库获取红楼梦中人物名字的出现频次

wordcloud库的使用

 根据红楼梦中人物出现频次,制作词云图


jieba库的使用

jieba库是优秀的中文分词工具,能对文本进行分词处理

常用函数: lcut 与 cut

lcut 函数 接受一个中文文本字符串,对该文本进行分词处理,返回一个分词列表(推荐使用)

而 jieba.cut 生成的是一个生成器, generator, 可以通过 for 循环来取里面的每一个值

jieba.posseg模块

利用posseg模块分词,标注了分词的词性

词性表

利用jieba库和wordcloud库绘制词云图像_第1张图片

利用jieba库获取红楼梦中人物名字的出现频次

import jieba
from jieba import posseg

jieba.setLogLevel(jieba.logging.INFO)  # 防止报错

ignores = ['什么','一个','我们','那里','你

你可能感兴趣的:(python学习,python)