Python制作炫酷的词云图(包含停用词、词频统计)!!!

Python制作词云图(包含停用词、词频统计)

话不多说,直接先上词云效果图!!!

Python制作炫酷的词云图(包含停用词、词频统计)!!!_第1张图片
Python制作炫酷的词云图(包含停用词、词频统计)!!!_第2张图片
Python制作炫酷的词云图(包含停用词、词频统计)!!!_第3张图片

想根据自己喜欢的颜色、字体、以及背景蒙版制作词云图吗?别急,往下看!

分词以及词频统计的代码片段:
(包含停用词库:即不想分出来的词,不想显示在词云图中的词,可根据生成效果进行添加停用词!)

with open('需要分析的文本.txt', encoding='utf-8') as f:
    data = f.read()

# 文本预处理 :只提取出中文
new_data = re.findall('[\u4e00-\u9fa5]+', data, re.S)
new_data = "/".join(new_data)

# 分词
seg_list_exact = jieba.cut(new_data, cut_all=True)
result_list = []
with open('停用词库.txt', encoding='utf-8') as f: #可根据需要打开停用词库,然后加上不想显示的词语
    con = f.readlines()
    stop_words = set()
    for i in con:
        i = i.replace("\n", "")  
        stop_words.add(i)
for word in seg_list_exact:
    if word not in stop_words and len(word) > 1:
        result_list.append(word)
# print(result_list)
word_counts = collections.Counter(result_list)

# 词频统计:获取前100最高频的词
word_counts_top = word_counts.most_common(100)
print(word_counts_top)

想获得绘制词云图的全部代码(包含详细注释,让你无忧)以及停用词库和测试文本吗?

关注“轨迹时空”公众号并回复“词云图”即可获得!!!
Python制作炫酷的词云图(包含停用词、词频统计)!!!_第4张图片

你可能感兴趣的:(python,数据可视化,数据分析)