用python的re库统计《斗破苍穹》词频

一:直接上代码,代码很简单的,纯属娱乐

import re
with open(r'C:\Users\admin\Desktop\computer\dp.txt','r', encoding='gb18030') as f:
    txt = f.read()

a = 1
while a:
    a = input('输入:')
    rel=re.compile(a)
    rell=rel.findall(txt)
    print(len(rell))


主要步骤:
1: 导入re正则表达库
2: 下载斗破小说,打开文本文件
3: 获取用户输入,利用正则表达式进行匹配
4: 匹配返回一个列表,列表长度就是该词的数量

代码实现的前提是在对应的目录中下载了斗破的txt文本

二:接下来,让我们恶趣味的统计一下¥_¥

先看看和萧炎有渊源的女人
用python的re库统计《斗破苍穹》词频_第1张图片
女主的出现频率有点低呢,可能是我的输入词汇不对

用python的re库统计《斗破苍穹》词频_第2张图片
还有一些补充
用python的re库统计《斗破苍穹》词频_第3张图片
这次实验的斗破是无错字纯净版,如果是老版的斗破,可能结果又不尽相同了

你可能感兴趣的:(python)