Python实例分析——文本词频统计

基于中国大学mooc网嵩天老师的《Python语言程序设计》课程实例

文章目录

  • 一、数字文本 pi
  • 二、英文文本 *Hamlet*
  • 三、中文文本《三国演义》

一、数字文本 pi

问题描述:
统计并输出圆周率pi小数点后1000位中各数字出现频率并排序

完整代码:

txt = open('pi1000.txt', 'r').read()    # 获取文本文件
counts = {}    # 创建空字典

for num in txt:
    if num == ' ':    # 排除数字文本中可能出现的空格
        continue
    else:
        counts[num] = counts.get(num, 0) + 1  # 统计词频并在字典中创建键值对
items = list(counts.items())       # 将无序的字典类型转换为可排序的列表类型
items.sort(key=lambda x: x[1], reverse=True)   # 以元素的第二列进行从大到小排序

for i in range(10):
    num, count = items[i]
    print("{:<5}:{:>5}".format(num, count))    # 格式化输出排序结果

结果展示:

你可能感兴趣的:(面试,学习路线,阿里巴巴,python,开发语言,pycharm)