Python入门基础超详细的Hamlet词频统计

程序分析

        1.我们准备一个hamlet.txt文件放入到我们的项目中,内容在下方链接:            https://python123.io/resources/pye/hamlet.txt

        2.在自定义函数中以只读方式打开,并使用字符替换函数replace()将特殊字符替换成空格。


        3.将数据已空格为标志进行切割成列表形式,遍历列表将单词计数存入字典中。这里我们要使用字典中的get()函数,计数时分两种情况:(1)如果当前单词不在字典中则get()函数返回0并加1赋值形成新的键值对。(2)如果当前单词已存在字典中(已存在有键值对)get()函数返回键中的值再加1重新赋值计数。

源码

def getText():
    file = open("hamlet.txt", "r").read()
    # 以只读的方式打开文件
    file = file.lower()
    # 将文件中的字母全部变为小写
    for flag in '!"#$%&()*+,-./:;<=>?@[\\]^_‘{|}~':
        # 将文章中的特殊字符替换成空格并返回
        file = file.replace(flag, " ")
    return file


fileStr = getText()
words = fileStr.split()  # 以空格为标记进行切割成列表形式
count = {}  # 定义字典类型
for word in words:
    count[word] = count.get(word, 0)+1
    # 如果当前单词不在字典中则get()函数返回0并加1赋值形成新的键值对
    # 如果当前单词已存在字典中(已存在有键值对)get()函数返回键中的值再加1重新赋值计数


items = list(count.items())
# 将字典中的键值对转换为列表形式  方便后面操作数据遍历

for i in range(20):
    # 遍历前二十个单词的数量
    word, count = items[i]
    print("{0:<2}词组>>> {1:>5}个".format(word, count))


输出结果 

Python入门基础超详细的Hamlet词频统计_第1张图片

 程序非常的简单,因为是刚入学python写不出惊艳的代码,希望对小伙伴们有细微的帮助!

你可能感兴趣的:(python入门基础,python,开发语言,后端)