python高级(如何统计序列中元素的出现频率)

1.在随机序列中,找到出现频率次数最高的3个元素,它们各自出现的次数又是多少?

方法一:

from random import randint

data = [randint(0,20) for _ in range(30)]   #导入随机模块,创建一个随机列表

c = dict.fromkeys(data,0)    #字典fromkeys方法创建字典,列表中的每个元素作为字典中的键,0代表出现频率

for x in data:   #循环列表每个元素

   c[x] += 1      #列表中每个元素添加到字典中,代表字典的键,如果遇到有重复的键,键所对应的值,也就是出现频率会加1

from collections import Counter    #导入collections标准库中Counter模块

c2 = Counter(data)        #Counter方法传入字典

print(c2.most_common(3))    #most_common方法传入参数3,打印代表出现频率也就是字典中的值最高的3个键值对。

 

方法二:
from random import randint

data = [randint(0, 20) for _ in range(30)]   #导入随机模块,创建一个随机列表
c = set(data)   #创建集合,参数传入随机列表,把列表重复的元素都给去掉
a = {}      #定义空字典
for i in c:      #先循环集合中不重复的每个元素
    b = []        #定义空列表
    for v in data:    #再循环随机列表中每个元素
        if v == i:   
            b.append(v)     #如果随机列表出现的元素和集合中的元素匹配,就把元素加入到空列表中
            a[i] = len(b)  / a[i] = b.count(v)    #定义字典中的键为集合出现的元素,值为该元素出现在列表中的长度,或计算元素在列表中出现的个数,也即是元素出现的次数统计

new = sorted(a.items(), key=lambda x: x[1], reverse=True)[0:3]   

#利用sorted方法,参数传入字典的键值对进行排序,排序条件的关键值传入匿名函数,自定义x[1]为字典中的值作为条件,再进行从大到小排序,切片取前3个值最高的键值对。

print(new)

 

2.对某英文文章的单词,进行词频统计,找到出现次数最高的十个单词,它们出现的次数是多少?

import re   #导入正则表达式模块

from collections import Counter   #导入collections标准库中Counter模块

txt = open('a.txt') .read()   #打开文件,根据文件名自己改

c3 = Counter(re.split('\W+', txt))   #Counter方法参数传入正则表达式,根据\W匹配任何非单词数字字符进行分割。

print(c3.most_common(10))    取前10条最高记录

 

你可能感兴趣的:(python高级(如何统计序列中元素的出现频率))