1.在随机序列中,找到出现频率次数最高的3个元素,它们各自出现的次数又是多少?
方法一:
from random import randint
data = [randint(0,20) for _ in range(30)] #导入随机模块,创建一个随机列表
c = dict.fromkeys(data,0) #字典fromkeys方法创建字典,列表中的每个元素作为字典中的键,0代表出现频率
for x in data: #循环列表每个元素
c[x] += 1 #列表中每个元素添加到字典中,代表字典的键,如果遇到有重复的键,键所对应的值,也就是出现频率会加1
from collections import Counter #导入collections标准库中Counter模块
c2 = Counter(data) #Counter方法传入字典
print(c2.most_common(3)) #most_common方法传入参数3,打印代表出现频率也就是字典中的值最高的3个键值对。
方法二:
from random import randint
data = [randint(0, 20) for _ in range(30)] #导入随机模块,创建一个随机列表
c = set(data) #创建集合,参数传入随机列表,把列表重复的元素都给去掉
a = {} #定义空字典
for i in c: #先循环集合中不重复的每个元素
b = [] #定义空列表
for v in data: #再循环随机列表中每个元素
if v == i:
b.append(v) #如果随机列表出现的元素和集合中的元素匹配,就把元素加入到空列表中
a[i] = len(b) / a[i] = b.count(v) #定义字典中的键为集合出现的元素,值为该元素出现在列表中的长度,或计算元素在列表中出现的个数,也即是元素出现的次数统计
new = sorted(a.items(), key=lambda x: x[1], reverse=True)[0:3]
#利用sorted方法,参数传入字典的键值对进行排序,排序条件的关键值传入匿名函数,自定义x[1]为字典中的值作为条件,再进行从大到小排序,切片取前3个值最高的键值对。
print(new)
2.对某英文文章的单词,进行词频统计,找到出现次数最高的十个单词,它们出现的次数是多少?
import re #导入正则表达式模块
from collections import Counter #导入collections标准库中Counter模块
txt = open('a.txt') .read() #打开文件,根据文件名自己改
c3 = Counter(re.split('\W+', txt)) #Counter方法参数传入正则表达式,根据\W匹配任何非单词数字字符进行分割。
print(c3.most_common(10)) 取前10条最高记录