Python 提供了几个高级内置函数,另外还有几个比较实用的库,比如 collections,这里推荐一篇文章,介绍几个小的 Tips,如果大家用上的话可以稍微提高一些开发效率,希望对大家有帮助哈。
工作中经常要处理各种各样的数据,遇到项目赶进度的时候自己写函数容易浪费时间。
Python 中有很多内置函数帮你提高工作效率!
1. 假设有一个数字列表 data, 过滤列表中的负数
使用列表推导式:
result = [i for i in data if i >= 0]
使用 fliter 过滤函数:
result = fliter(lambda x: x>= 0, data)
2. 学生的数学分数以字典形式存储,筛选其中分数大于 80 分的同学
d = {x:randint(50, 100) for x in range(1, 21)}
{k: v for k, v in d.items() if v > 80}
使用 zip() 函数
zip() 函数用于将可迭代的对象作为参数,将对象中对应的元素打包成一个个元组,然后返回由这些元组组成的列表。
>>> s1 = {x: randint(1, 4) for x in sample('abfcdrg', randint(1,5))}
>>> s1
{'b': 1, 'f': 4, 'g': 3, 'r': 1}
>>> d = {k:v for k, v in zip(s1.values(), s1.keys())}
>>> d
{1: 'r', 4: 'f', 3: 'g'}
1. 某随机序列中,找到出现次数最高的3个元素,它们出现的次数是多少?
构造随机序列如下:
data = [randint(0,20) for _ in range(20)]
方法1: 可以使用字典来统计,以列表中的数据为键,以出现的次数为值
from random import randint
from collections import Counter #导入collections标准库中Counter模块
def demo():
data = [randint(0, 20) for _ in range(10)] # 导入随机模块,创建一个随机列表
print(data)
# 列表中数字出现的次数
d = dict.fromkeys(data, 0) # 字典fromkeys方法创建字典,列表中的每个元素作为字典中的键,0代表出现频率
print(d)
for v in data: # 循环列表每个元素
d[v] += 1 # 列表中每个元素添加到字典中,代表字典的键,如果遇到有重复的键,键所对应的值,也就是出现频率会加1
c2 = Counter(data) # Counter方法传入字典
return c2.most_common(3) # most_common方法传入参数3,打印代表出现频率也就是字典中的值最高的3个键值对
print(demo())
方法2:直接使用 collections 模块下面的 Counter 对象
from random import randint
data = [randint(0, 20) for _ in range(30)] #导入随机模块,创建一个随机列表
c = set(data) #创建集合,参数传入随机列表,把列表重复的元素都给去掉
a = {} #定义空字典
for i in c: #先循环集合中不重复的每个元素
b = [] #定义空列表
for v in data: #再循环随机列表中每个元素
if v == i:
b.append(v) #如果随机列表出现的元素和集合中的元素匹配,就把元素加入到空列表中
a[i] = len(b) / a[i] = b.count(v) #定义字典中的键为集合出现的元素,值为该元素出现在列表中的长度,或计算元素在列表中出现的个数,也即是元素出现的次数统计
new = sorted(a.items(), key=lambda x: x[1], reverse=True)[0:3]
#利用sorted方法,参数传入字典的键值对进行排序,排序条件的关键值传入匿名函数,自定义x[1]为字典中的值作为条件,再进行从大到小排序,切片取前3个值最高的键值对。
print(new)
2. 对某英文文章单词进行统计,找到出现次数最高的单词以及出现的次数
通过上面的练习,我们知道可以用 Counter 来解决
import re
from collections import Counter
# 统计某个文章中英文单词的词频
with open('test.txt', 'r', encoding='utf-8')as f:
d = f.read()
total = re.split('\W+', d) # 所有的单词列表
result = Counter(total)
print(result.most_common(10))
比如班级中学生的数学成绩以字典的形式存储:
{"Lnad": 88, "Jim", 71...}
请按数学成绩从高到底进行排序!
方法1: 利用 zip 将字典转化为元组,再用 sorted 进行排序
>>> data = {x: randint(60, 100) for x in "xyzfafs"}
>>> data
{'x': 73, 'y': 69, 'z': 76, 'f': 61, 'a': 64, 's': 100}
>>> sorted(data)
['a', 'f', 's', 'x', 'y', 'z']
>>> data = sorted(zip(data.values(), data.keys()))
>>> data
[(61, 'f'), (64, 'a'), (69, 'y'), (73, 'x'), (76, 'z'), (100, 's')]
方法2: 利用 sorted 函数的 key 参数
>>> data.items()
>>> dict_items([('x', 64), ('y', 74), ('z', 66), ('f', 62), ('a', 80), ('s', 72)])
>>> sorted(data.items(), key=lambda x: x[1])
[('f', 62), ('x', 64), ('z', 66), ('s', 72), ('y', 74), ('a', 80)]
实际场景:在足球联赛中,统计每轮比赛都有进球的球员
第一轮: {"C罗": 1, "苏亚雷斯":2, "托雷斯": 1..}
第二轮: {"内马尔": 1, "梅西":2, "姆巴佩": 3..}
第三轮: {"姆巴佩": 2, "C罗":2, "内马尔": 1..}
模拟随机的进球球员和进球数
>>> s1 = {x: randint(1, 4) for x in sample('abfcdrg', randint(1,5))}
>>> s1
{'d': 3, 'g': 2}
>>> s2 = {x: randint(1, 4) for x in sample('abfcdrg', randint(1,5))}
>>> s2
{'b': 4, 'g': 1, 'f': 1, 'r': 4, 'd': 3}
>>> s3 = {x: randint(1, 4) for x in sample('abfcdrg', randint(1,5))}
>>> s3
{'b': 4, 'r': 4, 'a': 2, 'g': 3, 'c': 4}
首先获取字典的 keys,然后取每轮比赛 key 的交集。由于比赛轮次数是不定的,所以使用 map 来批量操作
map(dict.keys, [s1, s2, s3])
然后一直累积取其交集,使用 reduce 函数
reduce(lambda x,y: x & y, map(dict.keys, [s1, s2, s3]))
一行代码搞定!