参考文章来源于公众号:Python大数据分析 作者:费弗里
大家可以关注一下,有很多的Python处理数据的技巧,也可以关注一下早起Python,都是不错的Python学习公众号~
列表(List)是你使用Python过程中接触最为频繁的数据结构,也是功能最为强大的几种数据结构之一。Python列表非常的万能且蕴含着许多隐藏技巧,下面我们就来探索一些常用的列表技巧。
filter()函数接受2个参数:1个函数对象以及1个可迭代的对象,接下来我们定义1个函数然后对1个列表进行过滤。
首先我们创建1个列表,并且剔除掉小于等于3的元素:
## input
original_list = [1,2,3,4,5] #定义列表
#定义过滤函数
def filter_three(number):
return number >3
filtered = filter(filter_three,original_list)
filtered_list = list(filtered)
filtered_list
## output
[4, 5]
类似的,我们也可以利用列表推导式来过滤列表元素,作为一种生成和修改列表优雅的方式,列表推导式想必大家都比较熟悉了,下面是使用列表推导完成同样任务的过程:
## input
original_list = [1,2,3,4,5]
# 在列表推导过程中引入条件判断
filtered_list = [number for number in original_list if number >3]
print(filtered_list)
## output
[4, 5]
Python中内置的map()函数使得我们可以将某个函数应用到可迭代对象内每一个元素之上。
比方说我们想获取到一个列表对象中每一个元素的平方,就可以使用到map()函数,就像下面的例子一样:
## input
original_list = [1,2,3,4,5]
def square(number):
return number ** 2
squares = map(square,original_list)
# squares = map(lambda x: x**2,original_list)
squares_list = list(squares)
print(squares_list)
## output
[1, 4, 9, 16, 25]
同样的我们也可以使用列表推导式完成同样的任务:
## input
original_list = [1,2,3,4,5]
squares_list = [number ** 2 for number in original_list]
print(squares_list)
## output
[1, 4, 9, 16, 25]
有些情况下我们需要将两个或以上数量的列表组合在一起,这类需求使用zip()来完成非常方便。
zip()函数接收多个列表作为参数传入,进而得到每个位置上一一对应的元素组合,就像下面的例子一样:
## input
numbers = [1,2,3]
letters = ["a","b","c"]
combined = zip(numbers,letters)
print(combined)
combined_list = list(combined)
print(combined_list)
for item in zip(numbers,letters):
print(item[0],"\t",item[1])
## output
<zip object at 0x000001BE01F9DF88>
[(1, 'a'), (2, 'b'), (3, 'c')]
1 a
2 b
3 c
Python中的列表是有序的数据结构,正因如此,列表中元素的顺序很重要,有些时候我们需要翻转列表中所有元素的顺序,可以通过Python中的切片操作,用::-1来快捷地实现:
## input
original_list = [1,2,3,4,5]
reversed_list = original_list[::-1]
print("翻转前:",original_list)
print("翻转后:",reversed_list)
## output
翻转前: [1, 2, 3, 4, 5]
翻转后: [5, 4, 3, 2, 1]
有些情况下我们想要检查列表中是否存在某个元素,这种时候就可以使用到Python中的in运算符,譬如说我们有一个记录了所有比赛获胜队伍名称的列表,当我们想查询某个队名是否已获胜时,可以像下面的例子一样:
## input
games = ["Yankees","Yankees","Cubs","Blues Jays","Giants"]
def isin(item,list_name):
if item in list_name: print(f"{item} is in the list!")
else:print(f"{item} is not in the list!")
isin("Blue Jays",games)
isin("Angels",games)
## output
Blue Jays is not in the list!
Angels is not in the list!
有些情况下我们想要找出列表中出现次数最多的元素,譬如对记录若干次抛硬币结果的列表,找出哪一种结果出现次数最多,就可以参考下面的例子:
## input
coins_result = ["正面","正面","反面","正面","反面"]
items = set(coins_result)
print(max(items,key = coins_result.count))
## output
正面
有些情况下我们会遇到一些嵌套的列表,其每个元素又是各自不同的列表,这种时候我们就可以利用列表推导式来把这种嵌套列表展平,如下面2层嵌套的例子:
## input
nested_list = [[1,2,3],[4,5,6],[7,8,9]]
flat_list = [i for j in nested_list for i in j]
print(flat_list)
## output
[1, 2, 3, 4, 5, 6, 7, 8, 9]
额外补充:
原作者这里只考虑到两层嵌套的列表,如果是更多层嵌套,就需要有多少层写多少for循环,比较麻烦,其实还有一种更好的方法,我们可以使用pip install dm-tree来安装tree这个专门用于展平嵌套结构的库,可以展平任意层嵌套列表,使用例子如下(如果显示没有模块tree,可能同时安装了dm-tree和tree,卸载两者并重新安装dm-tree即可):
## input
import tree
nested_list_2d = [[1,2,3],[4,5,6],[7,8,9]]
nested_list_3d = [[[1,2],[3,4]],
[[5,6],[7,8]],
[[9,10],[11,12]]]
print(tree.flatten(nested_list_2d))
print(tree.flatten(nested_list_3d))
## output
[1, 2, 3, 4, 5, 6, 7, 8, 9]
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]
如果你想要查看列表中的值是否都是唯一值,可以使用Python中的set数据结构的特点,譬如下面的例子:
## input
list1 = [1,2,3,4,5]
list2 = [1,1,2,3,4]
def isunique(m):
if len(m) == len(set(m)):
print("唯一!")
else:
print("不唯一!")
isunique(list1)
isunique(list2)
## output
唯一!
不唯一!
参考文章链接:https://mp.weixin.qq.com/s/ai05dozOgZZak9HiKeX_MA