在之前的文章《python数据分析(python基础语法)》中介绍过pythond中的六种标准的数据结构,其中列表list
,元组tuple
长得非常像,你有没有想过,列表和元组到底区别在哪儿呢?本篇文章将回答你的问题。
我们先来回顾下他们的基本概念及方法:
list
和元组tuple
,都是一个可以放置任意数据类型的有序集合,并且都可以随意嵌套。list
是动态的,长度大小不固定,可以随意增加、删减或者改变元素。tuple
是静态的,长度大小固定,无法增加、删减或改变元素。除非创建一个新的元组。list
和元组tuple
都支持初始化、索引及切片操作。list
和元组tuple
都包含一些常用的内置函数:.count()
、.index()
、.reverse()
/reversed()
、.sort()
/sorted()
等。以上可能都是大家已知的,不再赘述,我们看看列表和元组更深层次的一些区别:
前面说了,列表和元组最重要的区别就是,列表是动态的、可变的,二元组是静态的、不可变的。这样的差异,势必会影响两者的存储方式。我们来看下面的例子:
l=[1,2,3]
l.__sizeof__()
# 64
tup=(1,2,3)
tup.__sizeof__()
# 48
我们可以看到,对于列表和元组,我们放置了相同的元素,但是元组的存储空间却比列表少16个字节。这是为什么呢?
事实上,由于列表是动态的,所以它需要存储指针,来指向对应的元素(上述例子中,int型为8字节)。另外,由于列表可变,所以需要额外存储已经分配的长度大小(8字节),这样才可以实时追踪列表空间的使用情况,当空间不足时,及时分配额外空间。
l=[]
l.__sizeof__()
# 40 //空列表的存储空间为40字节
l.append(1)
l.__sizeof__()
# 72 //加入元素 1 之后,列表为其分配了可以存储4个元素的空间 (72-40)/8=4
l.append(2)
l.__sizeof__()
# 72 //由于之前已经分配了空间,所以加入元素 2,列表空间不变
l.append(3)
l.__sizeof__()
# 72 //同上
l.append(4)
l.__sizeof__()
# 72 //同上
l.append(5)
l.__sizeof__()
# 104 //加入元素 5 之后,列表的空间不足,所以又额外分配了可以存储4个元素的存储空间
上面的例子,大家对列表list
空间分配的过程是不是有了大概的了解?我们可以看到,为了减小每次增加/删减操作时空间分配的开销,python每次分配空间都会额外多分配一些,这样的机制(over-allocating)保证了其操作的高效性。
但是对于元组tuple
,情况就不同了。元组长度大小固定,元素不可变,所以存储空间固定。可以看出,元组的要比列表更加轻量级一些。
python有一个垃圾回收机制,就是在后台对静态的数据做一些资源缓存(resourse caching)。如果一些变量不被使用了,python就会回收他们所占用的内存,返还给操作系统,以便其他变量和其他应用使用。
但是对于一些静态变量,比如元组,如果他不被使用,并且占用空间不大时,python会暂时缓存这部分内存。这样,下次我们再创建同样大小的元组时,python就可以不用再向操作系统发出请求,去寻找内存,而是而是可以直接分配之前缓存的内存空间,这样就能大大加快程序运行的速度。
下面的例子,我们用timeit
模块的函数来计算初始化一个相同元素的列表和元组,索引操作分别所用的时间。比较下元组和列表的性能:
import timeit
# 初始化
print(timeit.timeit (stmt='x=[1,2,3,4,5]',number=10000000))
# 0.5384310339999274
print(timeit.timeit (stmt='x=(1,2,3,4,5)',number=10000000))
# 0.12699467200002346
# 索引操作
print(timeit.timeit (stmt='x=[1,2,3,4,5];y=x[3]',number=10000000))
# 0.7750472509999327
print(timeit.timeit (stmt='x=(1,2,3,4,5);y=x[3]',number=10000000))
# 0.32637773800001924
可以发现,在执行1000万次循环之后,无论是初始化还是索引操作,元组的耗时都要比元组少,也就是说,元组的性能要优于列表。
根据上面的分析,我们可以做一个总结,来区分列表和元组的使用场景:
思考题:
想创建一个空列表,我们可以用下面A,B两种方式,请问他们在效率上有事吗区别嘛?我们应该优先考虑是用那种呢?
#创建空列表
#option A
empty_list = list[]
#option B
empty_list = []
大家可以用``timeit`模块来测试下运行速度,在留言里附上你的答案哦!