Python赋值操作或函数参数传递,传递的永远是对象引用(即内存地址),而不是对象内容。在Python中一切皆对象,对象又分为可变(mutable)和不可变(immutable)两种类型。对象拷贝是指在内存中创建新的对象,产生新的内存地址。当顶层对象和它的子元素对象全都是immutable不可变对象时,不存在被拷贝,因为没有产生新对象。浅拷贝(Shallow Copy),拷贝顶层对象,但不会拷贝内部的子元素对象。深拷贝(Deep Copy),递归拷贝顶层对象,以及它内部的子元素对象。
- 可变对象与不可变对象
- copy模块
- 其它拷贝方法
一、可变对象与不可变对象
Python中一切皆对象,对象就像一个塑料盒子, 里面装的是数据。对象有不同类型,例如布尔型和整型,类型决定了可以对它进行的操作。现实生活中的"陶器"会暗含一些信息(例如它可能很重且易碎,注意不要掉到地上)。
对象的类型还决定了它装着的数据是允许被修改的变量(可变的mutable)还是不可被修改的常量(不可变的immutable)。你可以把不可变对象想象成一个透明但封闭的盒子:你可以看到里面装的数据,但是无法改变它。类似地,可变对象就像一个开着口的盒子,你不仅可以看到里面的数据,还可以拿出来修改它,但你无法改变这个盒子本身,即你无法改变对象的类型。
- mutable : 可变对象,如List、Dict
- immutable : 不可变对象,如Number、String、Tuple、Frozenset
注意: Python赋值操作或函数参数传递,传递的永远是对象引用(即内存地址),而不是对象内容
In [1]: a = 1
In [2]: b = a
In [3]: id(a)
Out[3]: 9164864
In [4]: id(b)
Out[4]: 9164864
In [5]: b += 1
In [6]: a
Out[6]: 1
In [7]: b
Out[7]: 2
In [8]: id(a) # 对象引用a还是指向Number对象1
Out[8]: 9164864
In [9]: id(b) # 对象引用b指向了Number对象2
Out[9]: 9164896
Python会缓存使用非常频繁的小整数-5至256、ISO/IEC 8859-1单字符、只包含大小写英文字母的字符串,以对其复用,不会创建新的对象:
1. 不会创建新对象
In [1]: a = 10
In [2]: b = 10
In [3]: id(a)
Out[3]: 9165152
In [4]: id(b)
Out[4]: 9165152
In [5]: a = '@'
In [6]: b = '@'
In [7]: id(a)
Out[7]: 139812844740424
In [8]: id(b)
Out[8]: 139812844740424
In [9]: a = 'HELLOWORLDhelloworld'
In [10]: b = 'HELLOWORLDhelloworld'
In [11]: id(a)
Out[11]: 139812785036792
In [12]: id(b)
Out[12]: 139812785036792
2. 会创建新的对象
In [1]: a = 1000
In [2]: b = 1000
In [3]: id(a)
Out[3]: 140528314730384
In [4]: id(b)
Out[4]: 140528314731824
In [5]: a = 'x*y'
In [6]: b = 'x*y'
In [7]: id(a)
Out[7]: 139897777405880
In [8]: id(b)
Out[8]: 139897777403808
In [9]: a = 'Hello World'
In [10]: b = 'Hello World'
In [11]: id(a)
Out[11]: 139897789146096
In [12]: id(b)
Out[12]: 139897789179568
二、copy模块
对象拷贝是指在内存中创建新的对象,产生新的内存地址。
- 浅拷贝只拷贝最外层对象,深拷贝还会递归拷贝内层对象
- 无论是浅拷贝还是深拷贝,只拷贝mutable可变对象成为一个新对象,而immutable不可变对象还是原来的那个
- 当顶层对象和它的子元素对象全都是immutable不可变对象时,因为没有产生新对象,所以不存在被拷贝
2.1浅拷贝
浅拷贝(Shallow Copy),拷贝顶层对象,但不会拷贝内部的子元素对象。
2.1.1. 顶层是mutable,子元素全是immutable
当顶层对象是mutable可变对象,但是它的子元素对象全都是immutable不可变对象时,如[1, 'world', 2]
① 创建列表对象并赋值给变量a
In [1]: a = [1, 'world', 2]
In [2]: [ id(item) for item in a ]
Out[2]: [9164864, 140104749066928, 9164896]
In [3]: id(a)
Out[3]: 140104759916040
② 导入copy模块,使用copy.copy()函数浅拷贝a,并赋值给变量b
In [4]: import copy
In [5]: b = copy.copy(a)
In [6]: b
Out[6]: [1, 'world', 2]
In [7]: [ id(item) for item in b ]
Out[7]: [9164864, 140104749066928, 9164896]
In [8]: id(b)
Out[8]: 140104760027784
③ 修改变量a的子元素a[0] = 3,由于整数是不可变对象,所以并不是修改1变为3,而是更改a[0]指向对象3
In [9]: a[0] = 3
In [10]: a
Out[10]: [3, 'world', 2]
In [11]: b
Out[11]: [1, 'world', 2]
In [12]: [ id(item) for item in a ]
Out[12]: [9164928, 140104749066928, 9164896]
In [13]: [ id(item) for item in b ]
Out[13]: [9164864, 140104749066928, 9164896]
2.1.2. 顶层是mutable,子元素部分immutable
当顶层对象是mutable可变对象
,但子元素也存在mutable可变对象
时,如[1, 2, ['hello','world']]
① 浅拷贝copy.copy()
只拷贝了顶层对象,没有拷贝子元素对象['hello','world'],即a[2]和b[2]指向同一个列表对象
In [1]: a = [1, 2, ['hello','world']]
In [2]: import copy
In [3]: b = copy.copy(a)
In [4]: id(a)
Out[4]: 139770596269064
In [5]: id(b)
Out[5]: 139770596639368
In [6]: [ id(item) for item in a ]
Out[6]: [9164864, 9164896, 139770596304840]
In [7]: [ id(item) for item in b ]
Out[7]: [9164864, 9164896, 139770596304840]
In [8]: [ id(item) for item in a[2] ]
Out[8]: [139770585378520, 139770585378408]
In [9]: [ id(item) for item in b[2] ]
Out[9]: [139770585378520, 139770585378408]
② 修改a[2][1] = 'china',则b[2][1] = 'china'
In [10]: a[2][1] = 'china'
In [11]: a
Out[11]: [1, 2, ['hello', 'china']]
In [12]: b
Out[12]: [1, 2, ['hello', 'china']]
In [13]: [ id(item) for item in a[2] ]
Out[13]: [139770585378520, 139770584993552]
In [14]: [ id(item) for item in b[2] ]
Out[14]: [139770585378520, 139770584993552]
2.1.3. 顶层是immutable,子元素全是immutable
当顶层对象是immutable不可变对象,同时它的子元素对象也全都是immutable不可变对象时,如(1, 2, 3)
In [1]: a = (1, 2, 3)
In [2]: import copy
In [3]: b = copy.copy(a)
In [4]: id(a)
Out[4]: 139664680010016
In [5]: id(b)
Out[5]: 139664680010016
In [6]: [ id(item) for item in a ]
Out[6]: [9164864, 9164896, 9164928]
In [7]: [ id(item) for item in b ]
Out[7]: [9164864, 9164896, 9164928]
变量a与变量b指向的是同一个元组对象,没有拷贝
2.1.4. 顶层是immutable,子元素部分mutable
当顶层对象是immutable不可变对象时,但子元素存在mutable可变对象时,如(1, 2, ['hello','world'])
In [1]: a = (1, 2, ['hello','world'])
In [2]: import copy
In [3]: b = copy.copy(a)
In [4]: id(a)
Out[4]: 139650704096640
In [5]: id(b)
Out[5]: 139650704096640
In [6]: [ id(item) for item in a ]
Out[6]: [9164864, 9164896, 139650704068680]
In [7]: [ id(item) for item in b ]
Out[7]: [9164864, 9164896, 139650704068680]
In [8]: [ id(item) for item in a[2] ]
Out[8]: [139650692293328, 139650692293216]
In [9]: [ id(item) for item in b[2] ]
Out[9]: [139650692293328, 139650692293216]
In [10]: a[2][1] = 'china'
In [11]: a
Out[11]: (1, 2, ['hello', 'china'])
In [12]: b
Out[12]: (1, 2, ['hello', 'china'])
变量a与变量b指向的是相同的元组对象,并且a[2]与b[2]指向同一个列表,所以修改a[2][1]会影响b[2][1]
2.2. 深拷贝
深拷贝(Deep Copy),递归拷贝顶层对象,以及它内部的子元素对象
2.2.1. 顶层是mutable,子元素全是immutable
当顶层对象是mutable可变对象,但是它的子元素对象全都是immutable不可变对象时,如[1, 'world', 2]
In [1]: a = [1, 'world', 2]
In [2]: import copy
In [3]: b = copy.deepcopy(a)
In [4]: id(a)
Out[4]: 140664823442376
In [5]: id(b)
Out[5]: 140664823349192
In [6]: [ id(item) for item in a ]
Out[6]: [9164864, 140664823391544, 9164896]
In [7]: [ id(item) for item in b ]
Out[7]: [9164864, 140664823391544, 9164896]
In [8]: a[0] = 3
In [9]: a
Out[9]: [3, 'world', 2]
In [10]: b
Out[10]: [1, 'world', 2]
In [11]: [ id(item) for item in a ]
Out[11]: [9164928, 140664823391544, 9164896]
In [12]: [ id(item) for item in b ]
Out[12]: [9164864, 140664823391544, 9164896]
变量a与变量b指向不同的列表对象,修改a[0]只是将列表a的第一个元素重新指向新对象,不会影响b[0]
2.2.2. 顶层是mutable,子元素部分mutable
当顶层对象是mutable可变对象,但子元素也存在mutable可变对象时,如[1, 2, ['hello','world']]
In [1]: a = [1, 2, ['hello','world']]
In [2]: import copy
In [3]: b = copy.deepcopy(a)
In [4]: id(a)
Out[4]: 140531593252104
In [5]: id(b)
Out[5]: 140531593479304
In [6]: [ id(item) for item in a ]
Out[6]: [9164864, 9164896, 140531593299016]
In [7]: [ id(item) for item in b ]
Out[7]: [9164864, 9164896, 140531593324232]
In [8]: [ id(item) for item in a[2] ]
Out[8]: [140531582302896, 140531582302784]
In [9]: [ id(item) for item in b[2] ]
Out[9]: [140531582302896, 140531582302784]
In [10]: a[2][1] = 'china'
In [11]: a
Out[11]: [1, 2, ['hello', 'china']]
In [12]: b
Out[12]: [1, 2, ['hello', 'world']]
In [13]: [ id(item) for item in a[2] ]
Out[13]: [140531582302896, 140531581905808]
In [14]: [ id(item) for item in b[2] ]
Out[14]: [140531582302896, 140531582302784]
深拷贝既拷贝了顶层对象,又递归拷贝了子元素对象,所以a[2]与b[2]指向了两个不同的列表对象(但是列表对象的子元素初始指定的字符串对象一样),修改a[2][1] = 'china'后,它重新指向了新的字符串对象(内存地址为140531581905808),不会影响到b[2][1]
2.2.3. 顶层是immutable,子元素全是immutable
当顶层对象是immutable不可变对象,同时它的子元素对象也全都是immutable不可变对象时,如(1, 2, 3)
In [1]: a = (1, 2, 3)
In [2]: import copy
In [3]: b = copy.deepcopy(a)
In [4]: id(a)
Out[4]: 140021832303960
In [5]: id(b)
Out[5]: 140021832303960
In [6]: [ id(item) for item in a ]
Out[6]: [9164864, 9164896, 9164928]
In [7]: [ id(item) for item in b ]
Out[7]: [9164864, 9164896, 9164928]
变量a与变量b指向的是同一个元组对象,不存在拷贝
2.2.4. 顶层是immutable,子元素部分mutable
当顶层对象是immutable不可变对象时,但子元素存在mutable可变对象时,如(1, 2, ['hello','world'])
In [1]: a = (1, 2, ['hello','world'])
In [2]: import copy
In [3]: b = copy.deepcopy(a)
In [4]: id(a)
Out[4]: 140437037631672
In [5]: id(b)
Out[5]: 140437085244440
In [6]: [ id(item) for item in a ]
Out[6]: [9164864, 9164896, 140437036297096]
In [7]: [ id(item) for item in b ]
Out[7]: [9164864, 9164896, 140437036357960]
In [8]: [ id(item) for item in a[2] ]
Out[8]: [140437024839640, 140437024839528]
In [9]: [ id(item) for item in b[2] ]
Out[9]: [140437024839640, 140437024839528]
In [10]: a[2][1] = 'china'
In [11]: a
Out[11]: (1, 2, ['hello', 'china'])
In [12]: b
Out[12]: (1, 2, ['hello', 'world'])
In [13]: [ id(item) for item in a[2] ]
Out[13]: [140437024839640, 140437016189336]
In [14]: [ id(item) for item in b[2] ]
Out[14]: [140437024839640, 140437024839528]
变量a与变量b指向的是不同的元组对象,同时a[2]与b[2]指向不同的列表对象,所以修改a[2][1]不会影响b[2][1]
3. 其它拷贝方法
3.1. 列表的复制
In [1]: a = [1, 2, 3]
In [2]: b = a
In [3]: b
Out[3]: [1, 2, 3]
In [4]: a[0] = 'wangy'
In [5]: a
Out[5]: ['wangy', 2, 3]
In [6]: b
Out[6]: ['wangy', 2, 3]
使用=是赋值,即将列表对象的引用也赋值给变量b,可以将列表对象想像成一个盒子,变量a相当于这个盒子上的标签,执行b = a后,相当于再在这个盒子上贴上b标签,a和b实际上指向的是同一个对象。因此,无论我们是通过a还是通过b来修改列表的内容,其结果都会作用于双方。
列表的复制都相当于浅拷贝效果,有以下三种方式:
- 列表的copy()函数
- list()转换函数
- 列表分片[:]
In [1]: a = [1, 2, ['hello','world']]
In [2]: b = a.copy()
In [3]: c = list(a)
In [4]: d = a[:]
In [5]: id(a), id(b), id(c), id(d)
Out[5]: (140277244933640, 140277244846856, 140277323038536, 140277244767944)
In [6]: a[0] = 100
In [7]: a[2][1] = 'wangy'
In [8]: a
Out[8]: [100, 2, ['hello', 'wangy']]
In [9]: b
Out[9]: [1, 2, ['hello', 'wangy']]
In [10]: c
Out[10]: [1, 2, ['hello', 'wangy']]
In [11]: d
Out[11]: [1, 2, ['hello', 'wangy']]
b/c/d都是a的复制,它们都指向了不同的列表对象,但是没有拷贝子元素,a[2]和b[2]/c[2]/d[2]指向同一个列表,相当于浅拷贝的效果
3.2. 元组的复制
In [1]: a = (1, 2, ['hello','world'])
In [2]: b = a[:]
In [3]: id(a), id(b)
Out[3]: (140146192445512, 140146192445512)
In [4]: a
Out[4]: (1, 2, ['hello', 'world'])
In [5]: b
Out[5]: (1, 2, ['hello', 'world'])
In [6]: a[2][1] = 'wangy'
In [7]: a
Out[7]: (1, 2, ['hello', 'wangy'])
In [8]: b
Out[8]: (1, 2, ['hello', 'wangy'])
使用分片[:]操作,a和b其实是指向同一个元组,而且没有拷贝子元素,a[2]和b[2]也指向同一个列表,相当于浅拷贝的效果
3.3. 字典的复制
同列表类似,可以使用字典的copy()函数或者转换函数dict()
In [1]: a = {'name': 'wangy', 'age': 18, 'jobs': ['devops', 'dba']}
In [2]: b = a.copy()
In [3]: c = dict(a)
In [4]: id(a), id(b), id(c)
Out[4]: (139653533041504, 139653544192616, 139653533040712)
In [5]: a['age'] = 20
In [6]: a['jobs'].append('python')
In [7]: a
Out[7]: {'name': 'wangy', 'age': 20, 'jobs': ['devops', 'dba', 'python']}
In [8]: b
Out[8]: {'name': 'wangy', 'age': 18, 'jobs': ['devops', 'dba', 'python']}
In [9]: c
Out[9]: {'name': 'wangy', 'age': 18, 'jobs': ['devops', 'dba', 'python']}
变量a与变量b/c指向不同的字典,但是没有拷贝子元素,a['jobs']和b['jobs']/c['jobs']指定同一个列表,相当于浅拷贝的效果
3.4. 集合的复制
同列表类似,可以使用集合的copy()函数或者转换函数set()
In [1]: a = {1, 2, 3}
In [2]: b = a.copy()
In [3]: c = set(a)
In [4]: id(a), id(b), id(c)
Out[4]: (139965317888712, 139965317888936, 139965317889608)
In [5]: a.add('wangy')
In [6]: a
Out[6]: {1, 2, 3, 'wangy'}
In [7]: b
Out[7]: {1, 2, 3}
In [8]: c
Out[8]: {1, 2, 3}
变量a与变量b/c指向不同的集合,而集合的元素必须是hashable,所以修改集合a不会影响到b/c