1.什么是迭代
在Python中,如果给定一个list
或tuple
,我们可以通过for
循环来遍历这个list
或tuple
,这种遍历我们成为迭代(Iteration)
。
在Python中,迭代是通过 for ... in
来完成的,而很多语言比如C或者Java,迭代list是通过下标完成的,比如Java代码:
for (i=0; i
可以看出,Python的for
循环抽象程度要高于Java的for
循环。
因为 Python 的 for
循环不仅可以用在list
或tuple
上,还可以作用在其他任何可迭代对象上。
因此,迭代操作就是对于一个集合,无论该集合是有序还是无序,我们用 for
循环总是可以依次取出集合的每一个元素。
注意: 集合是指包含一组元素的数据结构,我们已经介绍的包括:
- 有序集合:
list
,tuple
,str
和unicode
; - 无序集合:
set
- 无序集合并且具有
key-value
对:dict
而迭代是一个动词,它指的是一种操作,在Python中,就是for
循环。
迭代与按下标访问数组最大的不同是,后者是一种具体的迭代实现方式,而前者只关心迭代结果,根本不关心迭代内部是如何实现的。
2.索引迭代
Python中,迭代永远是取出元素本身,而非元素的索引。
对于有序集合,元素确实是有索引的。有的时候,我们确实想在 for
循环中拿到索引,怎么办?
方法是使用 enumerate()
函数:
>>> L = ['Adam', 'Lisa', 'Bart', 'Paul']
>>> for index, name in enumerate(L):
... print index, '-', name
...
0 - Adam
1 - Lisa
2 - Bart
3 - Paul
使用 enumerate()
函数,我们可以在for
循环中同时绑定索引index
和元素name
。但是,这不是 enumerate()
的特殊语法。实际上,enumerate()
函数把:
['Adam', 'Lisa', 'Bart', 'Paul']
变成了类似:
[(0, 'Adam'), (1, 'Lisa'), (2, 'Bart'), (3, 'Paul')]
因此,迭代的每一个元素实际上是一个tuple
:
for t in enumerate(L):
index = t[0]
name = t[1]
print index, '-', name
如果我们知道每个tuple
元素都包含两个元素,fo
r循环又可以进一步简写为:
for index, name in enumerate(L):
print index, '-', name
这样不但代码更简单,而且还少了两条赋值语句。
可见,索引迭代也不是真的按索引访问,而是由 enumerate()
函数自动把每个元素变成 (index, element)
这样的tuple
,再迭代,就同时获得了索引和元素本身。
3.迭代dict
的value
我们已经了解了dict
对象本身就是可迭代对象,用 for
循环直接迭代 dict
,可以每次拿到dict
的一个key
。
如果我们希望迭代 dict
对象的value
,应该怎么做?
dict
对象有一个 values()
方法,这个方法把dict
转换成一个包含所有value
的list
,这样,我们迭代的就是 dict
的每一个 value
:
d = { 'Adam': 95, 'Lisa': 85, 'Bart': 59 }
print d.values()
# [85, 95, 59]
for v in d.values():
print v
# 85
# 95
# 59
如果仔细阅读Python的文档,还可以发现,dict
除了values()
方法外,还有一个 itervalues()
方法,用 itervalues()
方法替代 values()
方法,迭代效果完全一样:
d = { 'Adam': 95, 'Lisa': 85, 'Bart': 59 }
print d.itervalues()
#
for v in d.itervalues():
print v
# 85
# 95
# 59
那这两个方法有何不同之处呢?
values()
方法实际上把一个dict
转换成了包含value
的list
。但是
itervalues()
方法不会转换,它会在迭代过程中依次从dict
中取出value
,所以itervalues()
方法比values()
方法节省了生成list
所需的内存。打印
itervalues()
发现它返回一个
对象,这说明在Python中,for
循环可作用的迭代对象远不止list
,tuple
,str
,unicode
,dict
等,任何可迭代对象都可以作用于for
循环,而内部如何迭代我们通常并不用关心。
如果一个对象说自己可迭代,那我们就直接用 for
循环去迭代它,可见,迭代是一种抽象的数据操作,它不对迭代对象内部的数据有任何要求。
4.迭代dict
的key
和value
我们了解了如何迭代 dict
的key
和value
,那么,在一个 for
循环中,能否同时迭代key
和value
?答案是肯定的。
首先,我们看看 dict
对象的 items()
方法返回的值:
>>> d = { 'Adam': 95, 'Lisa': 85, 'Bart': 59 }
>>> print d.items()
[('Lisa', 85), ('Adam', 95), ('Bart', 59)]
可以看到,items()
方法把dict
对象转换成了包含tuple
的list
,我们对这个list
进行迭代,可以同时获得key
和value
:
>>> for key, value in d.items():
... print key, ':', value
...
Lisa : 85
Adam : 95
Bart : 59
和 values()
有一个 itervalues()
类似,items()
也有一个对应的 iteritems()
,iteritems()
不把dict
转换成list
,而是在迭代过程中不断给出tuple
,所以, iteritems()
不占用额外的内存。