Edit


笔记内容:python数据结构 
笔记日期:2017-11-01


python数据结构

  • 列表

  • 将列表当做堆栈使用

  • 将列表当作队列使用

  • 列表推导式

  • 嵌套列表解析

  • del 语句

  • 元组和序列

  • 集合

  • 字典

  • 遍历技巧


列表

Python中列表是可变的,这是它区别于字符串和元组的最重要的特点,一句话概括即:列表可以修改,而字符串和元组不能。 
以下是 Python 中列表的方法:

>>> a = [66.25, 333, 333, 1, 1234.5]
>>> print(a.count(333), a.count(66.25), a.count('x'))
2 1 0
>>> a.insert(2, -1)
>>> a.append(333)
>>> a
[66.25, 333, -1, 333, 1, 1234.5, 333]
>>> a.index(333)
1
>>> a.remove(333)
>>> a
[66.25, -1, 333, 1, 1234.5, 333]
>>> a.reverse()
>>> a
[333, 1234.5, 1, 333, -1, 66.25]
>>> a.sort()
>>> a
[-1, 1, 66.25, 333, 333, 1234.5]

注意:类似 insert, remove 或 sort 等修改列表的方法没有返回值。


将列表当做堆栈使用

列表方法使得列表可以很方便的作为一个堆栈来使用,堆栈作为特定的数据结构,最先进入的元素最后一个被释放(后进先出)。用 append() 方法可以把一个元素添加到堆栈顶。用不指定索引的 pop() 方法可以把一个元素从堆栈顶释放出来。例如:

>>> stack = [3, 4, 5]
>>> stack.append(6)
>>> stack.append(7)
>>> stack
[3, 4, 5, 6, 7]
>>> stack.pop()
7
>>> stack
[3, 4, 5, 6]
>>> stack.pop()
6
>>> stack.pop()
5
>>> stack
[3, 4]


将列表当作队列使用

也可以把列表当做队列用,只是在队列里第一个加入的元素,第一个取出来(先进先出);需要通过deque模块把列表转换成队列,通过popleft函数来释放元素,但是拿列表用作这样的目的效率不高。在列表的最后添加或者弹出元素速度快,然而在列表里插入或者从头部弹出速度却不快(因为所有其他的元素都得一个一个地移动)。

>>> from collections import deque
>>> queue = deque(["Eric", "John", "Michael"])  # 把列表转换成队列模式
>>> queue.append("Terry")           # 向列表添末尾加元素
>>> queue.append("Graham")          
>>> queue.popleft()                 # 释放元素
'Eric'
>>> queue.popleft()                 
'John'
>>> queue                           
deque(['Michael', 'Terry', 'Graham'])


列表推导式

列表推导式提供了从序列创建列表的简单途径。通常应用程序将一些操作应用于某个序列的每个元素,用其获得的结果作为生成新列表的元素,或者根据确定的判定条件创建子序列。 
每个列表推导式都在 for 之后跟一个表达式,然后有零到多个 for 或 if 子句。返回结果是一个根据表达从其后的 for 和 if 上下文环境中生成出来的列表。如果希望表达式推导出一个元组,就必须使用括号。 
这里我们将列表中每个数值乘三,获得一个新的列表:

vec=[1,2,3]
list1=[x*3 for x in vec]  # 列表推导式

print(list1)

运行结果:

[3, 6, 9]

从以上示例可以得知,所谓推导式就是写在方括号里的一个混合表达式,这个表达式会返回出一个新的列表对象(如果使用的是方括号的话)


还可以生成二维列表:

vec=[1,2,3]
list1=[[x,x**3] for x in vec] # 在列表推导式里加多一个方括号就会生成二维列表

print(list1)

运行结果:

[[1, 1], [2, 8], [3, 27]]

还可以对序列里的每一个元素逐个调用某方法:

>>> freshfruit = ['  banana', '  loganberry ', 'passion fruit  ']
>>> [weapon.strip() for weapon in freshfruit]  # 逐个调用某方法
['banana', 'loganberry', 'passion fruit']

可以使用 if 语句过滤一些元素:

>>> [3*x for x in vec if x > 3]  # 仅生成大于三的元素
[12, 18]
>>> [3*x for x in vec if x < 2]  # 仅生成小于二的元素
[]

以下是一些关于循环和其它技巧的演示:

>>> vec1 = [2, 4, 6]
>>> vec2 = [4, 3, -9]
>>> [x*y for x in vec1 for y in vec2]   # 这是一个二重循环,y循环嵌套在x循环嵌中
[8, 6, -18, 16, 12, -36, 24, 18, -54]   # 这也是一个二重循环,与上面那个的区别在于这个使用的是加法运算符
>>> [x+y for x in vec1 for y in vec2]
[6, 5, -7, 8, 7, -5, 10, 9, -3]
>>> [vec1[i]*vec2[i] for i in range(len(vec1))] #以vec1的长度作为循环次数,让两个列表的同一个下标里的元素相乘
[8, 12, -54]

列表推导式可以使用复杂表达式或嵌套函数:

# 在这里round的范围定义的是小数点后面的小数保留多少位
>>> [str(round(355/113, i)) for i in range(1, 6)]  # 通过str函数转换round函数生成的浮点数为字符串类型
['3.1', '3.14', '3.142', '3.1416', '3.14159']


嵌套列表解析

Python的列表还可以嵌套,也就是二维列表。 
以下实例展示了3X4的矩阵列表:

matrix = [
    [1, 2, 3, 4],
    [5, 6, 7, 8],
    [9, 10, 11, 12]
]

以下实例将3X4的矩阵列表转换为4X3列表:

print([[row[i] for row in matrix] for i in range(4)])

运行结果:

[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]

以上这种转换是通过列表推导式生成的一个新列表,除此之外也可以用循环来实现:

matrix = [
    [1, 2, 3, 4],
    [5, 6, 7, 8],
    [9, 10, 11, 12]
]

j=1
for i in range(4):
    for row in matrix:
        print("[",row[i],"]",end=" ")
        if j%3==0:
            print()
        j += 1

运行结果:

[ 1 ] [ 5 ] [ 9 ] 
[ 2 ] [ 6 ] [ 10 ] 
[ 3 ] [ 7 ] [ 11 ] 
[ 4 ] [ 8 ] [ 12 ]

以下实例也可以实现:

matrix = [
    [1, 2, 3, 4],
    [5, 6, 7, 8],
    [9, 10, 11, 12]
]

transposed = []

for i in range(4):
    transposed.append([row[i] for row in matrix]) #这是通过列表推导式生成出新元素后,添加到一个空的列表中

print(transposed)

运行结果:

[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]

还有一种实现方法,这种方式就比较繁琐了:

matrix = [
    [1, 2, 3, 4],
    [5, 6, 7, 8],
    [9, 10, 11, 12]
]

transposed = []

for i in range(4):

    transposed_row = []
    for row in matrix:
        transposed_row.append(row[i]) # 把遍历的元素添加到一个空列表中
    transposed.append(transposed_row) # 然后把这个列表对象添加进来

print(transposed)

运行结果:

[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]


del 语句

使用 del 语句可以从一个列表中依索引而不是值来删除一个元素。这与使用 pop() 返回一个值不同。可以用 del 语句从列表中删除一个切割,或清空整个列表(我们以前介绍的方法是给该切割赋一个空列表)。例如:

>>> a = [-1, 1, 66.25, 333, 333, 1234.5]
>>> del a[0]
>>> a
[1, 66.25, 333, 333, 1234.5]
>>> del a[2:4]
>>> a
[1, 66.25, 1234.5]
>>> del a[:]
>>> a
[]


元组和序列

元组可以由若干逗号分隔的值组成,例如:

>>> t = 12345, 54321, 'hello!'
>>> t[0]
12345
>>> t
(12345, 54321, 'hello!')
>>> # Tuples may be nested:
... u = t, (1, 2, 3, 4, 5)
>>> u
((12345, 54321, 'hello!'), (1, 2, 3, 4, 5))

如你所见,元组在输出时总是有括号的,以便于正确表达嵌套结构。在输入时可能有或没有括号, 不过括号通常是必须的(如果元组是更大的表达式的一部分)。

我们都知道元组里的值是不可变的,但是如果元组里的值是一个可变对象,则修改该可变对象的值,会导致元组的值也跟着改变:

a = [1, 2, 3, 4]
b = [5, 6, 7, 8]
c = [9, 10, 11, 12]
tuple1 = a, b, c  # 列表结合在一起会变成元组类型

print(tuple1)
del b[1:4]  # 这里改变的是b列表的值
print(tuple1)

运行结果:

([1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]) 
([1, 2, 3, 4], [5], [9, 10, 11, 12])


集合

集合是一个无序并且不重复元素的集。基本功能包括关系测试和消除重复元素。 
需要使用大括号 { } 来创建集合。注意:如果要创建一个空集合,你必须用 set() 而不是 { } ;后者创建的是一个空的字典。 
以下是一个简单的演示:

>>> basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}
>>> print(basket)                      # 会自动删除重复的,并且每次打印都可能不一样的排序,因为集合是无序的
{'orange', 'banana', 'pear', 'apple'}
>>> 'orange' in basket                 # 检测成员
True
>>> 'crabgrass' in basket
False

>>> # 以下演示了两个集合的操作
...
>>> a = set('abracadabra')
>>> b = set('alacazam')
>>> a                                  # a 中唯一的字母
{'a', 'r', 'b', 'c', 'd'}
>>> a - b                              # 在 a 中的字母,但不在 b 中
{'r', 'd', 'b'}
>>> a | b                              # 在 a 或 b 中的字母
{'a', 'c', 'r', 'd', 'b', 'm', 'z', 'l'}
>>> a & b                              # 在 a 和 b 中都有的字母
{'a', 'c'}
>>> a ^ b                              # 在 a 或 b 中的字母,但不同时在 a 和 b 中

集合也支持推导式:

>>> a = {x for x in 'abracadabra' if x not in 'abc'}
>>> a
{'r', 'd'}


字典

另一个非常有用的 Python 内建数据类型是字典。 
序列是以连续的整数为索引,与此不同的是,字典以关键字为索引,关键字可以是任意不可变类型,通常用字符串或数值。 
理解字典的最佳方式是把它看做无序的键/值对集合。在同一个字典之内,键必须是唯一的。 
使用一对大括号创建一个空的字典:{ } 
这是一个字典运用的简单例子:

>>> tel = {'jack': 4098, 'sape': 4139} # 创建一个字典
>>> tel['guido'] = 4127  # 添加一对键值到字典中
>>> tel
{'sape': 4139, 'guido': 4127, 'jack': 4098}
>>> tel['jack']  # 得到该键的值
4098
>>> del tel['sape']  # 删除一个键值对
>>> tel['irv'] = 4127  # 添加一对键值到字典中,值是可以重复的
>>> tel
{'guido': 4127, 'irv': 4127, 'jack': 4098}
>>> list(tel.keys())  # 得到字典中的所有键,并转换为列表
['irv', 'guido', 'jack']
>>> sorted(tel.keys())  # 得到字典中的所有键,转换为列表之后再进行排序
['guido', 'irv', 'jack']
>>> 'guido' in tel  # 检查成员
True
>>> 'jack' not in tel
False

构造函数 dict() 可以直接从键值对元组列表中构建字典。如果有固定的模式,列表推导式指定特定的键值对:

>>> dict([('sape', 4139), ('guido', 4127), ('jack', 4098)]) # 列表中是键值对元组,通过dict构建成字典类型
{'sape': 4139, 'jack': 4098, 'guido': 4127}

如果关键字只是简单的字符串,使用关键字参数指定键值对有时候更方便:

>>> dict(sape=4139, guido=4127, jack=4098)
{'sape': 4139, 'jack': 4098, 'guido': 4127}

此外,字典推导可以用来创建任意键和值的表达式词典:

>>> {x: x**2 for x in (2, 4, 6)}  # x为键,x的2次幂为值
{2: 4, 4: 16, 6: 36}


遍历技巧

在字典中遍历时,关键字和对应的值可以使用 items() 方法同时读取出来:

>>> knights = {'gallahad': 'the pure', 'robin': 'the brave'}
>>> for k, v in knights.items():  # 每次循环都可以读取一对键值
...     print(k, v)
...
gallahad the pure
robin the brave

在序列中遍历时,下标位置和对应值可以使用 enumerate() 函数同时得到:

>>> for i, v in enumerate(['tic', 'tac', 'toe']): # enumerate可以同时得到下标和对应值
...     print(i, v)
...
0 tic
1 tac
2 toe

同时遍历两个或更多的序列,可以使用 zip()函数组合起来:

>>> questions = ['name', 'quest', 'favorite color']
>>> answers = ['lancelot', 'the holy grail', 'blue']
>>> for q, a in zip(questions, answers):
...     print('What is your {0}?  It is {1}.'.format(q, a))
...
What is your name?  It is lancelot.
What is your quest?  It is the holy grail.
What is your favorite color?  It is blue.

要反向遍历一个序列,首先指定这个序列,然后调用 reversed() 函数,reversed就是用来反向序列的:

>>> for i in reversed(range(1, 10, 2)): 
...     print(i)
...
9
7
5
3
1
list1 = [1, 2, 3, 4, 5, 6]

for i in reversed(list1):
    print(i, end=" ")

运行结果:

6 5 4 3 2 1

要按顺序遍历一个序列,使用 sorted() 函数返回一个已排序的序列,并不修改原值,sorted是用来排序的,与sort函数不同的是sorted会生成一个新的列表:

>>> basket = ['apple', 'orange', 'apple', 'pear', 'orange', 'banana']
>>> for f in sorted(set(basket)):
...     print(f)
...
apple
banana
orange
pear

sort函数仅是对原本的列表进行排序,不会生成新的列表对象:

list2 = [84, 56, 12, 65, 2, 4, 85, 123]
list.sort(list2)

for x in list2:
    print(x, end=" ")

运行结果:

2 4 12 56 65 84 85 123