python-基本数据结构

python为何这么简洁方便

python非常的简洁,如果用C语言100行才能干的事儿,python只需要10行、5行甚至一行。很重要的一个原因就是python支持的这些高级数据结构,节省了很多代码量。

List

列表是python中最常用的数据类型。list是有序的集合,可以随时添加删除元素

[item1,item2 ...] 语法上是 [] 中的元素组成的有序集合,元素不必是同一类型,List中可以有List元素。

>>>language=['c','java','python']
>>>language
['c','java','python']

字符串 一样,List同样可以被索引和切片,List也是可迭代对象,不同的是List是可变数据类型。

常用API

  • list(obj) 将对象强制转成list,比如 list(range(5))
  • list.append(obj) 在列表尾追加 obj
  • list.insert(index,obj) index索引处插入 obj
  • list.pop(obj=list[-1]) 移除列表中的元素(默认最后一个)
  • list.remove(obj) 移除obj匹配的第一个对象
>>>s=[1,2,3,4,5,[6,7,8],9]

>>>s.append(0)
[1, 2, 3, 4, 5, [6, 7, 8], 9, 0]
>>>s.insert(-1,-1)
[1, 2, 3, 4, 5, [6, 7, 8], 9, -1, 0]
>>>s.pop(-5)
[1, 2, 3, 4, 5, 9,-1, 0]
>>>s.sort()
[-1, 0, 1, 2, 3, 4, 5, 5, 9]
>>>s.reverse()
[9, 5, 5, 4, 3, 2, 1, 0, -1]
>>>s.count(5)
2

利用python为list提供的这些API,我们可以很轻松实现栈和队列这两个数据结构,当然是在你不考虑插入查找操作的复杂度基础上。python的 collections [1] 这个库中的队列是更好的选择。

>>> from collections import deque
>>> queue = deque(["Eric", "John", "Michael"])
>>> queue.append("Terry")           # Terry arrives
>>> queue.append("Graham")          # Graham arrives
>>> queue.popleft()                 # The first to arrive now leaves
'Eric'
>>> queue.popleft()                 # The second to arrive now leaves
'John'
>>> queue                           # Remaining queue in order of arrival
deque(['Michael', 'Terry', 'Graham'])

List的生成

1.直接定义

直接用[item1,item2, ...] 穷举法来构造处List

2.迭代

在Python中,迭代是通过for ... in来完成的,而很多语言比如C或者Java,迭代list是通过下标索引完成的。python的抽象程度更高,对于 dict{key:value} 可以用 for key in dict 来进行迭代另一方面,python的迭代更加的通用,它适用于所有可迭代对象。可以用下面方法判断是否为可迭代对象

>>> from collections import Iterable
>>> isinstance(List, Iterable) 
True

生成一个List很简单,结合之前的API和 for 关键字

>>> squares = []
>>> for x in range(10):
...     squares.append(x**2)
...
>>> squares
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

当然对于python而言,这种写法已经算是复杂了,之后会接触很多实用的python高级函数。

3.列表生成式

上面的迭代写法,如果用列表生成式来写,那就是

squares = [x**2 for x range(10)]

python的语义已经非常清楚了,多写几次就能很快熟悉了。

列表生成式很大程度的体现了python的简洁高效的特点,还可以在表达式中添加过滤条件,处理函数等等。

>>> vec = [-4, -2, 0, 2, 4]

>>> [x*2 for x in vec]
[-8, -4, 0, 4, 8]

>>> [x for x in vec if x >= 0]
[0, 2, 4]

>>> [abs(x) for x in vec]
[4, 2, 0, 2, 4]

稍微复杂一些的用法

>>> freshfruit = ['  banana', '  loganberry ', 'passion fruit  ']
>>> [weapon.strip() for weapon in freshfruit]
['banana', 'loganberry', 'passion fruit']

>>> [(x, x**2) for x in range(6)]
[(0, 0), (1, 1), (2, 4), (3, 9), (4, 16), (5, 25)]

>>> vec = [[1,2,3], [4,5,6], [7,8,9]]
>>> [num for elem in vec for num in elem]
[1, 2, 3, 4, 5, 6, 7, 8, 9]

Tuple

元组是不可变对象,初始化之后就不可更改。所以,tuple 没有list中append() insert()这样的操作函数,tuple中的元素不可修改。在代码中,tuple带来的好处很多,要大胆的使用它。构造语句:

>>> t=(1,2,3,4,5)

tuple的概念有一点很绕,tuple对象不可变,但是tuple可以包含list这种可变的对象。

>>> t = 12345, 54321, 'hello!'
>>> t[0] = 1
...会提示修改失败
>>> t = ([1,2,3],4,5)
>>> t[0][2] = 4
>>> t
t = ([1,2,4],4,5)

上面的例子,t这个tuple本身并没有变,只是其中的第一个元素内容变了。因为t[0]指向了list类型的可变对象。理解这一点,tuple就很简单了。

Set

set可以看成是无重复,无序key的集合,它和数学中的集合一样,两个set之间可以进行交并的操作。

使用 set() 或者 { } 来创建,经常用于重复测试或者关系测试。

重复插入虽然不犯错,但不实际存储。

>>> basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}
>>> print(basket)                      # show that duplicates have been removed
{'orange', 'banana', 'pear', 'apple'}

>>> a = set('abracadabra')
>>> b = set('alacazam')
>>> a                                  # unique letters in a
{'a', 'r', 'b', 'c', 'd'}
>>> a - b                              # letters in a but not in b
{'r', 'd', 'b'}
>>> a | b                              # letters in either a or b
{'a', 'c', 'r', 'd', 'b', 'm', 'z', 'l'}
>>> a & b                              # letters in both a and b
{'a', 'c'}
>>> a ^ b                              # letters in a or b but not both
{'r', 'd', 'b', 'm', 'z', 'l'}

Dict

python内置了dict,也就是以 key:value 的形式存储数据,具有极快的查找速度

  • dict在内部通过 hash 直接计算处 key 对用的 value 的地址,所以查找很快
  • key 的值不可变,所以不能用List来作为 key
  • dict占用大量内存,这是肯定的,以空间换时间了
  • 同一个字典不能有重复的key,新的会覆盖旧的

对一个字典执行 list(d.keys()) 将返回一个字典中所有关键字组成的无序列表(如果你想要排序,只需使用 sorted(d.keys()) )。使用 in 关键字可以检查字典中是否存在某个关键字(指字典)

>>> tel = {'jack': 4098, 'sape': 4139}
>>> tel['guido'] = 4127
>>> tel
{'sape': 4139, 'guido': 4127, 'jack': 4098}
>>> tel['jack']
4098
>>> del tel['sape']
>>> tel['irv'] = 4127
>>> tel
{'guido': 4127, 'irv': 4127, 'jack': 4098}
>>> list(tel.keys())
['irv', 'guido', 'jack']
>>> sorted(tel.keys())
['guido', 'irv', 'jack']
>>> 'guido' in tel
True
>>> 'jack' not in tel
False

>>> d = {}  #initialize
>>> dict(sape=4139, guido=4127, jack=4098)  #可以直接利用关键字参数传入
{'sape': 4139, 'jack': 4098, 'guido': 4127}

TIPs

  • 利用 del 语句来批量删除List 中的元素

  • 元组只有一个元素时的定义 t=(0) 会有歧义,与 t=0 作用相同,所以用 t=(0,) 来消除冲突。

  • dict和set也有与列表生成式相似的生成式

    >>> {x: x**2 for x in (2, 4, 6)}
    {2: 4, 4: 16, 6: 36}
    
    >>> {x for x in 'abracadabra' if x not in 'abc'}
    {'r', 'd'}
    


  1. collections是Python内建的一个集合模块,提供了许多有用的集合类。 ↩

你可能感兴趣的:(python-基本数据结构)