字典是Python中唯一内建的映射类型。字典中的值并没有特殊的顺序,但是都存储在一个特定的键(Key)里。键可以是数字、字符串甚至是元组。
一、创建和使用字典
字典可以通过下面的方式创建:
>>> phonebook = {'Alice' : '2341', 'Beth' : '9102', 'Cecil' : '3258'}字典由多个键及与其对应的值构成的对组成。每个键和它的值之间用冒号(:)隔开,项之间用逗号(,)隔开,而整个字典是由一对大括号括起来。字典中的键是唯一的,而值并不唯一。
1. dict 函数
用 dict 函数,通过其他映射(比如其他字典)或者(键,值)这样的序列对建立字典。
>>> items = [('name', 'Gumby'), ('age', 42)] >>> d = dict(items) >>> d {'name': 'Gumby', 'age': 42}dict 函数也可以通过关键字参数来创建字典。
>>> d = dict(name='Gumby', age=42) >>> d {'name': 'Gumby', 'age': 42}2. 基本字典操作
字典的基本行为在很多方面与序列类似:
(1)len(d) 返回 d 中项(键-值对)的数量
(2)d[k] 返回关联到键 k 上的值
(3)d[k] = v 将值 v 关联到键 k 上
(4)del d[k] 删除键为 k 的项
(5)k in d 检查 d 中是否有含有键为 k 的项
尽管字典和列表有很多特性相同,但也有下面一些重要的区别。
(1)键类型:字典的键不一定为整型数据(但也可能是),也可能是其他不可变类型,比如浮点型(实型)、字符串或者元组。
(2)自动添加:即使那个键起初在字典中并不存在,也可以为它分配一个值,这样字典就会建立新的项。
(3)成员资格:表达式 k in d (d 为字典) 查找的是键,而不是值。
3. 字典的格式化字符串
在每个转换(conversion specifier)中的 % 字符后面,可以加上用圆括号括起来的键,后面再跟上其他说明元素。
>>> phonebook {'Alice': '2341', 'Beth': '9102', 'Cecil': '3258'} >>> "Cecil's phone number is %(Cecil)s." % phonebook "Cecil's phone number is 3258."只要所有给出的键都能在字典中找到,就可以获得任意数量的转换说明符。
>>> template = '''<html> ... <head><title>%(title)s</title></head> ... <body> ... <h1>%(title)s</h1> ... <p>%(text)s</p> ... </body>''' >>> data = {'title':'My Home Page', 'text':'Welcome to my home page!'} >>> print(template % data) <html> <head><title>My Home Page</title></head> <body> <h1>My Home Page</h1> <p>Welcome to my home page!</p> </body>4. 字典方法
(1) clear
clear 方法清除字典中所有的项。这是个原地操作,所以无返回值(或者说返回 None)。
>>> d {'name': 'Gumby', 'age': 42} >>> retured_value = d.clear() >>> d {} >>> retured_value >>> print(retured_value) None
(2) copy
copy 方法返回一个具有相同键-值对的新字典(这个方法实现的是浅复制(shallow copy),因为值本身就是相同的,而不是副本)。
>>> x = {'username':'admin', 'machines':['foo', 'bar', 'baz']} >>> y = x.copy() >>> y['username'] = 'mlh' >>> y['machines'].remove('bar') >>> y {'username': 'mlh', 'machines': ['foo', 'baz']} >>> x {'username': 'admin', 'machines': ['foo', 'baz']}上面,当在 y 中替换值的时候,x 不受影响,但是,如果修改了某个值(原地修改,而不是替换),x 也会改变,因为同样的值也存储在原字典中。
避免这个问题的一种方法就是使用深复制( deep copy),复制其包含所有的值。可以使用 copy 模块的 deepcopy 函数来完成操作。
(3)fromkeys
fromkeys 方法使用给定的键建立新的字典,每个键默认对应的值为 None。
>>> {}.fromkeys(['name', 'age']) {'name': None, 'age': None}也可以直接在所有字典的类型 dict 上面调用方法。
>>> dict.fromkeys(['name', 'age']) {'name': None, 'age': None}如果不想使用None作为默认值,也可以自己提供默认值。
>>> dict.fromkeys(['name', 'age'], '(unknown)') {'name': '(unknown)', 'age': '(unknown)'}
(4)get
当使用 get 访问一个不存在的键时,没有任何异常,而得到了 None 值。
>>> print(d['name']) Traceback (most recent call last): File "<stdin>", line 1, in <module> KeyError: 'name' >>> print(d.get('name')) None还可以定义“默认”值,替换 None:
>>> d.get('name', 'N/A') 'N/A'如果键存在,get用起来就像普通的字典查询一样。
(5)items
items 方法将所有的字典项以dict_items 方式返回,这些列表项中的每一项都来自于(键,值)。
>>> d = {'title':'Python Web Site', 'url':'http://www.python.org', 'spam':0} >>> d {'url': 'http://www.python.org', 'title': 'Python Web Site', 'spam': 0} >>> d.items() dict_items([('url', 'http://www.python.org'), ('title', 'Python Web Site'), ('spam', 0)])
(6)keys
keys 方法将字典中的键以 dict_keys 形式返回。
(7)pop
pop 方法用来获得对应于给定键的值,然后将这个键-值对从字典中移除。
>>> d = {'x':1, 'y':2} >>> d.pop('x') 1 >>> d {'y': 2}
(8)popitem
popitem 弹出随机的项。
>>> d {'url': 'http://www.python.org', 'title': 'Python Web Site', 'spam': 0} >>> d.popitem() ('url', 'http://www.python.org') >>> d {'title': 'Python Web Site', 'spam': 0}
(9)setdefault
setdefault 方法在某种程度上类似于 get 方法,就是能够获得与给定键相关联的值,除此之外,setdefault 还能在字典中不含有给定键的情况下设定相应的键值。
>>> d = {} >>> d.setdefault('name', 'N/A') 'N/A' >>> d {'name': 'N/A'} >>> d['name'] = 'Gumby' >>> d.setdefault('name', 'N/A') 'Gumby' >>> d {'name': 'Gumby'}当键不存在的时候,setdefault 返回默认值并且相应地更新字典。如果键存在,那么就返回与其相应的值,但不改变字典。
(10)update
update 方法可以利用一个字典项更新另一个字典。
>>> d = {'title':'Python Web Site', 'url':'http://www.python.org', 'changed':'Mar 14 22:09:15 MET 2008'} >>> x = {'title':'Python Language Website'} >>> d.update(x) >>> d {'url': 'http://www.python.org', 'title': 'Python Language Website', 'changed':'Mar 14 22:09:15 MET 2008'}提供的字典中的项会被添加到旧的字典中,若有相同的键则会进行覆盖。
(11)values
values 方法以 dict_values 的形式返回字典中的值。
>>> d = {} >>> d[1] = 1 >>> d[2] = 2 >>> d[3] = 3 >>> d[4] = 4 >>> d.values() dict_values([1, 2, 3, 4])