集合数据类型是没有顺序的简单对象的聚集,并且集合中的元素不会重复。Python中的集合包括可变集合对象(set)与不可变集合对象(frozenset)。字典是具有键值对的数据结构。每个键不能重复,并且可以根据字典的键查询到他的值。这两位好兄弟外观组成都是使用{}进行包裹。并且底层原理有一定的相通性。他们的底层实现一般都是用了哈希表。
- 集合数据类型分为可变集(set)与不可变集(frozenset)两种。
- 集合中的元素不可以重复,并且无序。(因为对象存在集合内是以哈希对象的形式存储的)
- 集合内放置的应该是不可变对象(数值型数据类型、字符串元组、不可变集合)
- 空集合的的表示方法是set()。{}是空字典的表示方式。
- 可以使用in /not in判断元素是否在集合内。
集合的使用方式与中学时代学到的集合有些相似。也就是说数学上的集合交、并、补、差运算可以运用到Python集合上。表示方式如下
假设集合有A={1,2,3}、B={2,3,4}、C={3,4,5}、D={1,2,3,4}四个
交:
- A|B|C={3}
并:
- A&B={1,2,3,4}
补:
- A^D={4}
差
- A-B={1}
可以使用这些方法进行是否有相同元素,是否具有包含关系的判断
前面讲列表的时候讲到了列表推导式,可以直接生成一个自己的想要的列表。今天咱就讲一下集合列表推导式
推导式语法:
{变量通式 for i in 序列 [判断条件]}
例如下式求偶数的平方
print({i*i for i in range(10) if i%2==0})
可变集合用set进行创建(可变集合底层依旧是哈希表,所以只能存储不可变对象)
print(set([1,2,3]))
创建的对象有一系列的方法。add(x)、remove(x)、discard(x)、pop()、clear()
上面几个函数分别对应的增加元素、移除元素(不存在抛异常)、移除元素、随机弹出元素、清空集合
实际操作代码:
'''
集合set,底层依旧是哈希表,无序不可重复
'''
# 操作(增删改,创建集合)
# 声明方式一
s1={123,'hello',666,888,'Tom'}
# 声明方式二
s2=set({123,'hello',666,888,'Tom'})
# 集合生成式
s3={i*i for i in range(10)}
print(s1,id(s1),type(s1))
print(s2,id(s2),type(s2))
print(s3)
# 判断集合是否相同(比较的是内部含有的元素)
print(s1==s2)
print(s1==s3)
# 增
# 适合一个一个的增加
s1.add(123123)
print(s1)
# 适合增加多个元素
# 将字符串直接加进去
s1.update(['world','milk'])
s1.update(('world1','milk1'))
# 将字符串拆开加进去
s1.update('world3','milk3')
print(s1)
# 删
# 删除传进去的元素,没有的话抛出异常
# s1.remove(777)
# 删除元素,没有的话不抛异常None
s1.discard(888)
print(s1.discard(777))
print(s1)
# 随机删除一个元素(不能进行参数的传递)
s1.pop()
# 清除所有元素
s1.clear()
# 空集合
print(s1)
'''集合之间的关系,交,并,差集,并集差集子集,超集,元素是否相同'''
s4=set(s2)
s5=set(s2)
s4.add('joso')
s5.add('pink')
# s2是否是s4的子集
print(s2.issubset(s4))
# s2是否是s4的超集
print(s2.issuperset(s4))
# 两集和元素是否都不相同
print(s5.isdisjoint(s4))
# 交集
print('--------------------')
print(s4.intersection(s2))
print(s4 & s2)
# 并集
print('--------------------')
print(s4.union(s5))
print(s4 | s5)
# 差集
print(s4.difference(s5))
print(s4-s5)
# 对称差集
print(s4.symmetric_difference(s5))
print(s4 ^ s5)
字典是键和值的映射关系,所以有时也称为映射数据类型。字典的键是哈希数据类型(不可变),值是任意类型,并且在一个字典内每种键只能有一个,值可以重复可以任意取。可以通过键获取到相应的值。
键值对的一般形式就是 键:值
所以字典的一般形式就是{键1:值,键2:值,键3:值…}
创建字典可以直接使用字面量{键1:值,键2:值,键3:值…},也可以使用dict进行创建。
dict支持字典转字典、支持序列转字典。
字典使用的时候可以单独的获取键、值与【键、值】列表
方式是:
- dic.keys() #获取键列表
- d.values() #获取值列表
- d.items() #获取元组形式的键值列表
字典可以使用in / not in判断字典内是否含有某键。
字典对象有一系列方法:
- clear() #清空元素
- copy() #复制字典
- get(k) #根据键获取值
- pop(k) #如果键存在则删除并返回值,不存在抛出异常
- pop(k,v)#如果键存在则删除并返回值,不存在返回V
- setdefault(k,v) #如果k键存在则返回其值,如果不存在添加k键并赋值None
- update() #传入字典或键值对更新操作
字典推导式与列表推导式、集合推导式使用方法类似,只不过他有两个值
{k:v for k in …for v in …}
{x:x*x for x in range(10) if x%2==0}
{x:y for x in range(10) for y in range(10,20)}
'''
对比学习,字典与列表有什么不同呢?
列表是方括号 列表内的数据是单个存在的 有序 可以重复出现
字典是花括号 字典内的数据是成对存在的 无序 键值对不可乱写,并且键重复的话,值会进行覆盖
字典内的数据没有顺序,底层的原理是哈希表,用哈希表实现键值对应
'''
# 字典的创建方式一
# 字典内的同一个键对应不同值时,会将前面的值进行覆盖
s={'name':'张三','paassward':'888888','name':'玛卡巴卡'}
# 字典的创建方式二
ss=dict(user='pig',passward='123123')
# 字典的创建方式三(列表进行创建)
t1=['username','passward']
t2=['Tom','1980']
# upper,lower是对字符串进行全部大写,全部小写的函数
sss={t1.upper():t2.lower() for t1,t2 in zip(t1,t2)}
# 打印显示字典类型
print(s,type(s))
print(ss,type(s))
print(sss,type(s))
# 字典元素的增加/修改
# 由于每个键在字典内只能有一个,所以当一个键对应新的值时,会产生覆盖
# 也就是对原来键对应的值进行了修改
s['name']='李四'
print(s)
# 或者用一个原来没有的键,产生新增的效果
s['age']='20'
print(s)
# 获取字典值
# 获取所有键
keyS=s.keys()
print(keyS)
# 获取所有值
valueS=s.values()
print(keyS,valueS)
# 获取所有键值对
iteM=s.items()
print(iteM)
# 给键获取值 字典名[key]-----找不到会报错
print(s['paassward'])
# 给键获取值 字典名.get()----找不到可以指定打印什么
print(s.get('paassward'))
print(s.get('qwe','没找到'))
# 判断是否在字典内(键值都可以判断)
print('paassward' in s,'888888' in s)
# 字典元素的清除
del s['name']
print(s)
# 清空字典
s.clear()
print(s)
# 字典的遍历
# temp作为字典内的键,然后在字典内寻找值
for temp in ss:
print(temp,ss[temp],ss.get(temp))
集合与字典到此就结束啦,这两种数据类型比较简单、但是内置的方法比较多。重点掌握住他们的特点:可变不可变之类的。相信大家可以玩转这两种数据类型。