什么是集合(set)
- python内置的容器型数据类型.可变(支持增删),无序(不支持下标操作)
- {元素1,元素2,元素3...}
- 元素要求是不可变并且唯一
set1 = {1, 2, 3, 'abc', 100, (1, 2), 1, 1}
print(set1, type(set1))
# 空集合: set()
set3 = set()
print(type(set3))
- 查:
- 集合没有办法单独取出某一个元素;只能遍历
for item in set1:
print(item)
- 增:
- 集合.add(元素) - 在集合中添加指定的元素
set2 = {100, 2, 5, 20}
set2.add(200)
print(set2)
- 集合.update(序列) - 将序列中的元素(不可变的)添加到集合中
set2.update('abc')
print(set2)
set2.update({'aa': 11, 'bb': 22, 'a': 100})
print(set2)
- 删:
- 集合.remove(元素) - 删除集合中指定元素, 元素不存在会报错
set2 = {100, 2, 5, 20}
set2.remove(100)
print(set2)
- 集合.clear() - 清空集合
set2.clear()
print(set2)
- 改(集合不支持改操作)
数学集合运算(集合应用的重点)
- 包含关系(>=, <=)、并集(|)、交集(&)、差集(-)、补集(^)
# 包含关系
# 集合1 >= 集合2 - 判断集合1中是否包含集合2
# 集合1 <= 集合2 - 判断集合2中是否包含集合1
print({100, 2, 3, 200, 300, 400, 1} >= {1, 2, 3})
并集(|)
- 集合1 | 集合2 - 将集合1和集合2中的元素合并在一起产生新的集合(会去重)
set1 = {1, 2, 3, 4, 5}
set2 = {1, 2, 3, 8, 9, 10}
print(set1 | set2)
- 交集(&)
- 集合1 & 集合2
print(set1 & set2)
- 差集(-)
- 集合1 - 集合2 - 集合1中除了和集合2公共的元素以外的元素
print(set1 - set2)
- 补集(^)
print(set1 ^ set2)
相关的操作
- in / not in
print(1 in {1, 2, 3})
- set()
print(set([19, 23, 19, 0, 0, 0, 0]))
# {0, 19, 23}
总结:集合的应用主要表现在去重和数据集合运算
练习: 用三个列表表示三门学科的选课学生姓名(一个学生可以同时选多门课)
-
- 求选课学生总共有多少人
-
- 求只选了第一个学科的人的数量和对应的名字
-
- 求只选了一门学科的学生的数量和对应的名字
-
- 求只选了两门学科的学生的数量和对应的名字
-
- 求选了三门学生的学生的数量和对应的名字
names1 = ['name1', 'name2', 'name3', 'name4', 'name5', 'name6']
names2 = ['name1', 'name2', 'name7', 'name8', 'name9', 'name10']
names3 = ['name2', 'name3', 'name4', 'name7', 'name11', 'name12']
total0 = set(names1) | set(names2) | set(names3)
print('选课学生总共有多少人:%d' % len(total0))
total = set(names1) - set(names2) - set(names3)
total = set(names1) - (set(names2) | set(names3))
print('只选了第一个学科的人的数量:%d,对应的名字:%s' % (len(total), str(total)[1:-1]))
total1 = (set(names1) ^ set(names2) ^ set(names3)) - (set(names1) & set(names2) & set(names3))
print('只选了一门学科的学生的数量:%d, 对应的名字:%s' % (len(total1), str(total1)[1:-1]))
# 所有学生 - 只选了一科的学生 - 选了三科的学生
total2 = total0 - total1 - (set(names1) & set(names2) & set(names3))
print('只选了两门学科的学生的数量:%d, 对应的名字:%s' % (len(total2), str(total2)[1:-1]))
total3 = set(names1) & set(names2) & set(names3)
print('选了三门学科的学生的数量:%d, 对应的名字:%s' % (len(total3), str(total3)[1:-1]))
总结
1.容器类型:字符串(str)、列表(list)、元祖(tuple)、字典(dict)、集合(set)
2.特点
- str: 不可变、有序
- list: 可变、有序
- tuple: 不可变、有序
- dict: 可变、无序
- set: 可变、无序
3.值
- str: "hsj护士节",'\naa\t123'aaa"345\' , '\u3467' '\u3fd3' '%c' % (0x4eff)
(python中的字符串,可以是单引号、双引号或者三个单引号、三个双引号) - list: [元素1, 元素2,...] , 元素可以是任何类型的数据,类型可以不一致,元素可以重复
- tuple: (元素1, 元素2,...) , 元素可以是任何类型的数据,类型可以不一致,元素可以重复
- dict: {key1: value1, key2: value2, ...}, key是不可变的,唯一的; value可以是任何类型的数据,类型可以不一致,可以重复
- set: {元素1, 元素2, ...} , 元素是不可变的,唯一的
4.增
- list: 列表.append(元素) 、列表.insert(下标, 元素)
- dict: 字典[key] = 值 、 字典.setdefault(key,值)
- set: 集合.add(元素)
5.删
- list: del 列表[下标] 、 列表.pop()\列表.pop(下标) 、列表.remove(元素)
- dict: del 字典[key] 、 字典.pop(key)
- set: 集合.remove(元素)
6.改
- list: 列表[下标] = 新值
- dict: 字典[key] = 新值
7.查
- str: 查单个(下标)、切片、遍历
- list: 查单个(下标)、切片、遍历
- tuple: 查单个(下标)、切片、遍历
- dict: 查单个(key)、遍历(遍历拿到key)
- set: 遍历
8.使用