目录
集合的特性
集合的分类
集合的创建
集合的运算
集合的基本操作
集合(set)是一个数学概念,是指具有某种特定性质的具体的或抽象的对象汇总而成的集体。其中,构成集合的对象称为该集合的元素。
通常用大写字母如 A,B,S,T,... 表示集合,而用小写字母如 a,b,x,y,... 表示集合的元素。若 x 是集合 S 的元素,则称 x 属于S,记为 x∈S。若 y 不是集合 S 的元素,则称 y 不属于 S,记为 y∉S。
简言之,集合是不重复元素无序组合的序列。
Python 中的集合同数学上的集合一致,并要求元素为不可变数据类型(整数,浮点数,复数,字符串,元组等)。需要强调的是,集合的无序性说明集合中的元素并不像列表中的元素那样,可以通过索引的方式实现随机访问,也即Python中的集合不支持索引运算。此外,集合的互异性决定了集合中不能有重复元素,这一点也是集合区别于列表的关键。当然,Python 中的集合一定是支持 in 和 not in 成员运算的。集合的成员运算在性能上要优于列表的成员运算,这是集合的底层存储特性决定的。
请参见百度百科。
在 python 中,通常使用大括号 {} 或者 set() 函数创建集合。
注意:创建一个空集合必须使用 set(),因为 { } 是用来创建一个空字典。
>>> A={'python',123,('python',123)}
>>> A
{123,'python',('python',123)}
>>> B=set('pypy123')
>>> B
{'2','p','y','3','1'}
可见:
除了上述两种方式,还可以使用生成式语法(集合推导式)来创建集合。
>>> A = {x for x in 'abracadabra' if x not in 'abc'}
>>> A
{'r','d'}
>>> B = {num for num in range(1,20) if num % 3 == 0 or num % 5 == 0}
>>> B
{3,5,6,9,10,12,15,18}
Python 为集合类型提供了非常丰富的运算符,主要包括:成员运算、交集运算、并集运算、差集运算、补集运算和比较运算(相等性、子集、超集)等。
运算类型 | 运算符 | 含义 |
成员运算 | in not in |
检查元素是否在集合中 |
交集运算 | A | S | 返回一个新集合,包含在集合A和S中的所有元素 |
A |= S | 更新一个新集合,包含在集合A和S中的所有元素 | |
并集运算 | A & S | 返回一个新集合,包含同时在集合A和S中的元素 |
A &= S | 更新一个新集合,包含同时在集合A和S中的元素 | |
差集运算 | A - S | 返回一个新集合,包含在集合A但不在S中的元素 |
A -= S | 更新一个新集合,包含在集合A但不在S中的元素 | |
补集运算 | A ^ S | 返回一个新集合,包含在集合A和S中的非相同元素 |
A ^= S | 更新一个新集合,包含在集合A和S中的非相同元素 | |
比较运算 | A < S A <= S |
返回True/False,判断A和S的(真)子集关系 |
A > S A >= S |
返回True/False,判断A和S的包含关系 | |
A == S | 返回True/False,判断A和S是否完全相同 | |
A != S | 返回True/False,判断A和S是否不同 |
示例:
#成员运算
>>> Fruit={'apple','orange','apple','pear','orange','banana'}
>>> Fruit
{'orange','banana','pear','apple'}
>>>'orange' in Fruit
True
>>>'crabgrass' in Fruit
False
#并、交、差、补集运算
>>> A=set('abracadabra')
>>> B=set('alacazam')
>>> A
{'a','r','b','c','d'}
>>> B
{'l', 'z', 'a', 'c', 'm'}
>>> A-B
{'r','d','b'}
>>> A|B
{'a','c','r','d','b','m','z','l'}
>>> A&B
{'a','c'}
>>> A^B
{'r','d','b','m','z','l'}
#比较运算
>>> A>=B
False
Python 中的集合是可变类型,可以通过集合类型的方法为集合添加或删除元素。(以集合 A 为例)
类型 | 方法 | 描述 |
---|---|---|
添加元素 | A.add(x) | 添加元素 x 到 A 中,如果元素已存在,则不进行任何操作。 |
A.update(x) | 添加元素 x 到 A 中,x 可以是列表,元组,字典等,可以有多个,用逗号分开。 | |
移除元素 | A.discard(x) | 移除 A 中元素 x,若不存在,则不进行任何操作。 |
A.remove(x) | 移除 A 中元素 x,若不存在,则产生 keyerror 异常 | |
A.pop() | 随机移除A中的一个元素,更新 A,若 A 为空则产生 keyerror 异常 | |
A.clear() | 移除 A 中的所有元素 | |
其他 | A.copy() | 返回 A 的一个副本 |
len(A) | 返回 A 的元素个数 | |
set(x) | 将其他类型变量 x 转变为集合类型 |
示例:
#添加元素
>>> A=set(('Google','Runoob','Taobao'))
>>> A.add('Facebook')
>>> A
{'Runoob', 'Taobao', 'Google', 'Facebook'}
>>> A.update([1,4],[5,6])
>>> A
{1, 4, 'Taobao', 5, 6, 'Runoob', 'Google', 'Facebook'}
#移除元素
>>> A=set(('Google','Runoob','Taobao'))
>>> A.discard('Facebook')
>>> A
{'Taobao','Google','Runoob'}
>>> A.remove('Facebook')
Traceback (most recent call last):
File "", line 1, in
KeyError: 'Facebook'
>>> A.pop()
'Runoob'
>>> A.pop()
'Taobao'
>>> A.pop()
'Google'
>>> A.pop()
Traceback (most recent call last):
File "", line 1, in
A.pop()
KeyError: 'pop from an empty set'
>>> A.clear()
>>> A
set()
#其他
>>> A=set(('Google','Runoob','Taobao'))
>>> A.copy()
{'Runoob', 'Taobao', 'Google'}
>>> len(A)
3