Python学习之集合的常用方法总结

什么是集合?

集合并不是一种数据处理类型,而是一种中间类型。

  • 集合(set)是一个无序、不重复的元素序列
  • 经常被用来处理两个列表进行交并差的处理性
  • 集合与列表一样,支持所有的不可变数据类型

集合中所有的元素放在 {} 中间,并用逗号分开,例如:

{1, 2, 3},一个包含 3 个整数的列表

{‘a’, ‘b’, ‘c’},一个包含 3 个字符串的列表

集合与列表的区别

功能 列表 集合
顺序 有序 无序
内容 可重复 不可重复
功能 用于数据的使用 用于数据的交集、并集、差集的获取
索引 有索引 无索引
符号 [ ] —> [1, 2, 3] { } —> {1, 2, 3}

集合的创建方法

通过 set 函数创建集合,也可以使用有值的大括号来创建。 如 {1, 2} ,但不能使用空的大括号来创建。(空的大括号是一个空的字典)

示例如下:

test_set_01 = set()				# ---> 一个空的集合
test_set_02 = set([1, 2, 3])	# ---> 传入列表或元组
test_set_03 = {1, 2, 3}			# ---> 传入元素
test_set_04 = {}  				# ---> 这样的方式是错误的,这是一个空的字典

print(type(test_set_04))

# 执行结果如下:
# ---> 
test_list_01 = ['name', 'age', 'birthday']
test_set_01 = set(test_list_01)
print(test_set_01)

# 执行结果如下:
# >>> {'name', 'age', 'birthday'}		可以看到,传入的并不是列表,而是列表的元素


test_list_02 = ['name', 'age', 'birthday', 'age']
test_set_02 = set(test_list_02)
print(test_set_02)

# 执行结果如下:
# >>> {'name', 'age', 'birthday'}		可以看到,列表里重复的元素,做了去重的处理


test_list_03 = (1, 2, 3, 1, 5)
test_set_03 = set(test_list_03)
print(test_set_03)

# 执行结果如下:
# >>> {1, 2, 3, 5}						可以看到,元组里重复的元素,做了去重的处理


test_set_04 = {['name', 'age', 'birthday']}
print(test_set_04)

# 执行结果如下:
# >>> TypeError: unhashable type: 'list'	集合内不可传入列表,否则会报错


test_set_05 = {{'name', 'age', 'birthday'}}
print(test_set_05)

# 执行结果如下:
# >>> TypeError: unhashable type: 'set' 	集合内同样也不可传入字典


test_set_06 = {'name', 1, 3.14, (666, 888)}
print(test_set_06)

# 执行结果如下:
# >>> {'name', 3.14, 1, (666, 888)}			集合内可以传入不同的数据类型(列表不可以直接传入)

集合的增删改

add 函数

add 函数的功能:用于集合中添加一个元素,如果集合中已经存在该被添加的元素,则该函数不执行。

add 函数的用法:set.add(item) ;item 为要被添加到集合的元素;无返回值。

示例如下:

test_set = {'name', 'age', 'birthday'}
test_set.add('sex')
test_set.add('name')
print(test_set)

# 执行结果如下:
# >>> {'sex', 'birthday', 'age', 'name'}	已存在的 'name' 元素,未再次执行添加

update 函数

update 函数的功能:在集合中加入一个新的集合(或者列表、元组、字符串),如果新集合内的元素在原集合中存在则无视。

update 函数的用法:set.update(iterable) ;iterable为集合、列表、元组、字符串;无返回值,直接作用于原集合。

示例如下:

test_set = set()
test_list = ['name', 'age', 'birthday']
test_set.update(test_list)
print(test_set)

# 执行结果如下:
# >>> {'birthday', 'age', 'name'}		列表的成员(元素)被添加进集合


test_tuple = (666, 888)
test_set.update(test_tuple)
print(test_set)

# 执行结果如下:
# >>> {'name', 'birthday', 'age', 888, 666}		元组的成员(元素)被添加进集合


name = 'Neo'
test_set.update(name)
print(test_set)

# 执行结果如下:
# >>> {'name', 'N', 'birthday', 'e', 'age', 'o', 888, 666}		字符串是每个字符都作为元素被添加进集合的

remove 函数

remove函数的功能:将集合中某个元素删除,如果该元素不存在则会报错。

remove函数的用法:set.remove(item) ;item 为当前集合中的一个元素;无返回值,直接作用于原集合。

需要注意的是,item 为集合中的某一个元素,而不是索引。

示例如下:

test_set = set()
test_list = ['name', 'age', 'birthday']
test_set.update(test_list)
print(test_set)

# 执行结果如下:
# >>> {'name', 'birthday', 'age'}


test_set.remove('age')
print(test_set)

# 执行结果如下:
# >>> {'birthday', 'name'}


test_set_01 = set()
test_set.remove('test')
print(test_set_01)

# 执行结果如下:
# >>> KeyError: 'test'		'test'元素不存在则报错。

clear 函数

clear 函数的功能:清空当前集合中所有的元素

clear 函数的用法:set.clear() ;无返回值,直接作用于原集合。

示例如下:

test_set = set()
test_list = ['name', 'age', 'birthday']
test_set.clear()

print(test_set)

# 执行结果如下:
# >>> set()

del 方法删除集合

del 的功能:直接删除 (作用于集合,无法通过索引删除)

示例如下:

test_set = set()
test_list = ['name', 'age', 'birthday']
test_set.update(test_list)
print(test_set)

# 执行结果如下:
# >>> {'birthday', 'age', 'name'}

del test_set
print(test_set)

# 执行结果如下:
# >>> NameError: name 'test_set' is not defined. 

关于集合的重要说明

  • 集合无法通过索引获取元素
  • 集合无获取元素的任何方法
  • 集合只是用来处理列表或元组的一种临时类型,它不适合存储、传输数据

获取两个集合交、并、差集的函数

difference() 函数

什么是差集:

a 和 b 两个集合,由所属于 a 且不属于 b 的元素组成的集合叫做 a 集合 与 b 集合 的差集。

difference() 函数的功能:返回集合的差集,即返回的集合元素包含在第一个集合中,但不包含在第二个集合中。

difference() 函数的用法:a_set.difference(b_set) ;b_set 为当前集合需要比对的集合;返回值为原集合作用于对比集合的差集。(即 a_set 与 b_set 的差集)

示例如下:

names_set_01 = {'Neo', 'Lily', 'Jack'}
names_set_02 = {'Jack', 'Adem', 'Albina'}
names_diff = names_set_01.difference(names_set_02)

print(names_diff)

# 执行结果如下:
# >>> {'Lily', 'Neo'}

intersection() 函数

什么是交集?

a 和 b 两个集合,分别拥有相同的元素集,称之为 a 集合 与 b 集合 的交集。

intersection() 函数的功能:返回两个或者更多个集合中都包含有的元素。(即交集)

intersection() 函数的用法:a_set.inersection(b_set...) ;b_set… 为当前集合需要比对的一个或者多个集合;返回值为原集合作用于对比集合的交集。

示例如下:

names_set_01 = {'Neo', 'Lily', 'Jack', 'Adem'}
names_set_02 = {'Jack', 'Adem', 'Albina'}
names_set_03 = {'Apollo', 'Ben', 'Adem'}
names_inter = names_set_01.intersection(names_set_02, names_set_03)

print(names_inter)

# 执行结果如下:
# >>> {'Adem'}

union() 函数

什么是并集?

a 和 b 两个集合中所有的元素(去掉重复的),即为 a 集合 与 b 集合 的并集。

union() 函数的功能:返回多个集合的并集,即包含了所有集合的元素(重复的元素,只出现一次)

union() 函数的用法:a_set.union(b_set...) ;b_set… 为当前集合需要比对的一个或者多个集合;返回值为原集合作用于对比集合的并集。

示例如下:

names_set_01 = {'Neo', 'Lily', 'Jack', 'Adem'}
names_set_02 = {'Jack', 'Adem', 'Albina'}
names_set_03 = {'Apollo', 'Ben', 'Adem'}
names_union = names_set_01.union(names_set_02, names_set_03)

print(names_union)

# 执行结果如下:
# >>> {'Lily', 'Neo', 'Albina', 'Apollo', 'Jack', 'Ben', 'Adem'}

判断两个集合中是否存在相同的元素

isdisjoint() 函数

isdisjoint()函数的功能:判断两个集合是否包含相同的元素,如果没有返回 True , 否则就返回 False

isdisjoint()函数的用法:a_set.isdisjoint(b_set) ;b_set 为与当前集合用来判断的集合;返回值为布尔值

示例如下:

names_set_01 = {'Neo', 'Lily', 'Jack', 'Adem'}
names_set_02 = {'Jack', 'Adem', 'Albina'}
names_isdisjoint = names_set_01.isdisjoint(names_set_02)
print(names_isdisjoint)

# 执行结果如下:
# >>> False

names_set_01 = {'Neo', 'Lily', 'Jack'}
names_set_02 = {'Ben', 'Adem', 'Albina'}
names_isdisjoint = names_set_01.isdisjoint(names_set_02)
print(names_isdisjoint)

# 执行结果如下:
# >>> True

拓展 - 集合的 ‘&、|、- 运算符’

& 符可以计算两个集合的交集,与集合的intersection()函数实现的功能一样

| 符可以计算两个集合的并集,与集合的union()函数实现的功能一样

- 运算符可以计算两个集合的差集,与集合的difference()函数实现的功能一样

代码示例如下:

# 交集
names_set_01 = {'Neo', 'Lily', 'Jack', 'Adem'}
names_set_02 = {'Jack', 'Adem', 'Albina'}
names_set_03 = {'Apollo', 'Ben', 'Adem'}
names_inter = names_set_01.intersection(names_set_02, names_set_03)
names_inter_01 = names_set_01 & names_set_02 & names_set_03

print(names_inter)
print(names_inter_01)

# 执行结果如下:
# >>> {'Adem'}
# >>> {'Adem'}
# 差集
names_set_01 = {'Neo', 'Lily', 'Jack'}
names_set_02 = {'Jack', 'Adem', 'Albina'}
names_diff = names_set_01.difference(names_set_02)
names_diff_01 = names_set_01 - names_set_02

print(names_diff)
print(names_diff_01)

# 执行结果如下:
# >>> {'Lily', 'Neo'}
# >>> {'Lily', 'Neo'}
# 并集
names_set_01 = {'Neo', 'Lily', 'Jack', 'Adem'}
names_set_02 = {'Jack', 'Adem', 'Albina'}
names_set_03 = {'Apollo', 'Ben', 'Adem'}
names_union = names_set_01.union(names_set_02, names_set_03)
names_union_1 = names_set_01 | names_set_02 | names_set_03

print(names_union)
print(names_union_1)

# 执行结果如下:
# >>> {'Adem', 'Albina', 'Neo', 'Jack', 'Lily', 'Ben', 'Apollo'}
# >>> {'Adem', 'Albina', 'Neo', 'Jack', 'Lily', 'Ben', 'Apollo'}

&、|、- 与 intersection()、union()、difference()函数的不同之处

集合运算时:

intersection()、union()、difference()函数的参数可以是集合,也可以是列表或字典、字符串。

&、|、-运算符左右两边必须是集合。

以上就是Python学习之集合的常用方法总结的详细内容,更多关于Python集合的资料请关注脚本之家其它相关文章!

你可能感兴趣的:(Python学习之集合的常用方法总结)