集合(set)是Python中一种重要的数据类型,表示一组各不相同元素的无序集合,其主要应用于重复元素消除及关系测试等
集合在Python内部通过哈希表实现,其本征无序,输出时所显示的顺序具有随机性,且与运行环境相关
主要包括基于不同对象的创建、元素级的运算及包含关系、集合间的运算及包含关系等
a = [2, 3, 4, 2, 1]
set_a = set(a)
print (set_a)
输出:{1, 2, 3, 4}
重复的 2 只出现了一次
b = 'sdgdfgeyoz'
set_b = set(b)
print (set_b)
输出:{‘f’, ‘e’, ‘z’, ‘o’, ‘d’, ‘s’, ‘y’, ‘g’}
重复的 ‘d’ 和 ‘g’ 都只出现了一次
set_a.add(x) # 将元素x作为一个整体,添加到set_a中
set_b.update(x) # 将元素x执行set(x),拆分为个体,再添加到set_a中
set_a.remove(x) # 从set_a中删除元素x, 如果不存在则抛出KeyError
set_a.discard(x) # 如果在set_a中存在元素x, 则删除
set_a.pop() # 删除并且返回set_a中的一个不确定的元素, 如果set_a为空则抛出KeyError
set_a.clear() # 清除set_a中的所有元素
x in set_x # x在set_x中?
y not in set_x # y不在set_x中?
输出返回 True 或 False
set_a | set_b
set_a.union(set_b)
set_a.update(set_b) # 自我更新不返回新对象,即set_a |= set_b
set_a & set_b
set_a.intersection(set_b)
set_a.intersection_update(set_a) # 自我更新不返回新对象,即set_a &= set_b
set_a - set_b
set_a.difference(set_b)
set_a.difference_update(set_a) # 自我更新不返回新对象,即set_a -= set_b
set_a ^ set_b
set_a.symmetric_difference(set_b)
set_a.symmetric_difference_update(set_b) # 自我更新不返回新对象,即set_a ^= set_b
set_a.copy()
set_a.issubset(set_b) # set_a是set_b的子集?
set_a.issuperset(set_b) # set_a是set_b的超集?
输出返回 True 或 False
集合在Python内部通过哈希表实现,其本征无序
打印输出的时候需要遍历哈希表的每一个bucket,这时候哪个bucket在前面,其对应的元素就排在前面
因此,在不同计算机上或在同一计算机上的不同次运行结果的输出顺序通常都会不一样
原生Python下,相同计算机上同次运行的输出结果相同,不同次运行的输出顺序通常不同
IPython是一个基于Python Shell的交互式解释器,但有比默认Shell强大得多的编辑和交互功能
IPython下,由于经过了包装与美化,set/dict的屏幕输出默认会经过排序,因而每次运行的输出顺序都相同
然而由于set本身无序,不能对set取index,因而IPython中的按序输出除了看起来更舒服以外,并没有实质上的作用
set_a = set(list_a)
list_a_s = list(set_a)
list_a_s.sort()
mail_to = ['cc', 'bbbb', 'afa', 'sss', 'bbbb', 'cc', 'shafa']
addr_to = list(set(mail_to))
addr_to.sort(key = mail_to.index)
输出addr_to为:[‘cc’, ‘bbbb’, ‘afa’, ‘sss’, ‘shafa’]
希望能够对大家有所帮助~