【数据分析之道-基础知识(五)】集合

文章目录

  • 专栏导读
  • 1、集合简介
  • 2、创建集合
  • 3、集合元素添加
  • 4、集合元素删除
  • 5、集合运算
  • 6、成员检查
  • 7、遍历集合
  • 8、集合内置函数

专栏导读

✍ 作者简介:i阿极,CSDN Python领域新星创作者,专注于分享python领域知识。

本文录入于《数据分析之道》,本专栏针对大学生、初级数据分析工程师精心打造,对python基础知识点逐一击破,不断学习,提升自我。
订阅后,可以阅读《数据分析之道》中全部文章内容,包含python基础语法、数据结构和文件操作,科学计算,实现文件内容操作,实现数据可视化等等。
还可以订阅进阶篇《数据分析之术》,其包含数据分析方法论、数据挖掘算法原理、业务分析实战。
✍ 其他专栏:《数据分析案例》 ,《机器学习案例》

大家好,我是i阿极。上一章我们讲解了字典基本操作,不清楚的小伙伴,可以回顾一下,温故而知新。

1、集合简介

集合是Python中的一种数据类型,用于存储无序、不重复的元素集合中的元素可以是任意类型,包括数字、字符串、元组、集合等。

可以使用大括号 { } 或者 set() 函数创建集合,注意:创建一个空集合必须用 set() 而不是 { },因为 { } 是用来创建一个空字典

2、创建集合

可以通过花括号{}或set()函数来创建集合

例如:

my_set1 = {1, 2, 3}
my_set2 = set([1, 2, 3])
print(my_set1)
print(my_set2)

在这里插入图片描述

3、集合元素添加

可以使用add()方法向集合中添加元素

例如:

my_set = {1, 2, 3}
my_set.add(4)
print(my_set)

在这里插入图片描述

也可以使用update()方法向集合中添加多个元素

例如:

my_set = {1, 2, 3}
my_set.update([4, 5, 6])
print(my_set)

在这里插入图片描述

4、集合元素删除

可以使用remove()方法删除集合中的元素

例如:

my_set = {1, 2, 3}
my_set.remove(2)
print(my_set)

在这里插入图片描述

如果集合中不存在要删除的元素,会抛出KeyError异常。为了避免这种情况,可以使用discard()方法

例如:

my_set = {1,2,3}
my_set.discard(4)
print(my_set)

可以使用pop()随机删除集合中的一个元素

例如:

my_set = {1, 2, 3}
my_set.pop()
print(my_set)

在这里插入图片描述

5、集合运算

可以对集合进行并集、交集、差集等运算

例如:

set1 = {1, 2, 3}
set2 = {3, 4, 5}

# 并集
union_set = set1 | set2
# 交集
intersection_set = set1 & set2
# 差集
difference_set = set1 - set2
print('并集:',union_set)
print('交集:',intersection_set)
print('差集:',difference_set)

在这里插入图片描述

6、成员检查

可以使用in关键字检查元素是否在集合中

例如:

my_set = {1, 2, 3}
if 1 in my_set:
    print("1 is in the set")

在这里插入图片描述

7、遍历集合

可以使用for循环遍历集合中的元素

例如:

my_set = {1, 2, 3}
for item in my_set:
    print(item)

在这里插入图片描述

8、集合内置函数

Python提供了一些内置函数来操作集合。下面是一些常用的集合内置函数:

函数 描述
add() 向集合中添加元素,如果元素已经存在,则不进行任何操作。
clear() 清空集合中的所有元素。
copy() 复制一个集合。
difference() 返回一个新集合,包含所有在原集合中存在但不在另一个集合中的元素。
difference_update() 移除在另一个集合中存在的元素。
discard() 从集合中移除一个元素,如果元素不存在,则不进行任何操作。
intersection() 返回一个新集合,包含所有同时存在于两个集合中的元素。
intersection_update() 保留同时存在于两个集合中的元素,移除其他元素。
isdisjoint() 判断两个集合是否没有交集,即两个集合的交集是否为空。
issubset() 判断一个集合是否是另一个集合的子集。
issuperset() 判断一个集合是否是另一个集合的超集。
pop() 移除集合中的一个随机元素,并返回该元素的值。
remove() 移除集合中的一个元素,如果元素不存在,则引发KeyError异常。
symmetric_difference() 返回一个新集合,包含所有只存在于一个集合中的元素。
symmetric_difference_update() 移除同时存在于两个集合中的元素,保留其他元素。
union() 返回一个新集合,包含所有在原集合和另一个集合中的元素。
update() 将另一个集合中的元素添加到当前集合中。

下面是一些常用集合内置函数的示例:

# 创建一个集合
s1 = {1, 2, 3}
s2 = {2, 3, 4}

# add()函数示例
s1.add(4)
print(s1)  # {1, 2, 3, 4}

# difference()函数示例
s3 = s1.difference(s2)
print(s3)  # {1}

# intersection()函数示例
s4 = s1.intersection(s2)
print(s4)  # {2, 3}

# isdisjoint()函数示例
print(s1.isdisjoint(s2))  # False
s5 = {5, 6, 7}
print(s1.isdisjoint(s5))  # True

# issubset()函数示例
s6 = {1, 2}
print(s6.issubset(s1))  # True

# pop()函数示例
s7 = {1, 2, 3}
print(s7.pop())  # 1
print(s7)  # {2, 3}
 

文章下方有交流学习区!一起学习进步!
创作不易,如果觉得文章不错,可以点赞收藏评论
你的支持和鼓励是我创作的动力❗❗❗

你可能感兴趣的:(数据分析之道,python,开发语言,集合)