小白学习Python的第七天之集合和字符串

一. 集合

1.什么是集合(set)

"""
集合是容器类型数据,将{}作为容器的标志,里面多个元素用逗号隔开:{元素1, 元素2, 元素3, ...}
可变的;无序的
元素:不可变数据;唯一的
"""

1)空集合

x = {
     }   # 空字典
s1 = set()   # 空集合
print(type(x), type(s1))   #  

2)元素是不可变的

s2 = {
     10, 'abc', (10, 20)}
print(s2)   # {(10, 20), 10, 'abc'}

# 报错,列表可变不能作为集合元素
# s3 = {10, 'abc', [10, 20]}   # TypeError: unhashable type: 'list'

3)元素是唯一的

s4 = {
     10, 20, 30, 10, 10}
print(s4)   # {10, 20, 30}
# 集合去重
names = ['张三', '李四', '老王', '李四', '张三', '张三']
names = list(set(names))
print(names)   # ['老王', '李四', '张三']

nums = [2, 30, 4, 10, 10, 2, 50, 6, 30]
nums = list(set(nums))
print(nums)   # [2, 4, 6, 10, 50, 30]

4)集合是无序

print({
     1, 3, 5} == {
     5, 1, 3})   # True

2.集合的增删改查
1)查 - 集合只能遍历

# 补充:通过for循环遍历无序列表的时候,都是先将序列转换成列表,然后遍历列表
games = {
     'QQ炫舞', '扫雷', '我的世界', '贪吃蛇', '侠盗猎车', '红警'}
for i in games:
    print('i', i)

2)增
集合.add(元素) - 在集合中添加指定元素
集合.update(序列) - 将序列中所有的元素添加到集合中

games.add('英雄联盟')
print(games)   # {'红警', '扫雷', '我的世界', '侠盗猎车', 'QQ炫舞', '贪吃蛇', '英雄联盟'}

games.update({
     '开心消消乐', '王者荣耀'})
print(games)   # {'我的世界', '侠盗猎车', '开心消消乐', '贪吃蛇', '红警', '英雄联盟', '王者荣耀', 'QQ炫舞', '扫雷'}

games.update('abc')
print(games)   # {'a', '扫雷', '王者荣耀', '我的世界', '侠盗猎车', '红警', '开心消消乐', '贪吃蛇', 'QQ炫舞', 'b', 'c', '英雄联盟'}

3)删
集合.remove(元素) - 删除集合中指定的元素(元素不存在时会报错)

games = {
     'QQ炫舞', '扫雷', '我的世界', '贪吃蛇', '侠盗猎车', '红警'}
games.remove('贪吃蛇')
print(games)   # {'我的世界', '红警', '侠盗猎车', '扫雷', 'QQ炫舞'}

集合.discard(元素) - 删除集合中指定的元素(元素不存在时不会报错)

games.discard('我的世界')
print(games)   # {'扫雷', '侠盗猎车', 'QQ炫舞', '红警'}

4)改 - 先删除原来的,在添加新的

games = {
     'QQ炫舞', '扫雷', '我的世界', '贪吃蛇', '侠盗猎车', '红警'}
games.remove('扫雷')
games.add('部落冲突')
print(games)   # {'部落冲突', 'QQ炫舞', '贪吃蛇', '红警', '我的世界', '侠盗猎车'}

3.数学集合运算
python中的集合支持数学中的集合运算:&(交集)、|(并集)、-(差集)、^(对称差集)、>、<、>=、<=(判断包含关系)

set1 = {
     1, 2, 3, 4, 5, 6, 7}
set2 = {
     4, 5, 6, 7, 8, 9, 10}
# 1)集合1 & 集合2 - 求两个集合中公共的部分
print(set1 & set2)   # {4, 5, 6, 7}

# 2)集合1 | 集合2 - 合并两个集合,产生一个新的集合
print(set1 | set2)   # {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}

# 3)集合1 - 集合2 - 集合1中去掉包含在集合2中剩下的元素
print(set1 - set2)   # {1, 2, 3}
print(set2 - set1)   # {8, 9, 10}

# 4)集合1 ^ 集合2 - 合并两个集合后去掉两个集合公共部分
print(set1 ^ set2)   # {1, 2, 3, 8, 9, 10}

# 5)集合1 > 集合2 - 判断集合2是否时集合1的真子集
#    集合1 < 集合2 - 判断集合1是否时集合2的真子集
#    集合1 >= 集合2 - 判断集合2是否时集合1的子集
#    集合1 < 集合2 - 判断集合1是否时集合2的子集

print({
     1, 2, 3, 4} > {
     1, 2})   # True
print({
     1, 2, 3, 4} >= {
     1, 2, 3, 4})   # True
# 练习:
#   用三个列表表示三门学科的选课学生姓名(一个学生可以同时选多门课)
# 	a. 求选课学生总共有多少人
#  	b. 求只选了第一个学科的人的数量和对应的名字
# 	c. 求只选了一门学科的学生的数量和对应的名字
#  	d. 求只选了两门学科的学生的数量和对应的名字
# 	e. 求选了三门学生的学生的数量和对应的名字

python = {
     'stu1', 'stu2', 'stu4', 'stu6', 'stu7', 'stu10', 'stu11'}
h5 = {
     'stu1', 'stu3', 'stu5', 'stu7', 'stu8', 'stu10'}
java = {
     'stu1', 'stu2', 'stu5', 'stu6', 'stu7', 'stu9', 'stu12'}

# a. 求选课学生总共有多少人
all_stu = python | java | h5
print('总人数:', len(all_stu))

# b. 求只选了第一个学科的人的数量和对应的名字
print('只选了第一个学科的人:', python - h5 - java)

# c. 求只选了一门学科的学生的数量和对应的名字(可以直接用[三个集合求对称差集-三个集合的交集])
# 方法一:
print('只选了一门学科的人:', python - h5 - java, h5 - java - python, java - h5 - python)
# 方法二:
print('只选了一门学科的人:', (python ^ h5 ^ java) - (python & h5 & java))

# d. 求只选了两门学科的学生的数量和对应的名字(或者用总人数减去选了一门的和选了三门学科的人)
print('只选了两门学科的人:', python & h5 - java, python & java - h5, h5 & java - python)

# e. 求选了三门学科的学生的数量和对应的名字
print('选了三门学科的人:', python & h5 & java)

二. 字符串和字符

1.什么是字符串(str)

"""
字符串是容器型数据类型,将''或者""或者''''''或者""""""作为容器的标志里面的每一个基本符号就是字符串的元素
字符串是不可变的(不支持增删改);字符串是有序的(支持下标操作)
元素:引号里面的每个基本单元就是字符串的元素,又叫字符(python中只有字符概念,没有字符对应的类型,一般直接使用
     长度是1的字符串来表示字符)
"""

1)空串

s1 = ''
s2 = ""
s3 = ''''''
s4 = """"""
print(s1, s2, s3, s4)
print(type(s1), type(s2), type(s3), type(s4))   #    

2)’’、""、’’’’’’、""""""的区别

# ''、"" - 字符串中不能直接换行
# ''''''、"""""" - 字符串中可以直接换行
s5 = 'aklsdjfklsajf-0sdkjf13='

s6 = '''
    床前明月光,
    疑是地上霜。
    举头望明月,
    低头思故乡。
'''
print(s5)
print(s6)

3)字符串有序性

print('abc' == 'cba')   # False

2.字符

"""
字符分为普通字符和转义字符两种:
1)转义字符
在指定的一个或者多个符号前加 \ 让符号具有特殊功能或着特殊意义。那么这种带有 \ 字符就是转义字符:
\n  -  换行
\t  -  水平制表符(相当于按一下tab键)
\'  -  表示一个普通的单引号
\"  -  表示一个普通的双引号
\\  -  表示一个普通的反斜杠

注意:任意一个转义字符的长度都是1
2)普通字符
除了转义字符以外的字符都是普通字符,普通字符在字符串中表示这个字符串本身,包括:汉字、字母、字母、符号
、表情符号....
'sdf'、'是的'、'%....&340)'、'❀'
"""

# 特殊的转义字符-编码字符:\u四位的十六进制数  -  表示十六进制数对应的编码值对应的字符
str1 = '\tabc\'sdf\n12"3'
print(str1)

str2 = "hello 'wor\"ld"
print(str2)   # hello 'wor"ld

str3 = '123\\n456'
print(str3)   # 123\n456

str4 = 'abc\u1234'
print(str4)   # abcሴ

str5 = 'abc\u4fa5'
print(str5)   # abc侥

2.字符编码

"""
1)计算机在存储数据的时候只能存数字(存的数字二进制补码),为了能够让计算机存储字符,我们给每一个字符都对应
一个固定的数字,那么每个字符对应的固定的数字就是这个字符的编码值

2)字符编码表 - 记录字符和数字之间一一对应关系的表就是字符编码表
常见的字符编码表有两种:ASCII码表、Unicode编码表(python采用的是Unicode编码表)
a.ASCII码
ASCII码表总共有128个字符对应的编码,主要包含的是美国的通用符号其中包括:英文标点符号、数字字符、字母字符
以及其他的一些特殊符号
ASCII码表中数字字符在字母的前面,大写字母在小写字母的前面,大写字母和小写字母之间有间隔

b.Unicode编码表
Unicode编码表包含ASCII码表
中文的编码范围:4e00 ~ 9fa5
"""

1)编码字符:\u4位的16进制编码值

print('\u1100')   # ᄀ
print('\u4e00')   # 一
print('\u0f00')   # ༀ
print('\u9fa5')   # 龥

2)chr(编码值) - 获取编码值对应的字符

print(chr(0x4e00))   # 一
print(chr(97))   # a
# 打印所有的中文字符
count = 0
for x in range(0x4e00, 0x9fa5+1):
    print(chr(x), end=' ')
    count += 1
    if count % 30 == 0:
        print()

3)ord(字符) - 获取字符对应的编码值(返回的是十进制数)

print(ord('余'), ord('婷'))   # 20313 23159
print(hex(20313), hex(23159))   # 0x4f59 0x5a77

三. 字符串相关操作

1.获取字符

sentence = '死亡如风,常伴吾身!'
print(sentence[2], sentence[-8])   # 如 如

2)字符串切片

sentence2 = 'good good study! day day up!'
print(sentence2[5:-2])   # good study! day day u

print(sentence2[1:-2:-2])   # ''
print(sentence2[-2:1:-2])   # p a a yusdo o
print(sentence2[::-1])   # !pu yad yad !yduts doog doog

3)遍历

for i in sentence2:
    print(i)

for index, item in enumerate(sentence2):
    print(index, item)

for i in range(len(sentence2)):
    print(i, sentence2[i])

2.加法和乘法

print('abc' + '123')   # abc123
print('you see see you !' + ' one day day!')   # you see see you ! one day day!

print('abc'*3)   # abcabcabc

3.比较大小
两个字符串比较大小:比较第一对不相等的字符编码值的大小

"""
char
'a' <= char <= 'z' - 小写字母
'A' <= char <= 'Z' - 大写字母
'a' <= char <= 'z' or 'A' <= char <= 'Z' - 字母
'0' <= char <= '9' - 数字字符
'\u4e00' <= char <= '\u9fa5' - 中文字符
"""
print('abc' > 'XYZM')   # True
print('abc' > '你好')   # False
print('A' > '0')   # True
# 练习:输入一个字符串,统计字符串中小写字母的个数
count = 0
char = 'aksljdfiowjADASD5465'
for i in char:
    if 'a' <= i <= 'z':
        count += 1
print(count)
# 练习:输入一个字符串,删除字符串中所有的中文字符
# nis耗时ss==AHJ看 -> nisss==AHJ
char = 'nis耗时ss==AHJ看'
new = ''
for i in char:
    if not('\u4e00' <= i <= '\u9fa5'):
        new += i
print(new)

你可能感兴趣的:(python,字符串)