Day8 字符串

一、字符串

1.什么是字符串(str)

1)字符串

字符串时容器型数据类型(序列); 以单引号或者双引号作为容器的标志, 引号中所有的内容都属于字符串的元素
'abc' - > 元素分别是'a', 'b', 'c' 3个元素
'a,b,c' - > 元素分别是'a', ',', 'b', ',', 'c' 5个元素

特点: 不可变, 有序(支持下标操作)

2)字符串的元素

字符串中的元素又叫字符(注意: python中有字符的概念, 但是没有字符类型; 长度是1的字符串就可以看成字符)

a.普通字符: 字母、数字、各国的文字和符号(可以直接写在引号中的符号)

'abc', 'abc123', '+-%abc胡说'

b.转义字符: 在字符串中在一些特定的符号前加\来表示特殊的功能和意义 (算一个字符)

' - '
" - "
\n - 换行

\ - 反斜杆
\t - tab键缩进(制表符)

c.编码字符: \u4位16进制数 - 将4位16进制数对应的编码值转换成字符

1)字符编码

计算机只有直接存储数字的能力, 不能直接存储字符;
当需要计算机存储字符的时候, 实质存的是字符对应的数字, 这个数字就是字符在计算机中的编码;
每一个字符和数字的对应关系叫编码表

2)ASCII码表和Unicode编码表

ASCII码表是有美国国家标准制定的专门针对美国符号进行编码的, 里面只包含一些特殊字符、字母和数字(不包含中文、日语、韩语等)
python采用的是Unicode编码表: Unicode编码表是对ASCII表的扩展, 包含了世界上所有国家所有语言的符号(万国码)
中文范围: 0x4e00 ~ 0x9fa5

3)字符编码相关的方法

chr(编码值) - 将编码转换为对应的字符
ord(字符) - 获取字符对应的编码值

2.字符编码

print(chr(65), chr(97))
print(chr(0x1800))

for x in range(0x4e00, 0x9fa5):
    print(chr(x), end=' ')      # 打印所有的汉字

str1 = '中文'
print(str1.encode().isalnum())  # 编码过后isalnum()才能生效

二、字符串操作

1.获取字符

str1 = 'hello world'

1)获取单个字符

print(str1, str1[-1])

2)字符串切片

print(str1[2:6:2])
print(str1[2:4:-2])     # 切的空串
print(str1[3:])
print(str1[3::-1])

3)遍历

for char in str1:
    print(char, end=' ')

print(ord('a'), ord('z'))

# 练习: 统计一个字符串中小写字母的个数
str2 = 'How Are You! Im Fine, THANK YOU!'
count = 0
for char in str2:
    if ord(char) in range(97, 123):
        count += 1
print(count)

2.字符串操作

1) + 和 *

字符串1 + 字符串2   -> 将字符串1和字符串2拼接在一起产生一个新的字符串
字符串 * n / n * 字符串     -> 字符串重复n次产生一个新的字符串

str1 = 'abc'
str2 = '123'
print(str1 + ':' + str2)
print(str1 * 3)

2) ==, !=

print('abc' == 'abc')
print('abc' != 'acb')

3)>, <, >=, <=

只能两个字符串比较大小 - 从前往后找到一组不相等的字符, 比较他们编码值的大小, 谁的编码值大哪个字符串就大

print('abc' >= 'bc')    # 从各自第一个字符依次相比编码值
print('\u4e00', '\u9fa5')   # 汉字范围

4)in / not in

字符串1 in 字符串2  -> 判断字符串2中是否包含字符串1(判断字符串1是否是字符串2的字串)

str2 = 'How Are You! Im Fine, THANK YOU!'
print('how' in str2)

5) len(), max(), min(), sorted(), str()

字符串转换: 所有的数据都可以转换成字符串, 转换的时候是将数据放在引号中

str2 = 'How Are You! Im Fine, THANK YOU!'
# 注意: 转义字符和编码字符的长度都是1
print(len(str2))

print(max(str2))
print(min(str2))

print(sorted(str2))

print(str(123))

6)r语法

在字符串的最前面加r或R, 可以阻止字符串中所有的转义字符转义

str2 = R'How Arer \n You! \\ Im Fine, THANK YOU!'
print(str2)

7)格式字符串

在字符串中用格式占位符表示字符串中不确定的部分

a.语法: 包含格式占位符的字符串 % (数据1, 数据2,...) - ()数据的个数和数据的类型要和前面格式占位符一一对应

b.格式占位符

%s - 字符串
%d - 整数
%.Nf - 浮点数,N控制小数点后小数的位数
%c - 字符(可以将数字转换成字符)

注意: 所有的数据都可以使用%s来做格式占位符 2)所有的数据都可以使用%s来接受

三、字符串的相关方法

1.字符串的对齐方式

字符串.center(宽度, 填充字符=' ') - 居中
字符串.rjust(宽度, 填充字符=' ') - 居右
字符串.ljust(宽度, 填充字符=' ') - 居左
字符串.zfill(宽度) == 字符串.rjust(宽度, 填充字符='0') - 居右

str1 = 'abc'
print(str1.center(11, 'A'))     # 居中
print(str1.ljust(9, 'A'))        # 居左(默认)
print(str1.rjust(9, 'A'))        # 居右
print(str1.zfill(9))

2.统计字串的个数

字符串1.count(字符串2) - 统计字符串1中字符串2出现的次数

str2 = 'How Are You! Im Fine, THANK YOU!'
print(str2.count('o'))
print(str2.count('You', 0, 8))  # 在下标[0, 8) 范围内统计

3.获取字串下标

print(str2.find('Are'))
print(str2.find('Are1'))
print(str2.index('Are'))
# print(str2.index('Are1'))   # ValueError: substring not found

4.join方法

字符串1.join(序列) - 将序列中的元素用字符串1连接产生一个新的字符串
要求序列中的元素必须是字符串, 如果是字典key是字符串

print(';'.join(['小明1', '小明2', '小明3', '小明4']))

5.替换

字符串1.replace(字符串2, 字符串3, N) - 将字符串1中的前N字符串2都替换成字符串3(默认N=All)

str2 = 'How Are You! Im Fine, thank you!'
print(str2.replace('o', 'O'))
print(str2.replace('u', 'U', 1))

6.字符串切割

字符串1.split(字符串2) - 将字符串2作为切割点切割字符串1, 返回一个列表

str1 = 'How are you! Im Fine, thank you!'
print(str1.split(' '))  # ['How', 'Are', 'You!', 'Im', 'Fine,', 'thank', 'you!']

7.字符串的一些相关方法

print(str1.upper())     # HOW ARE YOU! IM FINE, THANK YOU!      转为大写
print(str1.lower())     # how are you! im fine, thank you!      转为小写
print(str1.capitalize())    # How are you! im fine, thank you!
print(str1.encode(encoding='UTF-8', errors='-1'))   # b'How are you! Im Fine, thank you!'
print(str1.endswith('you!'))    # True

str1 = 'How are you! \tIm Fine, thank you!'
print(str1.expandtabs(8))       # How are you!    Im Fine, thank you!
print(str1.isalnum())       # False     判断都是字母或数字
print(str1.isalpha())       # False     判断都是字母
print(str1.isdigit())       # False     判断都是数字
print(str1.islower())       # False     判断都是小写字母
print(str1.isupper())       # False     判断都是大写字母
print(str1.isdecimal())     # False     判断都是数字字符
print(str1.isspace())       # False     判断都是空白

str1 = 'How are you! Im Fine, thank you!'.title()
print(str1)
print(str1.istitle())       # True      判断是否标题化

str1 = '          How are you! Im Fine, thank you!            '
print(str1.strip())         # 截掉两边的空格
print(str1.lstrip())        # How are you! Im Fine, thank you!      截掉左边的空格字符
print(str1.rstrip())

str1 = '444444444444How are you! Im Fine, thank you!4444444'
print(str1.strip('4'))      # 截掉两边的自定字符
print(str1.lstrip('4'))     # How are you! Im Fine, thank you!4444444
print(str1.rstrip('4'))     # 444444444444How are you! Im Fine, thank you!

print(str1.rfind('How'))    # 从右边开始查找

str1 = 'How are you! Im Fine, thank you!'
print(str1.startswith('How'))   # 判断字符串是否以指定字符串开头   True
print(str1.swapcase())          # 转换大小写
table1 = 'abc'
table2 = '123'
str1 = 'How are you! Im Fine, thank you!'
trans = str.maketrans(table1, table2)       # 制作翻译表
print(str1.translate(trans))