1.什么是字符串(str)
- 字符串是python内置的一种容器型数据类型:不可变、有序
- 将''(单引号)""(双引号)作为容器,里面可以根据情况放多个字符
- 不可变:指的是内容的值和顺序不可变
- 有序:一旦字符确定,字符串中字符的位置就固定(每个字符是第几个字符是确定的)
'abc123456'
"123*%数字"
2.字符串中的内容 -- 字符
- python中,只有字符的概念,没有字符对应的数据类型
字符串的基本单元就是字符,又叫字符串的元素
a基本字符 -- 数字、字母、常用符号、中文等
'123'
'abc'
'+-='
'青蛙'
'123abc+青蛙'
b.转义字符 -- 通过转义符号\ 后面跟不同的符号,来表示特殊功能或者特殊意义的字符
\n -- 跨行
\'或\'' -- 表示'或"
str1 = 'abc\n123'
print(str1)
str2 = 'abc\\2'
print(str2)
- 阻止转义:在字符串的最前面加r或者R,可以阻止字符串中的转义(一般用于正则表达式)
str3 = r'\add\fdf\nddd\\'
print(str3)
c.编码字符 -- \u后面跟4位的十六进制数,来表示一个字符。
这个4位的十六进制数对应的值就是字符的编码值
十六进制数 0-9,a-f 表示0-15
print(0xa + 10)
3.字符编码
python中的字符采用的是Unicode编码
计算机存储数据只能存储数字,而且存的是数字的补码(是以二进制的形式进行储存)
100 #十进制数
print('100的二进制数',bin(100)) #bin(数字)--查看数字的二进制形式
print(oct(100)) #八进制
print(hex(100)) #十六进制
- 编码:每个字符在计算机中存储的时候,都会对应一个固定且唯一的数字,这个数字就是这个字符的编码
每个字符和数字的一一对应关系,就是编码表
常见编码表ASCII编码表和Unicode编码表。 - ASCII码表中只存储数字字符、英文字母、字母字符、英文符号
- Unicode码表是对ASCII码表的扩充,能够对所有符号进行编码 4e00-0fa5 汉字范围
chr(编码值) -- 获取编码值对应的字符
num = 1
for code in range(0x4e00,0x9fa5):
print(chr(code),end='')
num += 1
if num%20 == 0:
print()
ord(字符) -- 获取字符对应的编码(一个字符)
print(ord('何'),ord('鑫')) #十进制数
根据编码值比较大小
print('a' > 'Z')
print('何' > '鑫')
1.获取字符 -- 取字符串的内容
a.获取单个字符
- 语法:字符串[下标] -- 根据下标获取字符串中对应的字符
- b说明:字符串 - 可以是字符串值,也可以是字符串变量;只要结果是字符串的表达式都可以
[] - 固定写法
下标 - 又叫索引,一旦字符串确定,那么字符串的每一个字符都会对应一个下标表示这个字符在字符串中的位置。下标的范围是0开始到字符串的长度减一
0表示第一个字符,1表示第二个字符,以此类推。
下标范围还可以是-1到-字符串长度,-1表示倒数第一个
str1 = 'python' #p对应的下:0/-6
result = 'python'[3]
print(result)
print(str1[0],str1[-1])
#注意:获取单个字符的时候下标不能越界
1.2 获取部分字符(字符串切片)
- a.语法: 字符串[开始下标:结束下标:步长]-从开始下标获取到结束下标前为止,每次下标的值增加步长
- b.说明:字符串 - 可以是字符串值,也可以是字符串变量;只要结果是字符串的表达式都可以
[],: - 固定写法
开始下标、结束下标 - 开始下标对应的值可取,结束下标不可取
步长 - 整数,可以是正的或者负的 - c.注意:下标可以越界
如果步长为正(从前往后获取):开始下标对应的字符要在结束下标的前面,才能获取到结果
如果步长为负(从后往前获取):开始下标对应的字符要在结束下标的后面,才能获取到结果
a = 'python'
print(a[-6:8:1])
print(a[5:0:-1])
print(a[1:3:-1]) # ''
切片语法中可以对步长、开始下标、结束下标进行省略
1省略步长:
字符串[开始下标:结束下标] == 字符串[开始:结束:1] 步长默认为1
print(a[1:4])
print(a[-4:-1])
2省略开始下标:
字符串[:结束下标:步长]
如果步长为正,从0开始;如果步长为负,从-1开始
3省略结束下标
字符串[开始下标::步长]
如果步长为正,取到最后一个字符;如果步长为负,取到第一个字符
str2 = 'abcdef123456'
print(str2[2:5]) #'cde'
print(str2[-4:-1]) #'345'
print(str2[:4:1]) #abcd
print(str2[:3:-1]) #654321fe
print(str2[2:]) #cdef123456
print(str2[2::-1]) #cba
print(str2[::-1]) #654321fedcba
#练习1234 -- 4321
num = 1234
num1 = int(str(num)[::-1])
print(num1)
1.3遍历字符串 -- 一个一个的取出所有字符
方法一:直接遍历
for 变量 in 字符串:
循环体
方法二:通过遍历下标来遍历字符串
for 变量 in range(字符串长度):
字符串[变量]
for char in 'hello':
print(char)
str3 = 'when I was young'
#len(字符串) - 获取字符串长度,返回一个数字
for index in range(len(str3)):
print(index, str3[index])
index = 0
while index < len(str3):
print(index, str3[index])
index += 1
1 字符串运算
a数学运算:字符串支持加法运算和乘法运算
语法: 字符串1 + 字符串2 - 将字符串1和字符串2拼接在一起,产生一个新的字符串
new_str = 'abc' + '123'
print(new_str)
new_str += 'nihao'
print(new_str)
#注意:加号两边,必须是数字,或者都是字符串。字符串和数字不可以混合相加
语法:字符串*正整数 正整数/字符串 -指定字符串重复指定次数,产生一个新的字符串
print('abc' * 5)
print('*'*10)
b.比较运算:字符串支持所有比较运算符
- 字符串1==字符串2 字符串3!=字符串4 判断两个字符串是否相等
print('abc'=='abc') #True
print('abc' != 'acb') #True
两个字符串比较大小:让两个字符串中相同位置的字符一一比较,找到第一对不相同的字符,比较编码值的大小(从前往后比较)
print('abcde'>'abcz') #False
char = '是'
#判断一个字符是否是字母
#'a' <= char <= 'z' or 'A' <= char <= 'Z'
#判断一个字符是否是数字
# '0' <= char <= '9'
#判断一个字符是否是中文(4e00~9fa5)
print('\u4e00' <= char <= '\u9fa5')
print('0x4e00' <= str(ord(char)) <= '0x9fa5')
练习:输入任意一个字符串,统计输入的内容中字母的个数
str1 = input('请输入一个字符串')
sum1 = 0
for char in str1:
if 'a' <= char <= 'z' or'A' <= char <= 'Z':
sum1 += 1
print('字母的个数',sum1)
3. in和not in 操作
- 字符串1 in 字符串2 - 判断字符串2是否包含字符串1
- 字符串1 not in 字符串2 - 判断字符串1是否不在字符串2中
print('abc' in 'abc123') #True
print('abc' in 'ab123c') #False
print('abc' not in 'ab123c') #True
4.常用内置函数
- len(字符串) - 求字符串长度
- str(数据) - 将其他数据转化为字符串,任何数据都可以转换成字符串,转换的时候直接在数据外层加引号
- print(int('+23')) 只有去掉引号后,本身就是一个整数的字符串才能转化成整型
- print(float('124.a')) 只有去掉引号后,本身就是数字的字符串才能转化成
- print(bool('')) 只有空串会转换成False,其余都是True
5.字符串的对象方法
- 字符串.方法()
- 字符串.capitalize() 将字符串首字母大写
- 字符串.center(width,fillchar) 产生一个长度为width的字符串,将原字符串居中显示,剩余内容用fillchar中内容填充
- 字符串.ljust(width,fillchar) 左对齐
- 字符串.rjust(width,fillchar) 右对齐
- 字符串.zfill(width) 右对齐,用0填充
str4 = 'hello'
new_str = str4.capitalize()
print(new_str)
new_str = str4.center(11,'*')
print(new_str)
num = 1
study_id = str(num).rjust(3,'0')
print(study_id)
num = 2
study_id2 = str(num).zfill(3)
print(study_id2)