python中处理文本数据是用str类型,不像其他语言区分字符和字符串,统一使用str类型。
str在创建后是不可变的。在python中字符类型相当于长度是1的字符串类型。
以下三种方式包裹的字符都算作字符串:
三重引号创建字符串时,字符串可以跨越多行,包括三重引号包裹的所有字符。
方法一:使用字面值创建字符串
例子1:
str1 = '测试字符串1'
str2 = "测试字符串2"
str3 = '''测试字符串3,
str3的第二行;
str3的第三行'''
print(str1)
print(str2)
print(str3)
结果:
测试字符串1
测试字符串2
测试字符串3,
str3的第二行;
str3的第三行
方法二:通过str构造器创建字符串
例子2:
str1 = str('测试字符串1')
print(str1)
结果:
测试字符串1
首字母大写。
例子:
str1 = str('abcde')
str2 = '测试capitalize'
print(str1.capitalize())
print(str2.capitalize())
结果:
Abcde
测试capitalize
消除字符串的大小写形式,都转换为小写。在一般情况下和lower()一样。
例子:
str1 = str('abCDEad')
str2 = '测试cAseFOld'
print(str1.casefold())
print(str2.casefold())
结果:
abcdead
测试casefold
返回字符串长度是width的字符串,原字符串放在正中间。使用指定的 fillchar 填充两边的空位(默认使用 ASCII 空格符)。 如果 width 小于等于 len(s) 则返回原字符串的副本。
例子:
str1 = '测试str.center'
print(str1.center(50,'*'))
结果:
*******************测试str.center*******************
返回子字符串 sub 在 [start, end] 范围内非重叠出现的次数。
可选参数 start 与 end 是指原字符串的起止位置。含start不含end。end为空时,默认一直到字符串尾部。如果有end参数,则必须指定start参数。
如果 sub 为空,则返回字符之间的空字符串数,即字符串的长度加一。但是sub参数必须。
例子:
str1 = '测试str.countstrabstrcdstrkkk' # 26
print(str1.count('str',1,5))
print(str1.count('str',1,4))
print(str1.count('str',1,5))
print(str1.count('str',2))
print(str1.count('',2))
print(str1.count('',10))
print(str1.count(''))
print(str1.count())
结果:
1
0
1
4
26
18
28
Traceback (most recent call last):
File "D:/pythonProject/test/test20240106.py", line 9, in
print(str1.count())
TypeError: count() takes at least 1 argument (0 given)
返回编码为 bytes 的字符串。
encoding 默认为 'utf-8' 。
errors 控制如何处理编码错误。在python的开发模式或调试模式下才有效,暂时不需要考虑。
例子:
str1 = '测试str.encode'
print(str1.encode())
print(str1.encode(encoding='gbk'))
结果:
b'\xe6\xb5\x8b\xe8\xaf\x95str.encode'
b'\xb2\xe2\xca\xd4str.encode'
判断字符串以什么结尾。
如果字符串以指定的 suffix 结尾则返回 True,否则返回 False。 参数suffix 也可以是元组。 可选项 start、end是起止位置。不含start含end。
例子:
str1 = '测试st的r.encode'
print(str1.endswith('e',0))
print(str1.endswith('ode',0))
print(str1.endswith('测',1,8))
print(str1.endswith('d',1,8))
print(str1.endswith('的',4,4))
print(str1.endswith('的',4,5))
print(str1.endswith('的',5,5))
print(str1.endswith('的',0,5))
结果:
D:\pythonProject\venv\Scripts\python.exe D:/pythonProject/test/test20240106.py
True
True
False
False
False
True
False
True
替换字符串中制表符。默认制表位8。
返回字符串的副本,其中所有的制表符会由一个或多个空格替换,具体取决于当前列位置和给定的制表符宽度。
每 tabsize 个字符设为一个制表位(默认值 8 时设定的制表位在列 0, 8, 16 依次类推)。
如果字符为制表符 (\t),则会在结果中插入一个或多个空格符,直到当前列等于下一个制表位。 (制表符本身不会被复制。)
如果字符为换行符 (\n) 或回车符 (\r),会被正常解析为换行符或回车符,并将当前列重设为零。 任何其他字符会被不加修改地复制并将当前列加一(以此往后排),不论该字符在被打印时会如何显示。
例子:
str1 = '01\t012\t0123\t01234'
str2 = 'abc\t测试0123\t01234'
str3 = '01\t01\n2\t0123\t01234'
str4 = '01\t01\r2\t0123\t01234'
print(str1.expandtabs())
print(str1.expandtabs(4))
print(str2.expandtabs())
print(str3.expandtabs())
print(str3.expandtabs())
结果:
01 012 0123 01234
01 012 0123 01234
abc 测试0123 01234
01 01
2 0123 01234
01 01
2 0123 01234
返回子字符串 sub 在 s[start:end] 切片内被找到的最小索引。
可选参数 start 、end是起止位置。 如果 sub 未被找到则返回 -1。
含头不含尾。
例子:
str1 = 'python123'
print(str1.find('t'))
print(str1.find('th'))
print(str1.find('t',0,5))
print(str1.find('t',2,5))
print(str1.find('t',3,5))
print(str1.find('thon',2,5))
结果:
2
2
2
2
-1
-1