偷学Python第八天:字符串的基本操作

人生苦短我用Python

偷学Python第八天:字符串的基本操作

古之立大事者,不惟有超世之才,亦必有坚忍不拔之志。——苏轼

文章目录

  • 偷学Python第八天:字符串的基本操作
    • 字符串的定义
    • 转义字符和原始字符串
    • 字符串的运算
      • 拼接运算符
      • 成员运算
      • 获取字符串长度
      • 索引和切片
      • 循环遍历
      • 总结
    • 字符串的方法
      • 转换大小写
      • 查找操作
      • 性质判断
      • 格式化字符串
      • 修剪操作
      • 总结
    • 今日学习总结
    • 明日学习计划

字符串的定义

所谓字符串,就是由0个或者多个字符组成的有限序列

在Python程序中,如果我们把单个或多个字符用单引号''或者双引号""包裹起来,就可以表示一个字符串,也可以用三个单引号或者双引号进行折行。字符串的字符可以是特殊符号、英文字母、中文字符、日文的平假名或片假名、希腊字母、emoji字符等等。

示例代码

text1 = "这是用双引号包裹的字符串"
text2 = '这是用单引号包裹的字符串'
text3 ="""
这一个是那个三个引号包裹的字符串
听说可以换行
我来试试
"""

print(text1)
print(text2)
print(text3)

偷学Python第八天:字符串的基本操作_第1张图片

转义字符和原始字符串

Python中使用反斜杠“\”来表示转义,也就是说\后面的内容就不会是原始的内容了,例如\n则表示换行,而不再表示\和字符n了;所以如果字符串本身包含了'"\这些特殊的字符,必须要通过\进行转义处理。

例如

text1 = "\'Hello world\'" # 输出被单引号包裹的Hello world
text2 = '\\Hello world\\' # 输出被两个反斜线包裹的Hello world


print(text1)
print(text2)

一些转义字符

转义字符 描述
(在行尾时) 续行符
\ 反斜杠符号
单引号
" 双引号
\a 响铃
\b 退格(Backspace)
\000
\n 换行
\v 纵向制表符
\t 横向制表符
\r 回车
\f 换页
\oyy 八进制数,yy 代表的字符,例如:\o12 代表换行,其中 o 是字母,不是数字 0。
\xyy 十六进制数,yy代表的字符,例如:\x0a代表换行
\other 其它的字符以普通格式输出

原始字符串是Python中一类比较特殊的字符串,以大写字母R或者小写字母r开始。在原始字符串中,字符“\” 不再表示转义字符的含义。

例如

text1 = "古之立大事者,\n不惟有超世之才,\n亦必有坚忍不拔之志"
text2 = r"古之立大事者,\n不惟有超世之才,\n亦必有坚忍不拔之志"

print(text1)
print(text2)

在这里插入图片描述

字符串的运算

Python为字符串类型提供了非常多的运算符

拼接运算符

使用+运算符来实现字符串的拼接,使用*运算符来重复一个字符串的内容

text1 = "Hello,world"
text2 = "!"
print(text1 + text2) # Hello,world!
print(text2 * 10) # !!!!!!!!!!

*实现字符串的重复是很重要,比如要打印一个分隔线如果写成---------------会很麻烦的,但是如果用- * 20就很简单了

成员运算

Python中可以用innot in判断一个字符串中是否存在另外一个字符或字符串,innot in运算通常称为成员运算,会产生布尔值TrueFalse

text1 = "Hello,world"
text2 = "你好小周,我是甜甜"
print("llo" in text1) # True
print("你好" not in text2) # Flase
print("您好" not in text2) # True

获取字符串长度

通过内置函数len()来获取字符的长度

text1 = "Hello,world"
text2 = "你好小周,我是甜甜"
print(len(text1)) # 11
print(len(text2)) # 9

索引和切片

如果在字符串中引用某个字符,可以对字符从进行索引运算(注:Python的索引值是从0开始的),运算符是[n],其中n是一个整数,假设字符串的长度为N,那么n可以是从0N-1的整数,其中0是字符串中第一个字符的索引,而N-1是字符串中最后一个字符的索引,通常称之为正向索引;在Python中,字符串的索引也可以是从-1-N的整数,其中-1是最后一个字符的索引,而-N则是第一个字符的索引,通常称之为负向索引

注意,因为字符串是不可变类型,所以不能通过索引运算修改字符串中的字符

text1 = "Hello,world"
text2 = "你好小周,我是甜甜"
N1 = len(text1)
N2 = len(text2)
# 获取第一个字符
print(text1[0],text1[-N1]) # H H
print(text2[0],text2[-N2]) # 你 你
# 获取最后一个字符
print(text1[N1 - 1 ],text1[-1]) # d d
print(text2[N2 - 1 ],text2[-1]) # 甜 甜
# 获取索引为2和-2的字符
print(text1[2],text1[-2]) # l l
print(text2[2],text2[-2]) # 小 甜

注意:如果索引越界(即索引值不在索引范围内)会引起错误,例如

print(text2[222])

会报出这样的错误

IndexError: string index out of range # (字符串索引超出范围)

如果要取出多个字符,要对字符串进行切片,运算符是[i:j:k],其中i是开始索引,索引对应的字符可以不能取到N-1或者-1j是结束索引,索引对应的字符不能取到0或者-Nk是步长,默认值为1,表示从前向后获取相邻字符的连续切片(可以省略),如果k的值为正数,即为正向索引;如果k的值为负数,即为负向索引

s = '123456789abcdef,是甜甜呢'
# i=3, j=6, k=1的正向切片操作
print(s[3:6])       # 456

# i=-17, j=-14, k=1的正向切片操作
print(s[-17:-14])     # 456

# i=16, j=默认, k=1的正向切片操作
print(s[16:])        # 是甜甜呢

# i=-4, j=默认, k=1的正向切片操作
print(s[-4:])       # 是甜甜呢

# i=8, j=默认, k=2的正向切片操作
print(s[8::2])      # 9bdf是甜

# i=-12, j=默认, k=2的正向切片操作
print(s[-12::2])     # 9bdf是甜

# i=默认, j=默认, k=2的正向切片操作
print(s[::2])       # 13579bdf是甜

# i=默认, j=默认, k=1的正向切片
print(s[:])         # 123456789abcdef,是甜甜呢

# i=1, j=-1, k=2的正向切片操作
print(s[1:-1:2])    # 2468ace,甜

print("-"*20)

# i=7, j=1, k=-1的负向切片操作
print(s[7:1:-1])    # 876543

# i=-13, j=-19, k=-1的负向切片操作
print(s[-13:-19:-1])  # 876543

# i=8, j=默认, k=-1的负向切片操作
print(s[8::-1])     # 987654321

# i=默认, j=1, k=-1的负向切片操作
print(s[:15:-1])     # 呢甜甜是

# i=默认, j=默认, k=-1的负向切片
print(s[::-1])      # 呢甜甜是,fedcba987654321

# i=默认, j=默认, k=-2的负向切片
print(s[::-2])      # 呢甜,eca8642

注意:返回的字符串是包括i不包括j

i的默认值为最开始的那个数,j`的默认值为结束的那个数(包括本身)

循环遍历

可以通过for循环对字符串进行遍历,取出每个字符串

方法1:通过索引的方式取出每个字符串

s = '123456789abcdef,是甜甜呢'

for i in range(len(s)):
     print(s[i])

方法2:直接遍历得出

s = '123456789abcdef,是甜甜呢'

for ch in s:
     print(ch)

总结

运算符或方法 描述
+ 字符串连接
* 重复输出字符串
[n] 通过索引获取字符串中字符
[i:j:k] 通过索引截取字符串中的一部分,遵循左闭右开原则
in 成员运算符 - 如果字符串中包含给定的字符返回 True
not in 成员运算符 - 如果字符串中不包含给定的字符返回 True
len 获取字符串、列表等的长度。

字符串的方法

在Python中使用字符串的类型自带的方法对字符串进行处理和操作,对于一个字符串类型的变量,使用变量名.方法名()的方式来调用它的方法。所谓方法其实就是跟某个类型的变量绑定的函数。

转换大小写

s1 = 'hello, world!'

# 使用capitalize方法获得字符串首字母大写后的字符串
print(s1.capitalize())   # Hello, world!
# 使用title方法获得字符串每个单词首字母大写后的字符串
print(s1.title())        # Hello, World!
# 使用upper方法获得字符串大写后的字符串
print(s1.upper())        # HELLO, WORLD!

s2 = 'GOODBYE'
# 使用lower方法获得字符串小写后的字符串
print(s2.lower())        # goodbye

查找操作

如果想在一个字符串中从前向后查找有没有另外一个字符串,可以使用字符串的findindex方法。

s = 'hello, world!'

# find方法从字符串中查找另一个字符串所在的位置
# 找到了返回字符串中另一个字符串首字符的索引
print(s.find('or'))        # 8
# 找不到返回-1
print(s.find('shit'))      # -1
# index方法与find方法类似
# 找到了返回字符串中另一个字符串首字符的索引
print(s.index('or'))       # 8
# 找不到引发异常
print(s.index('shit'))     # ValueError: substring not found

在使用findindex方法时还可以通过方法的参数来指定查找的范围,就是不必从索引0的位置开始。``findindex方法还有逆向查找(从后向前查找)的版本,分别是rfindrindex`

s = 'hello good world!'

# 从前向后查找字符o出现的位置(相当于第一次出现)
print(s.find('o'))       # 4
# 从索引为5的位置开始查找字符o出现的位置
print(s.find('o', 5))    # 7
# 从后向前查找字符o出现的位置(相当于最后一次出现)
print(s.rfind('o'))      # 12

性质判断

可以通过字符串的startswithendswith来判断字符串是否以某个字符串开头和结尾;还可以用is开头的方法判断字符串的特征,这些方法都返回布尔值。

s1 = 'hello, world!'

# startwith方法检查字符串是否以指定的字符串开头返回布尔值
print(s1.startswith('He'))    # False
print(s1.startswith('hel'))   # True
# endswith方法检查字符串是否以指定的字符串结尾返回布尔值
print(s1.endswith('!'))       # True

s2 = 'abc123456'

# isdigit方法检查字符串是否由数字构成返回布尔值
print(s2.isdigit())    # False
# isalpha方法检查字符串是否以字母构成返回布尔值
print(s2.isalpha())    # False
# isalnum方法检查字符串是否以数字和字母构成返回布尔值
print(s2.isalnum())    # True

格式化字符串

在Python中,字符串类型可以通过centerljustrjust方法做居中、左对齐和右对齐的处理。

s = 'hello, world'

# center方法以宽度20将字符串居中并在两侧填充*
print(s.center(20, '*'))  # ****hello, world****
# rjust方法以宽度20将字符串右对齐并在左侧填充空格
print(s.rjust(20))        #         hello, world
# ljust方法以宽度20将字符串左对齐并在右侧填充~
print(s.ljust(20, '~'))   # hello, world~~~~~~~~

Python2.6 开始,新增了一种格式化字符串的函数 str.format(),它增强了字符串格式化的功能。

基本语法是通过 {}: 来代替以前的 %

a = 111
b = 222
print('{0} + {1} = {2}'.format(a, b, a + b)) # 111 + 222 = 333
c = "hello"
d = "world"
# 不设置指定位置,按默认顺序
print("{} {}".format(c, d))        # hello world
print("{0} {1}".format(c, d))      # hello world
print("{1} {0}".format(d, c))      # hello world
print("{1} {0} {1}".format(c, d))  # world hello world

从Python 3.6开始,格式化字符串还有更为简洁的书写方式,就是在字符串前加上f来格式化字符串,在这种以f打头的字符串中,{变量名}是一个占位符,会被变量对应的值将其替换掉。

a = 111
b = 222
print(f"{a} + {b} = {a + b}") # 111 + 222 = 333
c = "hello"
d = "world"
print(f"{c} {d}")        # hello world

对数字格式化的多种操作

数字 格式 输出 描述
3.1415926 {:.2f} 3.14 保留小数点后两位
3.1415926 {:+.2f} +3.14 带符号保留小数点后两位
-1 {:+.2f} -1.00 带符号保留小数点后两位
2.71828 {:.0f} 3 不带小数
5 {:0>2d} 05 数字补零 (填充左边, 宽度为2)
5 {:x<4d} 5xxx 数字补x (填充右边, 宽度为4)
10 {:x<4d} 10xx 数字补x (填充右边, 宽度为4)
1000000 {:,} 1,000,000 以逗号分隔的数字格式
0.25 {:.2%} 25.00% 百分比格式
1000000000 {:.2e} 1.00e+09 指数记法
13 {:>10d} 13 右对齐 (默认, 宽度为10)
13 {:<10d} 13 左对齐 (宽度为10)
13 {:^10d} 13 中间对齐 (宽度为10)
11 '{:b}'.format(11)
'{:d}'.format(11)
'{:o}'.format(11)
'{:x}'.format(11)
'{:#x}'.format(11)
'{:#X}'.format(11)
1011
11
13
b
0xb
0XB
进制

^, <, > 分别是居中、左对齐、右对齐,后面带宽度, : 号后面带填充的字符,只能是一个字符,不指定则默认是用空格填充。
+ 表示在正数前显示 +,负数前显示 -; (空格)表示在正数前加空格
b、d、o、x 分别是二进制、十进制、八进制、十六进制。

修剪操作

strip() 方法用于移除原字符串修剪掉左右指定的字符(默认为空格或换行符)或字符序列。这个方法非常有实用价值,通常用来将用户输入中因为不小心键入的头尾空格去掉,strip方法还有lstrip(即left strip)和rstrip(即right strip)两个版本。

s = '   甜甜很可爱呦  \t\n'
# strip方法获得字符串修剪左右两侧空格之后的字符串
print(s.strip())    # 甜甜很可爱呦

s1 = "!!!甜甜很可爱呦!!!"
print(s1.lstrip("!")) # 甜甜很可爱呦!!!
print(s1.rstrip("!")) # !!!甜甜很可爱呦

总结

方法 描述 参数
capitalize 将字符串的第一个字母变成大写,其他字母变小写
title 返回单词都是以大写开始,其余字母均为小写
upper 将字符串中的小写字母转为大写字母。
lower 转换字符串中所有大写字符为小写
find 检测字符串中是否包含子字符串 str ,如果指定 beg(开始) 和 end(结束) 范围,则检查是否包含在指定范围内,如果包含子字符串返回开始的索引值,否则返回-1。 str – 指定检索的字符串
beg – 开始索引,默认为0(可选)。
end – 结束索引,默认为字符串的长度(可选)。
index 与find类似,不同的是str不在 字符串中会报一个异常。 同上
rfind 反向的find 同上
rindex 反向的index 同上
startswith 用于检查字符串是否是以指定子字符串开头,如果是则返回 True,否则返回 False。如果参数 strbeg 和 strend 指定值,则在指定范围内检查。 str – 检测的字符串。
strbeg – 可选参数用于设置字符串检测的起始位置。
strend – 可选参数用于设置字符串检测的结束位置。
endswith 用于判断字符串是否以指定后缀结尾,如果以指定后缀结尾返回True,否则返回False。可选参数"strbeg"与"strend"为检索字符串的开始与结束位置。 同上
isdigit 检测字符串是否只由数字组成。
isalpha 检测字符串是否只由字母组成。
isalnum 检测字符串是否由字母和数字组成。
center 返回一个原字符串居中,并使用空格填充至长度 width 的新字符串。默认填充字符为空格。 width – 字符串的总宽度。
fillchar – 填充字符(可选)。
rjust 返回一个原字符串右对齐,并使用空格填充至长度 width 的新字符串。如果指定的长度小于字符串的长度则返回原字符串 同上
ljust 法返回一个原字符串左对齐,并使用空格填充至指定长度的新字符串。如果指定的长度小于原字符串的长度则返回原字符串。 同上
strip 用于移除字符串头尾指定的字符(默认为空格或换行符)或字符序列。 移除字符串头尾指定的字符序列
lstrip 用于截掉字符串左边的空格或指定字符 同上
rstrip 删除 string 字符串末尾的指定字符 同上

今日学习总结

字符串的各种骚操作

明日学习计划

复习函数和字符串的使用,完成一些小的案例

你可能感兴趣的:(python,字符串)