我们许多熟悉C,C ++等编程语言的人都会得到诸如“字符串是字符的集合或字符数组”的答案。在Python中也是如此,我们说的是String数据类型的相同定义。
字符串是序列字符的数组,并写在单引号,双引号或三引号内。另外,Python没有字符数据类型,因此当我们编写“ a”时,它将被视为长度为1的字符串。
a = 'Hello'
print(a)
b = "Hello"
print(b)
c ='''Hello
How is the whether today? '''
print(c)
#输出
Hello
Hello
Hello
How is the whether today?
- 当我们在字符串中同时使用单引号和双引号以及要编写多行句子时,通常使用三引号
- 在使用单引号时,字符串中不应包含单引号,因为如果发生这种情况,Python将假定该行在第二个引号本身出现的情况下结束,并且不会获取所需的输出
- 相同的符号后应加上双引号和三引号
可以截取字符串的一部分并与其他字段拼接,如下:
a='hello world'
print(a)
print('已更新字符串:',a[:6] + 'how are you')
#执行结果如下
hello world
已更新字符串: hello how are you
转义字符 | 描述 |
---|---|
\ (在行尾时) | 续行符 |
\\ | 反斜杠符号 |
\’ | 单引号 |
\" | 双引号 |
\n | 换行 |
\b | 退格 |
\t | 横向制表符 |
\r | 回车,将 \r 后面的内容移到字符串开头,并逐一替换开头部分的字符,直至将 \r 后面的内容完全替换完成 |
------------------------------------------------(跨行输出)----------------------------------------
print("line1 \
line2 \
line3")
#执行结果如下
line1 line2 line3
------------------------------------------------(换行)-------------------------------------------
print("hello\nworld")
#执行结果如下
hello
world
------------------------------------------------(横向制表符)---------------------------------------
print("hello \tworld")
#执行过程如下
hello world
------------------------------------------------(替换)----------------------------------------
print("hello\rworld")
#执行过程如下
world
print('google runoob taobao\r123456')
#执行过程如下
123456
------------------------------------------------(退格)----------------------------------------
print("hello\bworld")
#执行过程如下
hellworld
下面的代码中多次输出"我今年XX岁",其中只有xx代表的内容是变化的,试想一下,是否有一种简化程序的方式呢?
print("我今年10岁")
print("我今年11岁")
print("我今年12岁")
我们可以通过字符串格式化来完成操作,如下所示
print("我叫%s,今年%d岁!" % ('小明',10))
#输出结果
我叫小明,今年10岁!
a="我的"
b="祖国"
print("我爱你,%s,%s"%(a,b))
#输出结果
我爱你,我的,祖国
符号 | 说明 |
---|---|
%s | 字符串 |
%d | 有符号十进制整数 |
%f | 浮点实数 |
Python3提供了input函数从标准输入读取一行文本,默认的标准输入是键盘。
input可以接收一个python表达式作为输入,并将运算结果返回。
user_name=input("请输入用户名:")
print(user_name)
#输出结果
请输入用户名:张三
张三
a="hello,this is a apple"
print(len(a))
#输出结果
21
[起始:结束:步长]
切片选取的区间属于左闭右开型,即从“起始”位开始,到“结束”位的前一位结束(不包含结束位本身)
a="Hello,this is a super man."
print(len(a))
print(a[5]) #a[5]代表字符串中下标为5的字符,第6个字符
print(a[5:10]) #a[5:10]代表字符串中下标从5到9的字符,即第6个到第10个的字符,不包括10
print(a[5:10:2]) #a[5:10:2]代表字符串中下标从5到9的字符,每两个取前一个,即第6,8,10的字符
#输出结果
26
,
,this
,hs
name="abcdef"
,则name[0:3] ———— abc #从0开始到2的值
name[3:5] ————de #从3开始到4的值
name[1:-1]————bcde #1表示从第一个开始,-1表示从后往前取,不包括最后一个
name[2:] ————cdef #从第2个开始一直取到最后
name[::-2]————fdb #从后往前取值,步长为2
检查字符串是否包含子字符串
str.find(sub[,start[,end]])
#参数如下:
sub——》指定检索的字符串
start——》开始索引,默认是0
end——》结束索引,默认为字符串的长度
a="Hello,I'm LiLei"
b="Hello"
c="I'm LiLei"
print(a.find(b))
print(a.find(c))
print(b.find(c))
#输出结果
0
6
-1
检测字符串是否包含子字符串
str.index(sub[,start[,end]])
#参数如下
sub——》指定检索的字符串
start——》开始索引,默认为0
end——》结束索引,默认为字符串的长度
a="Hello,I'm LiLei"
b="Hello"
c="I'm LiLei"
print(a.index(b))
print(a.index(c))
print(b.index(c))
#输出结果
Traceback (most recent call last):
File "E:/PycharmProjects/str_2022.0115/str/transform.py", line 69, in <module>
print(b.index(c))
ValueError: substring not found
0
6
PS:find 和 index 功能上几乎相同,但是find如果找不到会返回一个 -1 ,而 index 如果找不到则会直接报错
统计字符串中某个字符的个数
str.count(sub[,start[,end]])
#参数如下
sub——》搜索的子字符串
start——》字符串开始搜索的位置
end——》字符串结束搜索的位置
a="Hello,I'm LiLei"
print(a.count("m",9))
print(a.count("m",8)) #从第8个开始找,m的下标为8,所以能找到
print(a.count("m",8,1)) #如果其实下标比结束下标大,则相当于空字符串
#输出结果
0
1
0
PS:如果有多个匹配的情况,也只会返回第一个匹配的位置
将旧字符串替换为新字符串
str.replace(old,new[,count])
#参数如下
old——》被替换的字符串
new——》替换的新字符串
count——》可选参数,替换不超过count次.0
a="Hello,I'm LiLei,How are you! Hello"
b="Hello"
c="I'm LiLei"
print(a.replace("LiLei","lisi")) #把LiLei给替换成lisi了
print(a.replace(b,"你好")) #把b定义的Hello,在a中全部替换掉了
print(a.replace(b,"你好",1)) #只替换一次,优先替换掉前面的
#输出结果
Hello,I'm lisi,How are you! Hello
你好,I'm LiLei,How are you! 你好
你好,I'm LiLei,How are you! Hello
通过指定分隔符对字符串进行切片
str.split(sep=None,maxsplit=-1)
#参数如下
sep——》分隔符,默认为所有空字符
maxsplit——》分割次数
a="Hello,I'm LiLei,How are you! Hello"
print(a.split(",")) #以逗号进行分割
print(a.split(",",1)) #指定分割次数为1次
#输出结果
['Hello', "I'm LiLei", 'How are you! Hello']
['Hello', "I'm LiLei,How are you! Hello"]
capitalize:第一个字符大写,其他字符小写
str.capitalize()
title:所有单词首字母大写,其余字母小写
str.title()
upper:所有字符全部大写
str.upper()
lower:所有字符全部小写
str.lower()
a="hello,i'm lilei,how are you! hello"
print(a.capitalize()) #第一个字母大写
print(a.title()) #空格和符号后的第一个字母大写,其他小写
print(a.upper()) #所有都大写
print(a.lower()) #所有全部小写
#输出结果
Hello,i'm lilei,how are you! hello
Hello,I'M Lilei,How Are You! Hello
HELLO,I'M LILEI,HOW ARE YOU! HELLO
hello,i'm lilei,how are you! hello
startwith:检查字符串是否以指定字串开头
endswith:检查字符串是否以指定字串结尾
str.startswith(prefix[,start[,end]])
#参数如下
prefix——》检测的字符串
start——》可选参数,字符串检测的起始位置
end——》可选参数,字符串检测的结束位置
a="hello,i'm lilei,how are you! Hello"
print(a.startswith("hello",0))
print(a.startswith("Hello"))
print(a.startswith("Hello",29))
print(a.endswith("Hello"))
print(a.endswith("hello"))
print(a.endswith("hello",0,5)) #0,5表示查找开始下标0和结束下标5
#执行结果
True
False
True
True
False
True
左对齐,使用空格填充至指定长度的新字符串
右对齐,使用空格填充至指定长度的新字符串
str.ljust(width[,fillchar])
str.rjust(width[,fillchar])
#参数如下
width——》指定字符串的长度
fillchar——》填充字符,默认为空格
b="Hello"
print(b.ljust(10,','))
print(b.rjust(10,','))
#执行结果
Hello,,,,,
,,,,,Hello
返回一个长度为 width 且居中的字符串
str.center(width[,fillchar])
#参数如下
width——》指定字符串的长度
fillchar——》填充字符
b="Hello"
print(b.center(10,'_')) #把字符串放在中间位置,左右用_进行填充到10个占位
#执行结果
__Hello___
截取字符串左边的空格或指定字符
str.lstrip([chars])
#参数如下
chars——》指定要截取的字符
c=" I'm LiLei "
print(c.lstrip()) #左右都有空格,只去掉了左边的
print(c.rstrip()) #左右都有空格,只去掉了右边的
print(a.rstrip('Hello')) #还可以去掉指定的字符串
#执行结果
I'm LiLei
I'm LiLei
hello,i'm lilei,how are you!
语法格式
encode(encoding='UTF-8',errors='strict')
以 encoding 指定的编码格式编码字符串,如果出错默认报一个ValueError 的异常,除非 errors 指定的是'ignore'或者'replace'
b="你好"
print(b.encode("UTF-8"))
print(b.encode("GBK"))
#执行结果
b'\xe4\xbd\xa0\xe5\xa5\xbd'
b'\xc4\xe3\xba\xc3'
删除字符串头尾指定的字符
str.strip([chars])
#参数如下
chars——》移除字符串头尾指定的字符
a="hello,i'm lilei,how are you! Hello"
print(a.strip('hello'))
#执行结果
,i'm lilei,how are you! H
python2.6版本开始,新增了一种格式化字符串的函数 str.format(),它增强了字符串格式化的功能
基本语法是通过{} 和 : 来代替以前的 %
format 函数可以接受不限个参数,位置可以不按顺序
① 指定位置
print("{} {}".format("hello","world")) #不指定位置,按默认顺序
print("{0} {1}".format("hello","world")) #指定位置
print("{1} {0}".format("hello","world"))
print("{1} {0} {1}".format("hello","world"))
#执行结果
hello world
hello world
world hello
world hello world
② 通过字典设置参数
site={"name":"百度","url":"www.baidu.com"}
print("网站名:{name},地址:{url}".format(**site))
#执行结果
网站名:百度,地址:www.baidu.com
③ 通过列表索引设置参数
my_list=["百度百科","www.baidu,com"]
print("网站名:{0[0]},地址:{0[1]}".format(my_list))
#执行结果
网站名:百度百科,地址:www.baidu,com
操作符 | 描述 |
---|---|
+ | 字符串连接 |
* | 重复输出字符串 |
[] | 通过索引获取字符串中的字符 |
[:] | 截取字符串中的一部分 |
a="hello"
b="world"
print(a+b)
#输出结果
helloworld
------------------------------------------------------------------------------------------------
a="hello"
print(a*3)
#输出结果
hellohellohello
------------------------------------------------------------------------------------------------
a="hello"
b="world"
print(a[1])
#输出结果
e
------------------------------------------------------------------------------------------------
a="hello"
b="world"
print(a[1:3]) #下标1到3的值,不包括3
#输出结果
el