字符串的本质是字符序列
Python不支持修改字符串,不支持单字符,允许空字符串存在
Python3支持Unicode,可以表示世界上任何书面语言的字符,默认16位Unicode编码(ASCII 8位是Unicode的子集)
ord():字符串转为Unicode编码
chr():十进制数字转为对应的字符串
len():查看字符串长度
单引号或双引号创建字符串
连续三个单引号或者双引号可以帮助创建多行字符串(在内部换行)
\
转义字符 | 描述 |
---|---|
(在行尾时) | 续行符 |
\ | 反斜杠符号 |
’ | 单引号 |
" | 双引号 |
\b | 退格(Backspace) |
\n | 换行 |
\t | 横向制表符 |
\r | 回车 |
+或者直接放在一起
print(“string”’,end=“any sign”)
variable=input(“instruction”)
数字类型转字符串
提取字符
str[offset]
最左侧第一个字符偏移量是1,直到len(str)-1;最右侧第一个字符偏移量是-1,直到len(str)
实现字符串替换
Python中字符串不可变,实际过程中,创建了新的字符串对象,并将变量指向新的字符串
>>>>>> a="cat,dog,rabbit"
>>> a.split(",")
['cat', 'dog', 'rabbit']
>>> b=a.split(",")
>>> b
['cat', 'dog', 'rabbit']
>>> ",".join(b)
'cat,dog,rabbit'
使用字符串拼接符+,每拼接一次会生成新的字符串对象,因此不推荐使用+来拼接字符串。推荐
使用join 函数,因为join 函数在拼接字符串之前会计算所有字符串的长度,然后逐一拷贝,仅新建一次对象。
仅保存一份相同且不可变字符串的方法
不同的值被存放在字符串驻留池中
对于符合标识符规则的字符串会启用字符串驻留机制
==,!=判断是否含有相同字符
is//not is 判断两个对象是否为同一对象(判断地址(id))
in//not in关键字,判断某个字符(子字符串)是否存在于字符串中
方法 | 说明 |
---|---|
len(a) | 字符串长度 |
a.startswith(‘b’) | 以指定字符串开头(True//False) |
a.endswith(‘b’) | 以指定字符串结尾(True//False) |
a.find(‘b’) | 第一次出现指定字符串的位置 |
a.rfind(‘b’) | 最后一次出现指定字符串的位置 |
a.count(“b”) | 指定字符串出现了几次 |
a.isalnum() | 所有字符全是字母或数字(True//False) |
strip()去除首尾指定信息
lstrip()去除字符串左边指定信息
rstrip()去除字符串右边指定信息
方法 | 说明 |
---|---|
a.capitalize() | 产生新的字符串,首字母大写 |
a.title() | 产生新的字符串,每个单词都首字母大写 |
a.upper() | 产生新的字符串,所有字符全转成大写 |
a.lower() | 产生新的字符串,所有字符全转成小写 |
a.swapcase() | 产生新的,所有字母大小写转换 |
center()、ljust()、rjust()这三个函数用于对字符串实现排版
>>> a="test string"
>>> a.center(20," ")
' test string '
>>> a.center(20)
' test string '
>>> a.center(20,"-")
'----test string-----'
>>> a.ljust(10)
'test string'
>>> a.ljust(20)
'test string '
方法 | 说明 |
---|---|
isalnum() | 是否为字母或数字 |
isalpha() | 检测字符串是否只由字母组成(含汉字)。 |
isdigit() | 检测字符串是否只由数字组成。 |
isspace() | 检测是否为空白符 |
isupper() | 是否为大写字母 |
islower() | 是否为小写字母 |
str.format()
>>> a="My favorite animals are {0}, {1} and {2}."
>>> a.format("cat","dog","rabbit")
'My favorite animals are cat, dog and rabbit.'
>>> a="My favorite animals are {animal1}, {animal2} and {animal3}."
>>>a.format(animal1="cat",animal2="dog",animal3="rabbit")
'My favorite animals are cat, dog and rabbit.'
^、<、>分别是居中、左对齐、右对齐,后面带宽度
:号后面带填充的字符,只能是一个字符,不指定的话默认是用空格填充
>>> "{:->10}".format("245")
'-------245'
浮点数通过f,整数通过d 进行需要的格式化
数字 | 格式 | 输出 | 描述 |
---|---|---|---|
3.1415926 | {:.2f} | 3.14 | 保留小数点后两位 |
3.1415926 | {:+.2f} | 3.14 | 带符号保留小数点后两位 |
2.71828 | {:.0f} | 3 | 不带小数 |
5 | {:0>2d} | 05 | 数字补零(填充左边, 宽度为2) |
5 | {:x<4d} | 5xxx | 数字补x (填充右边, 宽度为4) |
10 | {:x<4d} | 10xx | 数字补x (填充右边, 宽度为4) |
1000000 | {:,} | 1,000,000 | 以逗号分隔的数字格式 |
0.25 | {:.2%} | 25.00% | 百分比格式 |
1000000000 | {:.2e} | 1.00E+09 | 指数记法 |
13 | {:10d} | 13 | 右对齐(默认, 宽度为10) |
13 | {:<10d} | 13 | 左对齐(宽度为10) |
13 | {:^10d} | 13 | 中间对齐(宽度为10) |
在Python 中,字符串属于不可变对象,不支持原地修改,如果需要修改其中的值,智
能创建新的字符串对象
确实需要原地修改字符串,可以使用io.StringIO对象或array 模块
>>> s = "hello, sxt"
>>> sio = io.StringIO(s)
>>> sio
<_io.StringIO object at 0x02F462B0>
>>> sio.getvalue()
'hello, sxt'
>>> sio.seek(7)
7
>>> sio.write("g")
1
>>> sio.getvalue()
'hello, gxt'