2021-01-08&09 Python序列-字符串

Python字符串

SUMUP
2021-01-08&09 Python序列-字符串_第1张图片

字符串的编码

字符串的本质是字符序列
Python不支持修改字符串,不支持单字符,允许空字符串存在
Python3支持Unicode,可以表示世界上任何书面语言的字符,默认16位Unicode编码(ASCII 8位是Unicode的子集)
ord():字符串转为Unicode编码
chr():十进制数字转为对应的字符串
len():查看字符串长度

创建字符串

单引号或双引号创建字符串
连续三个单引号或者双引号可以帮助创建多行字符串(在内部换行)

转义字符

\

转义字符 描述
(在行尾时) 续行符
\ 反斜杠符号
单引号
" 双引号
\b 退格(Backspace)
\n 换行
\t 横向制表符
\r 回车

字符串拼接

+或者直接放在一起

字符串复制

不换行打印

print(“string”’,end=“any sign”)

控制台读取字符串

variable=input(“instruction”)

str()

数字类型转字符串

[]

提取字符
str[offset]
最左侧第一个字符偏移量是1,直到len(str)-1;最右侧第一个字符偏移量是-1,直到len(str)

replace()

实现字符串替换
Python中字符串不可变,实际过程中,创建了新的字符串对象,并将变量指向新的字符串
2021-01-08&09 Python序列-字符串_第2张图片

切片

2021-01-08&09 Python序列-字符串_第3张图片
2021-01-08&09 Python序列-字符串_第4张图片
注意点:从0开始;包头不包尾

split()分割和join()合并

>>>>>> a="cat,dog,rabbit"
>>> a.split(",")
['cat', 'dog', 'rabbit']
>>> b=a.split(",")
>>> b
['cat', 'dog', 'rabbit']
>>> ",".join(b)
'cat,dog,rabbit'

使用字符串拼接符+,每拼接一次会生成新的字符串对象,因此不推荐使用+来拼接字符串。推荐
使用join 函数,因为join 函数在拼接字符串之前会计算所有字符串的长度,然后逐一拷贝,仅新建一次对象。

字符串驻留机制

仅保存一份相同且不可变字符串的方法
不同的值被存放在字符串驻留池中
对于符合标识符规则的字符串会启用字符串驻留机制

字符串常用方法汇总

比较和同一性

==,!=判断是否含有相同字符
is//not is 判断两个对象是否为同一对象(判断地址(id))

成员操作符

in//not in关键字,判断某个字符(子字符串)是否存在于字符串中

常用查找方法

方法 说明
len(a) 字符串长度
a.startswith(‘b’) 以指定字符串开头(True//False)
a.endswith(‘b’) 以指定字符串结尾(True//False)
a.find(‘b’) 第一次出现指定字符串的位置
a.rfind(‘b’) 最后一次出现指定字符串的位置
a.count(“b”) 指定字符串出现了几次
a.isalnum() 所有字符全是字母或数字(True//False)

去除首尾信息

strip()去除首尾指定信息
lstrip()去除字符串左边指定信息
rstrip()去除字符串右边指定信息

大小写转换

方法 说明
a.capitalize() 产生新的字符串,首字母大写
a.title() 产生新的字符串,每个单词都首字母大写
a.upper() 产生新的字符串,所有字符全转成大写
a.lower() 产生新的字符串,所有字符全转成小写
a.swapcase() 产生新的,所有字母大小写转换

格式排版

center()、ljust()、rjust()这三个函数用于对字符串实现排版

>>> a="test string"
>>> a.center(20," ")
'    test string     '
>>> a.center(20)
'    test string     '
>>> a.center(20,"-")
'----test string-----'
>>> a.ljust(10)
'test string'
>>> a.ljust(20)
'test string         '

其他方法

方法 说明
isalnum() 是否为字母或数字
isalpha() 检测字符串是否只由字母组成(含汉字)。
isdigit() 检测字符串是否只由数字组成。
isspace() 检测是否为空白符
isupper() 是否为大写字母
islower() 是否为小写字母

字符串的格式化

format

str.format()

>>> a="My favorite animals are {0}, {1} and {2}."
>>> a.format("cat","dog","rabbit")
'My favorite animals are cat, dog and rabbit.'
>>>  a="My favorite animals are {animal1}, {animal2} and {animal3}."
>>>a.format(animal1="cat",animal2="dog",animal3="rabbit")
'My favorite animals are cat, dog and rabbit.'

填充与对齐

^、<、>分别是居中、左对齐、右对齐,后面带宽度
:号后面带填充的字符,只能是一个字符,不指定的话默认是用空格填充

>>> "{:->10}".format("245")
'-------245'

数字格式化

浮点数通过f,整数通过d 进行需要的格式化

数字 格式 输出 描述
3.1415926 {:.2f} 3.14 保留小数点后两位
3.1415926 {:+.2f} 3.14 带符号保留小数点后两位
2.71828 {:.0f} 3 不带小数
5 {:0>2d} 05 数字补零(填充左边, 宽度为2)
5 {:x<4d} 5xxx 数字补x (填充右边, 宽度为4)
10 {:x<4d} 10xx 数字补x (填充右边, 宽度为4)
1000000 {:,} 1,000,000 以逗号分隔的数字格式
0.25 {:.2%} 25.00% 百分比格式
1000000000 {:.2e} 1.00E+09 指数记法
13 {:10d} 13 右对齐(默认, 宽度为10)
13 {:<10d} 13 左对齐(宽度为10)
13 {:^10d} 13 中间对齐(宽度为10)

可变字符串

在Python 中,字符串属于不可变对象,不支持原地修改,如果需要修改其中的值,智
能创建新的字符串对象
确实需要原地修改字符串,可以使用io.StringIO对象或array 模块

>>> s = "hello, sxt"
>>> sio = io.StringIO(s)
>>> sio
<_io.StringIO object at 0x02F462B0>
>>> sio.getvalue()
'hello, sxt'
>>> sio.seek(7)
7
>>> sio.write("g")
1
>>> sio.getvalue()
'hello, gxt'

你可能感兴趣的:(Python,Fundamental)