Python基础篇之-Python字符串

python中的字符串

四块内容:

1.字符串的输出

2.字符串的索引与切片

3.字符串的常见操作(27种)

4.字符串的拼接(7种)

字符串输出

python中的字符串有多种形式,可以使用单引号('...'),双引号("...")都可以获得同样的结果。反斜杠 \ 可以用来转义:

>>>'这是一个字符串' # 单引号
'这是一个字符串'
>>>'doesn\'t' # 使用 反斜杠 \ 进行转义
"doesn't"
>>>"doesn't" # 使用 双引号

如果你不希望前置了 \ 的字符转义成特殊字符,可以使用 原始字符串 方式,在引号前添加 r 即可:

>>>print('C:\user\name') # 这里\n表示换行
C:\user
ame
>>>print(r'C:\user\name') # 引号前面加 r 
C:\user\name

字符串字面值可以跨行连续输入。一种方式是用三重引号:"""...""" 或 '''...'''。字符串中的回车换行会自动包含到字符串中,如果不想包含,在行尾添加一个 \ 即可。如下例:

print("""\
这是:
    可以跨行输出的字符串。
""")

将产生如下输出(注意最开始的换行没有包括进来):

这是:
    可以跨行输出的字符串。

字符串的索引与切片

字符串索引

字符串是可以被索引(下标访问)的,第一个字符的索引是0.

>>>word = 'Python'
>>>word[0]
'P'
>>>word[5]
'n'

索引也可以用负数,这种会从右边开始数:

>>>word[-1]
'n'
>>>word[-6]
'P'

注意 -0 和 0 是一样的,所以负数索引从 -1 开始。

字符串切片

除了索引,字符串还支持切片。索引可以得到单个字符,而切片可以获取子字符串:

>>>word[0:2]
'Py'

注意切片的开始总是被包括在结果中,而结束不被包括。这使得 s[:i] + s[i:] 总是等于 s

>>> word[:2] + word[2:]
'Python'
>>> word[:4] + word[4:]
'Python'

切片的索引有默认值;省略开始索引时默认为0,省略结束索引时默认为到字符串的结束:

>>> word[:2]# 从起始位置开始,取到 下标为2的前一个元素(不包括结束位本身)
'Py'
>>> word[4:]# 从下标为4开始,取出 后面所有的元素(没有结束位)
'on'
>>> word[-2:] # 从倒数第2个元素开始,取出 后面所有的元素(没有结束位)
'on'

切片的语法:[语法:结束:步长] 步长不写默认为0

>>> word[1:5:2] # 从下标为1开始,取到下标为5的前一个元素,步长为2(不包括结束位本身)
'yh'

您也可以这么理解切片:将索引视作指向字符 之间 ,第一个字符的左侧标为0,最后一个字符的右侧标为 n ,其中 n 是字符串长度。例如:

 +---+---+---+---+---+---+
 | P | y | t | h | o | n |
 +---+---+---+---+---+---+
 0   1   2   3   4   5   6
-6  -5  -4  -3  -2  -1

第一行数标注了字符串非负的索引的位置,第二行标注了对应的负的索引。那么从 i 到 j 的切片就包括了标有 i 和 j 的位置之间的所有字符。

使用过大索引会产生一个错误:

>>> word[42]  
Traceback (most recent call last):
  File "", line 1, in 
IndexError: string index out of range

但是,切片中的越界索引会被自动处理:

>>> word[4:42]
'on'
>>> word[42:]
''

Python 中的字符串不能被修改,它们是 immutable 的。因此,向字符串的某个索引位置赋值会产生一个错误:

>>> word[0] = 'J'
Traceback (most recent call last):
  File "", line 1, in 
TypeError: 'str' object does not support item assignment

如果需要一个不同的字符串,应当新建一个:

>>> 'J' + word[1:]
'Jython'

内建函数 len() 返回一个字符串的长度:

>>> s = 'supercalifragilisticexpialidocious'
>>> len(s)
34

字符串常见操作

如有字符串mystr = 'hello python',以下是常见的操作:

1 find

检测 str 是否包含在 mystr中,如果是返回开始的索引值,否则返回-1

mystr.find(str, start=0, end=len(mystr))

2 index

跟find()方法一样,只不过如果str不在 mystr中会报一个异常.

mystr.index(str, start=0, end=len(mystr))

3 count

返回 str在start和end之间 在 mystr里面出现的次数

mystr.count(str, start=0, end=len(mystr))

4 replace

把 mystr 中的 str1 替换成 str2,如果 count 指定,则替换不超过 count 次.

mystr.replace(str1, str2, mystr.count(str1))

5 split

以 str 为分隔符切片 mystr,如果
maxsplit有指定值,则仅分隔 maxsplit 个子字符串

mystr.split(str=" ", 2)

6 capitalize

把字符串的第一个字符大写

mystr.capitalize()

7 title

把字符串的每个单词首字母大写

a = "hello Python"

a.title()

'Hello Python'

8 startswith

检查字符串是否是以 hello 开头, 是则返回 True,否则返回 False

mystr.startswith(hello)

9 endswith

检查字符串是否以on结束,如果是返回True,否则返回 False.

mystr.endswith(on)

10 lower

转换 mystr 中所有大写字符为小写

mystr.lower()

11 upper

转换 mystr 中的小写字母为大写

mystr.upper()

12 ljust

返回一个原字符串左对齐,并使用空格填充至长度 width 的新字符串

mystr.ljust(width)

13 rjust

返回一个原字符串右对齐,并使用空格填充至长度 width 的新字符串

mystr.rjust(width)

14 center

返回一个原字符串居中,并使用空格填充至长度 width 的新字符串

mystr.center(width)

15 lstrip

删除 mystr 左边的空白字符

mystr.lstrip()

16 rstrip

删除 mystr 字符串末尾的空白字符

mystr.rstrip()

17 strip

删除mystr字符串两端的空白字符

a = "\n\t itcast \t\n"
a.strip()
'itcast'

18 rfind

类似于 find()函数,不过是从右边开始查找.

mystr.rfind(str, start=0,end=len(mystr) )

19 rindex

类似于 index(),不过是从右边开始.

mystr.rindex( str, start=0,end=len(mystr))

20 partition

把mystr以str分割成三部分,str前,str和str后

mystr.partition(str)

21 rpartition

类似于 partition()函数,不过是从右边开始.

mystr.rpartition(str)

22 splitlines

按照行分隔,返回一个包含各行作为元素的列表

mystr.splitlines()

23 isalpha

如果 mystr 所有字符都是字母 则返回 True,否则返回
False

mystr.isalpha()

24 isdigit

如果 mystr 只包含数字则返回 True 否则返回 False.

mystr.isdigit()

25 isalnum

如果 mystr 所有字符都是字母或数字则返回 True,否则返回 False

mystr.isalnum()

26 isspace

如果 mystr 中只包含空格,则返回 True,否则返回
False.

mystr.isspace()

27 join

mystr 中每个元素后面插入str,构造出一个新的字符串

mystr.join(str)

python拼接字符串

  1. 来自C语言的 % 方式:
print('%s %s' % ('hello', 'python'))
>>> hello python

%s 是一个占位符,它仅代表一段字符串,并不是拼接的实际内容。实际的拼接内容在一个单独的%号后面,放在一个元组里。
类似的占位符还有:%d(代表一个整数)、%f(代表一个浮点数)、%x(代表一个16进制数),等等。%占位符既是这种拼接方式的特点,同时也是其限制,因为每种占位符都有特定意义,实际使用起来太麻烦了。

  1. format()拼接方式
str1 = 'hello {}! My name is {}'.format('world', 'python')
print(str1)
>>>hello world! My name is puthon

str2 = 'hello {0}! My name is {1}'.format('world', 'python')
print(str2)
>>>hello world! My name is python

str3 = 'hello {name1}! My name is {name2}'.format(name1='world', name2='python')
print(str3)
>>>hello world! My name is python

这种方式使用花括号{}做占位符,在format方法中再转入实际的拼接值。
3.() 类似元组方式

str_tuple = ('hello', ' ', 'python')
str_like_tuple = ('hello' ' ' 'python')

print(str_tuple)
>>>('hello', ' ', 'python')
print(str_like_tuple)
>>>hello python

括号()内要求元素是真实字符串,不能混用变量

  1. 面向对象模板拼接
from string import Template
str = Template('${str1} ${str2}')
print(str.safe_substitute(str1='hello', str2='python'))
>>>hello python
  1. 常用的 + 号方式
str1 = 'hello'
str2 = 'python'
print(str1 + str2)
  1. join()拼接方式
str_list = ['hello', 'python']
str_join = ' '.join(str_list)
print(str_join)
>>>hello python
  1. f-string 方式
name = 'world'
myname = 'pyhton'
str = f'Hello {name}. My name is {myname}'
print(str)
>>>Hello world. My name is python

总结一下,我们前面说的“字符串拼接”,其实是从结果上理解。若从实现原理上划分的话,我们可以将这些方法划分出三种类型:

格式化类:%、format()、template

拼接类:+、()、join()

插值类:f-string

当要处理字符串列表等序列结构时,采用join()方式;拼接长度不超过20时,选用+号操作符方式;长度超过20的情况,高版本选用f-string,低版本时看情况使用format()或join()方式。

你可能感兴趣的:(Python基础篇之-Python字符串)