Python 中的字符串类型提供了 split() 方法,用于将一个字符串按照指定的分隔符拆分成多个子字符串。例如,我们可以将一个以逗号分隔的字符串拆分成一个列表:
s = "apple,banana,pear"
print('待分割的字符串为:', s)
lst = s.split(",")
print('分割后为:', lst) # ['apple', 'banana', 'pear']
这里,split() 方法接受一个参数,即分隔符,它可以是一个字符串或一个正则表达式。如果不指定分隔符,split() 方法默认使用空格作为分隔符。
如果我们需要将一个包含多行文本的字符串拆分成多个行,可以使用字符串类型的 splitlines() 方法。例如:
s = "book\npaper\nback"
print('待分割的字符串为:', s)
lst = s.splitlines()
print('分割后为:', lst)
这里,splitlines() 方法会将字符串按照换行符拆分成多个行,并将每行作为一个字符串存储在列表中。
正则表达式是一种用于匹配和处理字符串的强大工具,它可以实现更加复杂的字符串分割操作。例如,我们可以使用正则表达式将一个以逗号和空格为分隔符的字符串拆分成一个列表:
import re
s = "face, vehicle, head hat"
print('待分割的字符串为:', s)
lst = re.split(r",\s*", s)
print('分割后为:', lst)
这里,正则表达式 ",\s*" 匹配逗号和零个或多个空格,从而实现字符串的分割。