python 4-1 如何拆分含有多种分隔符的字符串
解决方案1:
使用str.split()方法,每次处理一种分隔符号
解决方案2:
使用正则表达式re.split(),一次性拆分字符串
解决方案1:
使用str.split()方法,每次处理一种分隔符号
首先我们看一下通过str.split()如何实现,由于包含了[;,|\t
],split函数只能一次通过一个符号分割
s=’ab;;;;;cd|efg|hi,,jkl|mn\topq;rst,uvw\txyz’
def splitStr(str1,seperateStr):
res = [str1]
for splitFlag in seperateStr:
t = []
map(lambda x: t.extend(x.split(splitFlag)),res)
print "res is ",res
res = t
return res
myResult = splitStr(s,';,|\t')
print "myResult is ",myResult
myResult is ['ab', '', '', '', '', 'cd', 'efg', 'hi', '', 'jkl', 'mn', 'opq', 'rst', 'uvw', 'xyz']
通过上面的结果,发现多了几个”空的,是因为存在几个连续的;,我们可以通过下面列表解析过滤一下
myResult = [x for x in myResult if x]
myResult is ['ab', 'cd', 'efg', 'hi', 'jkl', 'mn', 'opq', 'rst', 'uvw', 'xyz']
解决方案2:
使用正则表达式re.split(),一次性拆分字符串
re.split()可以跟多个分割符参数,
myResult2 = [x for x in re.split(";|,|\||\t",s) if x ]
print "myResult2 is ",myResult2
myResult2 is ['ab', 'cd', 'efg', 'hi', 'jkl', 'mn', 'opq', 'rst', 'uvw', 'xyz']