先看例子:
In [1]: s = "abc,,,fefdaf,,,123fad,,fsdfa,,,"
In [2]: s.split(',')
Out[2]: ['abc', '', '', 'fefdaf', '', '', '123fad', '', 'fsdfa', '', '', '']
输出的结果中会有很多的空字符串,有时候不想要这么空字符串,该怎么处理?
方法一:列表推导式
In [3]: [x for x in s.split(',') if x]
Out[3]: ['abc', 'fefdaf', '123fad', 'fsdfa']
方法二:调用filter库函数:
In [4]: list(filter(None,s.split(',')))
Out[4]: ['abc', 'fefdaf', '123fad', 'fsdfa']
方法三:使用正则表达式:
In [6]: re.findall('[a-z0-9]+',s)
Out[6]: ['abc', 'fefdaf', '123fad', 'fsdfa']
方法三的方式最为灵活多变,可以处理很多情况,也是我最喜欢用的。
当然,也可以用字符替换的方式:
In [1]: s = "abc,,,fefdaf,,,123fad,,fsdfa,,,"
In [2]: table = str.maketrans(',',' ')
In [3]: s.translate(table).split()
Out[3]: ['abc', 'fefdaf', '123fad', 'fsdfa']
引申:
In [4]: s = "This is a (test) !"
希望可以获取()里面的分割,代码如下:
In [5]: table = str.maketrans('()',' ')
In [6]: s.translate(table).split()
Out[6]: ['This', 'is', 'a', 'test', '!']
欢迎关注本人微信公众号,会分享更多的干货: