主要是使用字符串的split()与正则的re.split()方法进行拆分。前者每次处理一种分隔符,后者一次性可以处理多个分割字符。
import sys
import re
reload(sys)
sys.setdefaultencoding('utf-8')
data_text='''
shuob1uShang,why,943586926isM1?
YEAH。SUre,iamis、now i am so boring
xianzais--hi2018-4-17,wozai shang hai jiading
say so&^me ?d-o some23thi^&ngs only for what
zhaohan only 00-//for\||you
ho[pe you\] zhao yi sun
we can 17
--*