python 用正则表达式去除特殊字符的两种方法

s = '*\/:?"<>|'     #这9个字符在Windows系统下是不可以出现在文件名中的
str1 = '\巴拉<1"!11【】>1*hgn/p:?|'    #样例

1.提取感兴趣(想要)的字符

a = re.findall('[\u4e00-\u9fa5a-zA-Z0-9]+',str1,re.S)   #只要字符串中的中文,字母,数字
a = "".join(a)
print(a)

结果如下:

巴拉1111hgnp

2.只去除不想要的,比如只去除不能作为文件名的字符

a = re.findall(r'[^\*"/:?\\|<>]',str1,re.S) 
a = "".join(a)
print(a)

结果如下:

巴拉1!11【】1hgnp

你可能感兴趣的:(Python)