python3字符处理——简繁体转换,只保留中文字母数字

requirements.txt

zhconv

 

工作过程中,偶尔需要处理中英文简繁体的转换,这时用网上的转换接口不仅有点影响效率,而且也比较不安全。

这里推荐下zhconv来处理字符串,并且只保留中英文数字字符,以便后续操作使用。

代码如下:

import zhconv
import re

cop = re.compile("[^\u4e00-\u9fa5^a-z^A-Z^0-9]")  # 匹配不是中文、大小写、数字的其他字符
string1 = '@ad&*jf繁體ad张132(www)。。。'
string1 = zhconv.convert(string1, 'zh-cn')
print(string1)
string1 = cop.sub('', string1)  # 将string1中匹配到的字符替换成空字符
print(string1)

result:

@ad&*jf繁体ad张132(www)。。。
adjf繁体ad张132www
Process finished with exit code 0

 

你可能感兴趣的:(python)