requirements.txt
zhconv
工作过程中,偶尔需要处理中英文简繁体的转换,这时用网上的转换接口不仅有点影响效率,而且也比较不安全。
这里推荐下zhconv来处理字符串,并且只保留中英文数字字符,以便后续操作使用。
代码如下:
import zhconv
import re
cop = re.compile("[^\u4e00-\u9fa5^a-z^A-Z^0-9]") # 匹配不是中文、大小写、数字的其他字符
string1 = '@ad&*jf繁體ad张132(www)。。。'
string1 = zhconv.convert(string1, 'zh-cn')
print(string1)
string1 = cop.sub('', string1) # 将string1中匹配到的字符替换成空字符
print(string1)
result:
@ad&*jf繁体ad张132(www)。。。
adjf繁体ad张132www
Process finished with exit code 0