2022-11-12《Python正则-匹配中文引号省略号》

一、问题

当对中文文字进行替换时,实测发现,逗号、句号、问号、感叹号、分号等常规符号可直接通过str.replace()进行替换,但单引号、双引号、省略号替换失败,需通过正则匹配实现,代码如二:


二、代码

import re


content = """

他走进大厅,坐在椅中,心中只是想:“哥哥临死之时曾说,他有个仇家,是个道姑,名叫李莫愁,外号‘赤练仙子’,武功既高,行事又是心狠手辣……”

"""

re_pattern_01 = re.compile(r'[\u201c\u201d]')  #  匹配中文双引号

re_pattern_02 = re.compile(r'[\u2018\u2019]')  #  匹配中文单引号

re_pattern_03 = re.compile(r'[\u2026]')  #  匹配中文省略号

content = re_pattern_01.sub('', content)  #  将中文双引号替换掉

content = re_pattern_02.sub('', content)  #  将中文单引号替换掉

content = re_pattern_03.sub('', content)  #  将中文省略号替换掉


三、总结

\u201c\u201d实则为中文符号对应的ascii码,可通过print(ascii('中文符号'))获得字符对应的ascii码值

你可能感兴趣的:(2022-11-12《Python正则-匹配中文引号省略号》)