python 遇到表情代码出错, 用正则表达式去掉表情代码

>>> aa = '\U0001f60a\adwkdkdkkdk'
# 这里“\U0001f60a” 这是表情的代码 带这个\
>>> import re
>>> cc = re.compile(r'\U0001f60a')
#cc 就是需要替换的代码 就是把不需要的先标记出来
>>> ff = re.sub(cc,'',aa)
#cc 是不要的‘’ 就是换成空白 aa 就是需要换的文本内容
>>> ff
'\x07dwkdkdkkdk'
#最后输出只有这个了 前2个表情都没有了

你可能感兴趣的:(爬虫)