在字符串中出现反斜杠\
,通常会被识别为转义字符,如\n
会被识别为换行,
如果直接将含有反斜杠的字符串进行保存,可能会造成因为编码问题导致文件保存失败
a = '\ud83d'
如果对上述字符串直接保存为txt文件,那么无论使用何种编码,都会报编码失败的错误
如果是将该字符串进行保存,有一个直接方式,即告诉python该字符串中将反斜杠作为字符进行识别,而非转义字符。解决方法有两种方式:
方式一:通过添加转义字符
a = '\\ud83d'
方式二:通过对字符串进行标注
a = r'\ud83d'
这两种方式都可以使得字符串能够顺利保存。
但是问题来了,如果这个字符串是从爬虫程序中获得的,那么要怎么处理呢?我们无法直接添加\
,也通过r
对字符串进行标注。
通过python内置方法repr()
对字符串进行识别
a = '\ud83d'
print(repr(a))
对于repr()`的介绍,可以移步菜鸟教程的讲解(链接地址:https://www.runoob.com/python/python-func-repr.html)