Python字符串中的文件路径

在windows上使用Python时,经常会被文件路径报出的错误搞蒙

第一种错误

比如open('C:\Users\Administrator\Desktop\test.doc').read()就会报

SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 4-5: truncated \UXXXXXXXX escape

由于’\U’是Python中32位的十六进制数值的开始,例如’\U012F3005’(32位即8个十六进制数字),而路径中’U’后面是’s’,显然是错误的,就报了语法错误:“unicode转义编解码器无法解码位置4-5的字节:截短了的 \UXXXXXXXX 转义”,这里就提示了’X’应该有8个。

第二种错误

现在我改写成’\U’,其他不变,并没有顺利的执行,接着出现这个错误:

OSError: [Errno 22] Invalid argument: 'C:\\Users\\Administrator\\Desktop\test.doc'

首先可以看到,系统很贴心的自动把不是转义字符的’\A’和’\D’多加了个’\’;其次我注意到,’\t’没有改写,Python把它识别成了’\t’水平制表符,系统没办法识别这个奇怪的路径,只好报错

解决办法

常见出现这些错误的原因就是转义字符’\’的存在,Python遇到转义字符会自动转义。解决方法有这么几种:

  1. 简单粗暴法:所有的’\’换成’/’,马上搞定
  2. 对仗工整法:所有的’\’换成’\\’,这么做Python会将所有的’\’识别为普通字符,不管后面跟什么都不会看做转义
  3. 清晰明了法:将路径字符串写成r’ ‘,如r’C:\Users\Administrator\Desktop\test.doc’,告诉Python,引号里的东西都是字符串,不转义
  4. 对症下药法:遇到会被Python识别成转义字符的,就把’\’换成’\\’;具体有哪些转义字符,可移步python转义字符,比如上面的例子,写成open('C:\\Users\Administrator\Desktop\\test.doc').read()就OK了,只有第一个和最后一个需要多写一个’\’

你可能感兴趣的:(技术文档)