UnicodeDecodeError: 'utf-8' codec can't decode byte 0x80 in position

用python写的代码,大致是以下内容出错

import os

# 使用os获取mypath文件夹内的文件
dir = os.listdir("mypath") # dir=[file1,file2,file3]

for file in dir:
    with open(file,"rt") as f  # “rt”表示以文本模式读取文件,默认是utf-8编码
        # do something

在读取文件内容是报错UnicodeDecodeError: 'utf-8' codec can't decode byte 0x80 in position,Unicode解码错误,‘utf-8’无法对字节类型进行解码。但是文件夹里都是文本类型文件,应该不会出错。折腾了好多遍,发现其实是mac os系统会在每个文件夹下自动创建.DS_Store文件,这个文件是记录文件夹样式的隐藏文件,把这个隐藏文件删掉就好了。

 

但是UnicodeDecodeError: 'utf-8' codec can't decode byte 0x80 in position报错的实际原因的确是解码错误。.DS_Store文件不是文本文件,所以用“rt”模式读取就会报这个错。

类似的错误在stack overflow上也有,看这里'utf-8' codec can't decode byte 0x80

stack overflow上这个,是因为打开的应该是个二进制文件,不能用open(file,'r'),‘r’会默认使用文本模式,而应该使用open(file,'rb').

'rb'代表读取二进制文件。

 

你可能感兴趣的:(bug)