pandas:read_csv()方法编码报错:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xa1 in position xxx

csv文件原本以utf-8编码形式保存,但是中间我用wps打开编辑了,然后再用pandas读取发现报错:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa1 in position 59: invalid start byte

之后我 设置 read_csv() encoding='gbk',发现又报错了:

UnicodeDecodeError: 'gbk' codec can't decode byte 0xa1 in position 51329: invalid start byte

之后我尝试了设置  encoding='utf-8-sig'   encoding = ‘gb2312’   encoding='gb18030'  encoding="ISO-8859-1" 等等,发现还是报错UnicodeDecodeError

我又在文件顶部声明:

# -*-coding:utf-8-*-

声明文件为utf-8编码格式,还是不行,最后用vscode打开该csv文件从新以utf-8编码保存,Bug解决。这个Bug是由于多个软件(我用了wps)先后编辑导致编码混乱,重新用编辑器(vscode、pycharm等等)以uft8或者gbk编码从新保存就行了。

pandas:read_csv()方法编码报错:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xa1 in position xxx_第1张图片

pandas:read_csv()方法编码报错:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xa1 in position xxx_第2张图片 

 

你可能感兴趣的:(#,Bug,pandas)