[解决] 'gbk' codec can't decode byte 0xbb in position 53: illegal multibyte sequence

今天本人在用python读取csv文件格式数据并进行处理的过程中(如何读取方式参考另一篇短文),遇到了一个编译报错信息 'gbk' codec can't decode byte 0xbb in position 53: illegal multibyte sequence,如下图。

[解决] 'gbk' codec can't decode byte 0xbb in position 53: illegal multibyte sequence_第1张图片
图1 报错信息

通过网上搜索,我找到了一些对我来说都不适用的解决方案,这里先罗列一下。

1、加上 encoding用 utf-8 编码打开,如第10行,with open("06142222.csv", 'r',encoding = utf-8) as f: 

2、加入 ‘ignore’,表示忽略错误,如第十行,with open("06142222.csv", 'r','ignore') as f:

但是这两个方法对我来说并不适用,并且在之前的那篇短文中,这个程序是可以运行的,于是,我开始怀疑数据本身格式的问题。这里我把这个csv文件中的数据复制到notepad++中查看,果然,发现了一些异样,如下图。

[解决] 'gbk' codec can't decode byte 0xbb in position 53: illegal multibyte sequence_第2张图片
图2 csv中数据
[解决] 'gbk' codec can't decode byte 0xbb in position 53: illegal multibyte sequence_第3张图片
图3 notepad++打开数据

可以发现,在csv中看似整整齐齐的数据,在notepad++中却存在错乱的问题,由于我的数据样本不大,经过我人为的调整之后,再次运行程序,直接通过。好了,回到这个csv数据格式的问题上,为什么会出现这样的问题,我在想这可能是我人为调整过csv源数据造成的。

你可能感兴趣的:([解决] 'gbk' codec can't decode byte 0xbb in position 53: illegal multibyte sequence)