pd.read_csv读文件报错UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xe7 in position 54: illegal mult

pd.read_csv读文件报错编码问题

  • 报错描述
  • 报错原因
  • 解决方案
  • 参考

报错描述

使用pandas读取CSV文件时,突然出现编码错误的报错,更改为GBK,UTF-8和其他编码都无效。网上很多的报错都是直接用open方法读的,并不适用。具体报错如下:

  File "pandas\_libs\parsers.pyx", line 529, in pandas._libs.parsers.TextReader.__cinit__
  File "pandas\_libs\parsers.pyx", line 720, in pandas._libs.parsers.TextReader._get_header
  File "pandas\_libs\parsers.pyx", line 916, in pandas._libs.parsers.TextReader._tokenize_rows
  File "pandas\_libs\parsers.pyx", line 2063, in pandas._libs.parsers.raise_parser_error
UnicodeDecodeError: 'gbk' codec can't decode byte 0xe7 in position 54: illegal multibyte sequence

报错原因

使用Excel修改文件时改变了编码的方式。用记事本打开可以发现编码已经改了。
pd.read_csv读文件报错UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xe7 in position 54: illegal mult_第1张图片

解决方案

将文件用Excel另存文件,并改变编码为utf-8即可。如果还是不行,可能是由于windows与unix文件格式文件格式的问题,见上图张红圈左边部分,需要进行转换,转换方式参考该文章。

参考

1. https://blog.csdn.net/IT_SoftEngineer/article/details/107844556
2. https://blog.csdn.net/ydyang1126/article/details/65437694?
3. https://blog.csdn.net/duanlianvip/article/details/79324997?utm_source=blogxgwz8

你可能感兴趣的:(Python,python,csv)