使用pandas读取CSV文件时,突然出现编码错误的报错,更改为GBK,UTF-8和其他编码都无效。网上很多的报错都是直接用open方法读的,并不适用。具体报错如下:
File "pandas\_libs\parsers.pyx", line 529, in pandas._libs.parsers.TextReader.__cinit__
File "pandas\_libs\parsers.pyx", line 720, in pandas._libs.parsers.TextReader._get_header
File "pandas\_libs\parsers.pyx", line 916, in pandas._libs.parsers.TextReader._tokenize_rows
File "pandas\_libs\parsers.pyx", line 2063, in pandas._libs.parsers.raise_parser_error
UnicodeDecodeError: 'gbk' codec can't decode byte 0xe7 in position 54: illegal multibyte sequence
使用Excel修改文件时改变了编码的方式。用记事本打开可以发现编码已经改了。
将文件用Excel另存文件,并改变编码为utf-8即可。如果还是不行,可能是由于windows与unix文件格式文件格式的问题,见上图张红圈左边部分,需要进行转换,转换方式参考该文章。
1. https://blog.csdn.net/IT_SoftEngineer/article/details/107844556
2. https://blog.csdn.net/ydyang1126/article/details/65437694?
3. https://blog.csdn.net/duanlianvip/article/details/79324997?utm_source=blogxgwz8