python读取csv文件编码报错:UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xca in position 184776

文章目录

  • 问题描述
  • 解决方法
  • 参考博客

问题描述

在使用pandas的read_csv读取csv文件时会报读取的错误

  • 读取代码
import pandas as pd
file_content = pd.read_csv(“文件名”, encoding='utf-8')
print(file_content)
  • 报错信息be like:
    • 'utf-8' codec can't decode byte 0xca in position 184776: invalid continuation byte
    • UnicodeDecodeError: 'gbk' codec can't decode byte 0xca in position 184776: illegal multibyte sequence

解决方法

更换编码格式!!!

可尝试的编码格式 utf-8, gbk, gb2312, gb18030, ISO-8859-1, ansi总有一个合适。

最后我是使用 ISO-8859-1这个编码通过的

参考博客

原理请参考:https://blog.csdn.net/qq_37383582/article/details/115422308
编码格式参考:https://blog.51cto.com/u_16099242/6483312

你可能感兴趣的:(python,开发语言)