pandas 读取csv文件报错 ‘utf-8‘ codec can‘t decode byte 0xe3 in position 15: invalid co

这个错误通常是由于读取的 CSV 文件采用了不同的编码方式,而 pandas 默认使用 UTF-8 编码进行解码。当文件中包含无法在 UTF-8 编码中表示的字符时,就会报出 UnicodeDecodeError 错误。

pandas 读取csv文件报错 ‘utf-8‘ codec can‘t decode byte 0xe3 in position 15: invalid co_第1张图片

可以尝试以下方法:

1.指定正确的编码方式:如果你知道文件的编码方式,可以在读取 CSV 文件时使用 encoding 参数来指定编码方式。例如,如果文件采用 GBK 编码,可以尝试使用 encoding='gbk'

import pandas as pd

df = pd.read_csv('filename.csv', encoding='gbk')

2.尝试不同的编码方式:如果你不确定文件的实际编码方式,可以尝试其他常用编码方式,如 latin1 或 utf-16

import pandas as pd

df = pd.read_csv('filename.csv', encoding='latin1')

3.使用错误处理模式:如果上述方法都无法解决问题,你可以尝试使用错误处理模式来处理无法解码的字符。常用的错误处理模式有 'ignore''replace' 和 'backslashreplace'。你可以根据需要调整错误

import pandas as pd

df = pd.read_csv('filename.csv', encoding='utf-8', errors='ignore')

处理模式。

你可能感兴趣的:(pandas)