读入csv文件的数据时,出现编码错误问题
filename1 = "1.csv"
csv_data1 = pd.read_csv(filename1, header=None, error_bad_lines=False)
csv_data1 = np.array(csv_data1, dtype=str)
n=np.size(csv_data1,0)
m=np.size(csv_data1,1)
print (n)
print (m)
print (csv_data1)
或
with open('1.csv', 'r', encoding='utf-8') as file_obj:
# 1.创建reader对象
reader = csv.reader(file_obj)
# 2.遍历进行读取数据
for r in reader:
print(r)
UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xd6 in position 2: invalid continuation byte
因csv中出现不可解码的符号
此时,需要用txt将csv打开,另存为csv,编码选择utf-8
即可正常运行
另:
查找资料时另有解决方案:
使用"ANSI"格式读取CSV文件
将你的程序改为:pd.read_csv(“1.csv”,"encoding=“ANSI”)
注意:ANSI只是windows系统的编码格式,mac系统没有这个编码格式,我们在使用kaggle等免费gpu时,他们不支持这种格式