python之导入数据集

csv文件

  1. 导入numpy和pandas库
#导入numpy和pandas库
import numpy as np
import pandas as pd
  1. 从本地文件中载入数据
    2.1.相对路径
#载入数据
#1.相对路径
df = pd.read_csv('train.csv')

【提示】相对路径载入报错时,尝试使用os.getcwd()查看当前工作目录。

2.2.绝对路径

#2.绝对路径
#在|前多加一个\;使用engine='python'打开路径中含有中文的文件
df = pd.read_csv('E:\\python_pycharm _file\\数据分析\\study in datawhale\\train.csv', engine='python')
#文件路径前加上 r,取消\的特殊性;使用open函数打开路径中含有中文的文件
df = pd.read_csv(open(r'E:\python_pycharm _file\数据分析\study in datawhale\train.csv'))

2.3 报错:OSError: Initializing from file failed

df = pd.read_csv('E:\\python_pycharm _file\\数据分析\\study in datawhale\\train.csv')

解决方案:如2.2
错误原因:python3中, 调用pandas的read_csv()方法时,默认使用C engine作为parser engine,而当文件名中含有中文的时候,用C engine在部分情况下就会出错。所以在调用read_csv()方法时指定engine为python就可以解决问题了。或者不使用中文名。
参考:https://blog.csdn.net/qq_35318838/article/details/80564938

小结:

1.在文件路径使用 \:在 \ 前多加一个\ ;或者 在文件路径前加上 r
2.使用open函数打开路径中含有中文的文件;或者 使用engine=‘python’。

你可能感兴趣的:(python新手,数据分析,python,数据分析,csv)