pd.read_csv可读取 csv 格式文档到DataFrame
主要参数:
data = pd.read_csv('./result.csv',sep=',')
data = pd.read_csv('./result.csv',header=None,prefix='XX')
data = pd.read_csv('./result.csv',nrows = 4)
- 相对路径:以mac为例
import os
#获取当前工作路径
os.getcwd()
data = pd.read_csv('./result.csv',sep=',')
#下层Data文件夹中
data = pd.read_csv('./Data/result.csv',sep=',')
- sep:如果不指定参数,则会尝试使用逗号分隔。分隔符长于一个字符并且不是‘\s+’,将使用python的语法分析器。并且忽略数据中的逗号。正则表达式例子:’\r\t’。
- header: 指定行数用来作为列名,数据开始行数。如果文件中没有列名,则默认为0【第一行数据】,否则设置为None。如果明确设定 header = 0 就会替换掉原来存在列名。header参数可以是一个list例如:[0,1,3]。注意:如果skip_blank_lines=True 那么header参数忽略注释行和空行,所以header=0表示第一行数据而不是文件的第一行
- skip_blank_lines:boolean, default True: 如果为True,则跳过空行;否则记为NaN。
- prefix:希望达到列名称有规律的情况下,将header设定为None,给列添加前缀。例如:添加prefix= ‘X’ 使得列名称成为 X0, X1, …
- nrows: 需要读取的行数(从文件头开始算起)
详情见http://pandas.pydata.org/pandas-docs/stable/io.html