pandas读取csv的一些杂项

usecols参数接收一个列表,指定读取这些列,优先级高
comment参数接收一个注释的开头指示,标识这一行是注释,不读取
skip_blank_lines接收一个布尔值,决定是否跳过空白行
index_col接收一个数值,用来指定索引列。当值为False时,代表使用默认的索引

parse_dates=True : 尝试解析index为日期格式;
parse_dates=[0,1,2,3,4] : 尝试解析0,1,2,3,4列为时间格式;
parse_dates=[[’考试日期’,‘考试时间’]] :传入多列名,尝试将其解析并且拼接起来,parse_dates[[0,1,2]]也有同样的效果;
parse_dates={’考试安排时间’:[‘考试日期’,‘考试时间’]},将会尝试解析日期和时间拼接起来,并将列名重置为‘考试安排时间’;
注意:重置后列名不能和原列名重复

na_values=[5]代表5和5.0这些将会被视为nan值
np.inf (positive infinity),正无穷 and -inf as -np.inf (negative infinity)负无穷
true_values=[“Yes”], false_values=[“No”],自定义布尔值
on_bad_lines='skip’用来忽略发生错误的行
chunksize和iterator都用于控制文件切块

你可能感兴趣的:(pandas)