Pandas读取CSV文件的方法

Pandas读取CSV文件的方法

Panda是Python中一个非常强大的数据处理包,用来读取CSV这种格式化数据时会非常方便。

我们使用Pandas.read_csv()这个函数对CSV文件进行读取,这里附上Pandas的官方文档:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

函数定义如下:

pandas.read_csv(filepath_or_buffer, sep=’, ‘, delimiter=None, header=‘infer’, names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, skipfooter=0, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, iterator=False, chunksize=None, compression=‘infer’, thousands=None, decimal=b’.’, lineterminator=None, quotechar=’"’, quoting=0, doublequote=True, escapechar=None, comment=None, encoding=None, dialect=None, tupleize_cols=None, error_bad_lines=True, warn_bad_lines=True, delim_whitespace=False, low_memory=True, memory_map=False, float_precision=None)

看完头都要炸了,我们捡几个常用的说:

filepath_or_buffer:文件路径
sep:分隔符,默认为逗号
header:要用作列名的行数
index_col:列用作数据帧的行标签
usecols:返回列的子集
nrows:要读取的文件行数

完了上个例子

with open('address.csv','r') as csvfile:
    d = pd.read_csv('address.csv', usecols=['Age','name'],nrow=10)

读取指定的两列,读取10行

然后要注意一下,这里返回值是一个数据帧,而非我们常用的列表或者字典,不能使用d[0][0]这种方式获得数据

我们可以通过以下方法进行转化

List = d.values.tolist()

你可能感兴趣的:(Pandas读取CSV文件的方法)