【Python3】pandas.read_csv详解

Python数据分析,一般第一步就是读取数据,这篇详解pandas读取数据read_csv。

  1. read_csv函数参数
    几个常用的参数包括path、sep、header、index_col、names、skiprows、na_values、nrows、skip_footer、encoding。下面主要对这几个参数解释 。【Python3】pandas.read_csv详解_第1张图片
    【Python3】pandas.read_csv详解_第2张图片

  2. 读取文件,必要参数path给出文件路径,encoding设置csv文件编码格式,默认为“utf-8”,这里文件格式为“gbk”。
    【Python3】pandas.read_csv详解_第3张图片

  3. sep给出文件分隔符,默认为‘,’,这里文件分隔符也是‘,’,如果分隔符为其他符号,可以用此参数。
    在这里插入图片描述

  4. header默认为0,表示第0行为标题,可以给定None表示文件无标题,同时在header为None时可以给定参数names来给定列名。
    【Python3】pandas.read_csv详解_第4张图片
    【Python3】pandas.read_csv详解_第5张图片

  5. skiprows可以选择忽略前面的行数,通过下图可以对比使用skiprows前后的shape。
    【Python3】pandas.read_csv详解_第6张图片

  6. na_values可以用来替换NA值,当然这里我的数据没有NA,如果有的话可以用这个参数。

  7. nrows从文件开始时选取需要读取的行数。可以看到使用nrows=3之后,数据只有前三行。(df.head()默认读取前五行)
    【Python3】pandas.read_csv详解_第7张图片

  8. skipfooter从文件末尾选择需要忽略的行数。忽略了28行之后,只剩下前五行了。
    【Python3】pandas.read_csv详解_第8张图片

我们下次再见,如果还有下次的话!!!
欢迎关注微信公众号:516数据工作室
【Python3】pandas.read_csv详解_第9张图片

你可能感兴趣的:(Python)