pd.read_excel读取excel文件的行、列相关参数

目录

官网:https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_excel.html

pd.read_excel(io,            # 文件路径
              sheetname=0,   # 用于选取sheet表,默认是选取第一个sheet,即参数为0
              header=0,      # 表头,指定某一行作为列标签,默认是第一行,即参数为0
              skiprows=None, # 跳过行,默认是无
              index_col=None,# 指定用某一列作为行索引,默认是无,即没有
              usecols=None,  # 读取某些列,默认是无,表示所有的列都会被读取
              names=None,    
              arse_cols=None,
              date_parser=None,
              na_values=None,
              thousands=None, 
              convert_float=True,
              has_index_names=None,
              converters=None,
              dtype=None,
              true_values=None,
              false_values=None,
              engine=None,
              squeeze=False,
              **kwds)

在使用这个命令时经常对于其中的参数有很多迷惑的地方,整理后,总结如下:

  • header=0, 表头,指定某一行作为列标签,默认是第一行,即参数为0
  • skiprows=None, 跳过行,默认是无
  • index_col=None, 指定用某一列作为行索引,默认是无,即没有
  • usecols=None, 读取某些列,默认是无,表示所有的列都会被读取

这四行说明:

  1. 默认情况下,pd框架中的属性values值是读取所有列,但缺少第一行的数据,因为第一行被当作表头处理了
  2. skiprows=0skiprows=None是一样的结果,因为行计数是包含表头的
  3. usecols=range()可以指定读取某列到某列,比如跳过第一列 usecols=range(1,n)

你可能感兴趣的:(python,pandas)