pandas读取excel文件 pandas.read_excel参数详解

pandas.read_excel(iosheet_name=0header=0names=Noneindex_col=Noneusecols=Nonesqueeze=Falsedtype=Noneengine=Noneconverters=Nonetrue_values=Nonefalse_values=Noneskiprows=Nonenrows=Nonena_values=Nonekeep_default_na=Truena_filter=Trueverbose=Falseparse_dates=Falsedate_parser=Nonethousands=Nonecomment=Noneskipfooter=0convert_float=Truemangle_dupe_cols=Truestorage_options=None)

  1. io:文件路径,可以是绝对路径或者相对路径
  2. sheet_name:指定读取的sheet名。可以是数字,sheet名,以列表形式表现的sheet名
    1. 在未指定的情况下默认为0,即读取第一个sheet,
    2. sheet_name = 1,读取第二个sheet
    3. sheet_name = "主营首版",读取名为主营首版的sheet
    4. sheet_name = [0,1,'主营首版'],同时读取列表中的sheet
    5. sheet_name = None,读取所有的sheet
  3. header:指定标题行
    1. 不指定默认第一行为标题行
    2. header = 1 ,从第2行开始读取数据,并且将第2行设置为标题行。
    3. header = [0,1] ,第一行和第二行为标题行
    4. header = None,没有标题行,所有都是数据
  4. names:在header=None的前提下,补充列名
    1. pd.read_excel(filename,sheet_name =1,header =None,names=[1,2,3,4,5,6,7,8,9,10,11,12,13]) # names元素的个数必须和dataframe的列数一致。
  5. index_col:用于指定索引
    1. 默认为None,即索引默认为0开始的数字
    2. index_col = 0,将第一列设置为索引
    3. index_col=[0,1],将第一列和第二列设置为索引,其余列为数据
    4. header 如果为1,则第一行数据就会被抛弃,index_col如果为1,第一列的数据会自动后移和其他数据合并在一起,不会被抛弃
  6. usecols:用于指定读取的列
    1. usecols = [1,2,3],读取第2-4列
    2. usecols = None,读取所有列
    3. 其他形式的写法验证都不通过
  7. squeeze:如果源数据数据或者读取的数据只有一列,squeeze = False时读取的结果是*行1列的dataframe结构,如果squeeze = True时读取的结果是一个Series结构。
  8. converters={"可滚动收入":lambda x: x/100,"收入":lambda x: x/100} # 将可滚动收入和收入的数值都除以100
  9. skiprows:省略指定行数的数据,从第一行开始
  10. skipfooter:省略指定行数的数据,是从尾部数的行开始。

 

你可能感兴趣的:(Python,python,pandas)