pandas导入excel文件内容不一致的问题

当excel文件里面含有多个表时,用pandas导入会出现生成的dateframe表不一样。

  • 错误
import pandas as pd
df=pd.read_xlsx('文件名.xlsx')

整体代码

pd.read_excel(path, sheet_name=0, header=0, names=None, index_col=None, 
              usecols=None, squeeze=False,dtype=None, engine=None, 
              converters=None, true_values=None, false_values=None, 
              skiprows=None, nrows=None, na_values=None, parse_dates=False, 
              date_parser=None, thousands=None, comment=None, skipfooter=0, 
              convert_float=True, **kwds)
  • sheet_name --> 读取 工作表(sheet)名称
  • sheet_name:None代表读取所有的sheet;
#sheet_name=1代表取出第2个表
df=pd.read_excel(path,sheet_name=1)
  • header --> 指定前几行作为列名(指定数据表的表头,默认值为0)
  • names --> 自定义列名(但是names的长度必须和Excel列长度必须一致)
df=pd.read_excel(path,sheet_name=1,
					names=['a','b','c'])
  • usecols --> 读取指定的列
#usecols可避免读取所有数据
df=pd.read_excel(path,sheet_name=1,
					usecols=[0,1,2] #读取第1,2,3列数据

你可能感兴趣的:(pandas,python,数据挖掘,数据分析)