整体一览:
pd.read_excel(io, sheet_name=0, header=0, names=None, index_col=None, usecols=None, squeeze=False, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skiprows=None, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, parse_dates=False, date_parser=None, thousands=None, comment=None, skipfooter=0, convert_float=True, mangle_dupe_cols=True)
详解:
pd.read_excel(io #文件路径,路径中如果是‘\’,记得在引号前加r,防止转义
, sheet_name=0 #读取excel文件中的指定sheet
'''
允许的类型:str, int, list, or None, default 0
默认值:0,读取工作簿中第1个sheet,
整型:读取以0为起始索引的单个sheet,
字符串:读取名为该字符串的单个sheet,
列表:读取多个sheet, ``[0, 1, "Sheet5"]``: Load first, second and sheet named "Sheet5"
None:全部sheet
'''
, header=0 #解析指定行,当做dataframe的列标签
'''
允许的类型:int, list of int, or None, default 0
None:没有列标签
list of int:组合成复合标签
'''
, names=None #所需列列名
'''
允许的类型:array-like, default None
'''
, index_col=None #解析指定列,当做dataframe的行标签
'''
允许的类型:int, list of int, default None
None:没有行标签
'''
, usecols=None #返回所需列
'''
允许的类型:int, str, list-like, or callable default None
None:返回所有列
'''
, squeeze=False #如果解析的列只有1列,则返回Series
'''
允许的类型:bool, default False
False:解析的列只有1列,则返回Dataframe
True:解析的列只有1列,则返回Series
'''
, dtype=None #设定dataframe中数据格式
'''
允许的类型:Type name or dict of column -> type, default None
字符:整个表格都转化成该字符的数据格式
字典:每个键对应的数据,转化成值所对应的格式
'''
, engine=None #解析excel的引擎,默认xlrd
'''
允许的类型:str, default None
Supported engines: "xlrd", "openpyxl", "odf", "pyxlsb", default "xlrd".
- "xlrd" supports most old/new Excel file formats.
- "openpyxl" supports newer Excel file formats.
- "odf" supports OpenDocument file formats (.odf, .ods, .odt).
- "pyxlsb" supports Binary Excel files.
'''
, converters=None #将制定列转化成制定格式
, true_values=None #制定值变为True
'''
允许的类型:list, default None
'''
, false_values=None #制定值变为False
'''
允许的类型:list, default None
'''
, skiprows=None #跳行读取
'''
int:跳过1行
list of int:跳过索引为int的行
'''
, nrows=None #读取X行
, na_values=None #补充特定值为空值
'''
允许的类型:scalar, str, list-like, or dict, default None
pandas默认以下值会被认为成空值:'', '#N/A', '#N/A N/A', '#NA', '-1.#IND', '-1.#QNAN', '-NaN', '-nan',
'1.#IND', '1.#QNAN', '', 'N/A', 'NA', 'NULL', 'NaN', 'n/a',
'nan', 'null'
'''
, keep_default_na=True #是否在读取的文件中显示空值
'''
允许的类型:bool, default True
'''
, na_filter=True #是否进行空值监测,在确定无空数据文档中,取消空值监测,会提升读取数据的效率
'''
允许的类型:bool, default True
'''
, verbose=False #标识出非数值列空值的数量
, parse_dates=False #将指定列转化成日期格式
'''
bool. If True -> try parsing the index.
'''
, date_parser=None #将字符串序列转化为日期格式的函数
, thousands=None #将带有千分位分隔符的字符串转化为数字
, comment=None #该行某字符串开始的所有内容都会被忽略,不会解析
, skipfooter=0 #从尾部开始略去解析的行数
, convert_float=True #讲浮点转化成整型
, mangle_dupe_cols=True #重复的列明将会被命名为X1、X2,如为false,则会覆盖同名数据)