read_excel函数能够读取的格式包含:xls, xlsx, xlsm, xlsb, odf, ods 和 odt 文件扩展名。
支持读取单一sheet或几个sheet。
pandas.read_excel(
io,
sheet_name=0,
header=0,
names=None,
index_col=None,
usecols=None,
squeeze=None,
dtype=None,
engine=None,
converters=None,
true_values=None,
false_values=None,
skiprows=None,
nrows=None,
na_values=None,
keep_default_na=True,
na_filter=True,
verbose=False,
parse_dates=False,
date_parser=None,
thousands=None,
decimal='.',
comment=None,
skipfooter=0,
convert_float=None,
mangle_dupe_cols=True,
storage_options=None
)
文件路径
import pandas as pd
pd.read_excel('tst.xlsx')
sheet_name类型 | 输出结果 |
数字 | |
字符串 | |
列表 |
自定义表头的名称,此时需要传递数组参数
待解析的列,支持 int, str, list-like, or callable ,默认是 None,表示解析全部的列。
指定列属性的字段类型。
eg:{‘a’: np.float64, ‘b’: np.int32};默认为None,也就是不改变数据类型
对指定列进行指定函数的处理,传入参数为列名与函数组成的字典
跳过指定的行
指定读取的行数
指定列的某些特定值为NaN
是否导入空值,默认是导入,识别为NaN
和写csv很类似
import pandas as pd
data=[{1:'a',2:'b'},
{1:'c',4:'d'}]
f1=pd.DataFrame(data)
f1.to_excel('t.xlsx',sheet_name='1')
import pandas as pd
data=[{1:'a',2:'b'},
{1:'c',4:'d'}]
f1=pd.DataFrame(data)
f1.to_excel('t.xlsx',sheet_name='1',index=None)