pd.read_excel(io, sheetname=0,header=0,skiprows=None,index_col=None,names=None,
arse_cols=None,date_parser=None,na_values=None,thousands=None,
convert_float=True,has_index_names=None,converters=None,dtype=None,
true_values=None,false_values=None,engine=None,squeeze=False,**kwds)
常用参数解析:
import numpy as np
import pandas as pd
from pandas import DataFrame
#定义路径IO
IO="C:\\Users\\zhouy_000\\Desktop\\python_study\\20190416\\test.xlsx"
#读取excel文件
sheet_a=pd.read_excel(io=IO)
#此处由于sheetname默认是0,所以返回第一个表
print(sheet_a)
"""
姓名 年龄 出生日 爱好 关系
0 小王 23 1991-10-02 足球 朋友
1 小丽 23 1992-11-02 篮球 NaN
2 小黑 25 1991-10-18 游泳 同学
3 小白 21 1989-09-09 游戏 NaN
4 小红 25 1990-08-07 看剧 NaN
5 小米 24 1991-12-12 足球 NaN
6 大锤 26 1988-09-09 看剧 个人
"""
sheet_list=pd.read_excel(io=IO,sheet_name=[0,1])
print(type(sheet_list))
#
print(sheet_list[1])
"""
A B C
0 animal balance city
1 100 90 80
"""
print(sheet_list[0].columns)
#Index(['姓名', '年龄', '出生日', '爱好', '关系'], dtype='object')
print(sheet_list[0].index)
#RangeIndex(start=0, stop=7, step=1)
print(sheet_list[0].values)
"""
[['小王' 23 Timestamp('1991-10-02 00:00:00') '足球' '朋友']
['小丽' 23 Timestamp('1992-11-02 00:00:00') '篮球' nan]
['小黑' 25 Timestamp('1991-10-18 00:00:00') '游泳' '同学']
['小白' 21 Timestamp('1989-09-09 00:00:00') '游戏' nan]
['小红' 25 Timestamp('1990-08-07 00:00:00') '看剧' nan]
['小米' 24 Timestamp('1991-12-12 00:00:00') '足球' nan]
['大锤' 26 Timestamp('1988-09-09 00:00:00') '看剧' '个人']]
"""
#同样可以根据表头名称或者表的位置读取该表的数据
sheet_b=pd.read_excel(io=IO,sheet_name="def",header=0)
print(sheet_b)
"""
A B C
0 animal balance city
1 100 90 80
"""
sheet_b=pd.read_excel(io=IO,sheet_name="def",header=None)
print(sheet_b)
"""
0 1 2
0 A B C
1 animal balance city
2 100 90 80
"""
sheet_a=pd.read_excel(io=IO,sheet_name="abc",header=0)
print(sheet_a)
print(len(sheet_a))
"""
姓名 年龄 出生日 爱好 关系
0 小王 23 1991-10-02 足球 朋友
1 小丽 23 1992-11-02 篮球 NaN
2 小黑 25 1991-10-18 游泳 同学
3 小白 21 1989-09-09 游戏 NaN
4 小红 25 1990-08-07 看剧 NaN
5 小米 24 1991-12-12 足球 NaN
6 大锤 26 1988-09-09 看剧 个人
7
"""
sheet_b=pd.read_excel(io=IO,sheet_name="abc",header=0,skiprows=1,skipfooter=2)
print(sheet_b)
print(len(sheet_b))
"""
小王 23 1991-10-02 00:00:00 足球 朋友
0 小丽 23 1992-11-02 篮球 NaN
1 小黑 25 1991-10-18 游泳 同学
2 小白 21 1989-09-09 游戏 NaN
3 小红 25 1990-08-07 看剧 NaN
4
"""
sheet_a=pd.read_excel(io=IO,sheet_name="abc",header=0,index_col=0,names=["a","b","c","d","e"])
print(sheet_a)
"""
b c d e
a
小王 23 1991-10-02 足球 朋友
小丽 23 1992-11-02 篮球 NaN
小黑 25 1991-10-18 游泳 同学
小白 21 1989-09-09 游戏 NaN
小红 25 1990-08-07 看剧 NaN
小米 24 1991-12-12 足球 NaN
大锤 26 1988-09-09 看剧 个人
"""
index_col类似set_index,names作用类似修改列名。
参考:https://blog.csdn.net/brucewong0516/article/details/79096633