p = pd.read_excel(io, sheet_name=0, header=0, names=None, index_col=None, usecols=None, squeeze=False,dtype=None, engine=None,converters=None, true_values=None, false_values=None,skiprows=None, nrows=None, na_values=None, parse_dates=False,date_parser=None, thousands=None, comment=None, skipfooter=0,convert_float=True, **kwds)
pandas读取后返回DataFrame类
io:文件路径,python3以上格式如:C:\\Users\\sjyyz\\file\\pd2.xls
sheet_name : 读取工作表名称,默认为0,代表第一个工作表。sheet_name=[0,'人员信息‘,Sheet4],如果读取多个工作表,则显示表格的字典。
header=(n):取哪一行作为表头或者列名,可以是多行
names=['id','name'....]:长度必须与列长一致,主要是用来修改列名或是没有列明的文件
index_col = ['id'../0,1.....]:用作索引的列
usecols = [A:C/0,1,3]:需要读取的列
squeeze=True/False: squeeze为True时,返回Series,反之返回DataFrame。
converters={'Name': str, 'Age': int} :强制规定列数据类型,pandas默认将文本类的数据读取为整型,用来保留以文本形式存储的数字。
skiprows=n/[a,b,c]:跳过特定行(前几行或者特定行a+1,b+1,c+1)
dtype={'id':str}#当python从excel读取数据是NAN时,自动会将它设置为float
import pandas as pd
books = pd.read_excel("C:\\Users\\sjyyz\\file\\books.xls",skiprows=3,usecols='c:f',dtype={'id':str})
print(books.index)
for i in books.index:
books['id'].at[i] = i+1
#当python从excel读取数据是NAN时,自动会将它设置为float,注意NAN不能强制转换成int
print(books['id'])
结果
0 NaN
1 NaN
2 NaN
3 NaN
4 NaN
5 NaN
6 NaN
7 NaN
8 NaN
9 NaN
10 NaN
11 NaN
12 NaN
13 NaN
14 NaN
15 NaN
16 NaN
17 NaN
18 NaN
19 NaN
Name: date, dtype: float64